社会网络海量数据公开源
2013-03-25 10:43 海量数据 公开源

http://snap.stanford.edu/data/#amazon

这个地方公开了很多大规模网络的数据。

http://www.cise.ufl.edu/research/sparse/matrices/SNAP/

从这里可以看看从几万到几百万节点的网络大概长什么样。事实上,

它们的模样大同小异,就好像一滴颜料的滴溅,又好比是一颗蒲公英或者一粒真菌。

令人浮想联翩。几百万互联网用户的交互,所谓的“海量数据”,最后形成的结构,宛如宇宙间一颗漫不经心的浮尘。

一沙一世界,一花一天堂。

点评:东方隐

正如计算士所说,这些网络大同小异,然而这未必是好事。说明虽然网络动力学是当代复杂性研究的主流,对于一些关键问题仍然没有实质性的解释,这包括:

1、网络的表示,除了把网络照样画出来,是否存在傅立叶变换这样抽取网络性质的数学工具?除了连接度、平均距离这些唯象描述之外,有没有更加抽象的网络性质标志?

2、现在的网络好像要么就是小世界,要么就是随机网络,这就像用黑白两色去看世界一样,忽略了太多的重要内涵,因此一切网络,从Internet到病毒传播,画出来都差不多,但是它们的实质肯定是不同的,貌似“差不多”意味着对于不同网络的真正区别,我们还了解极少。网络和网络之间,到底有什么区别?

3、在一个网络生长发展的过程中间,它的不变量是什么?除了维度还有没有更好的刻画网络性质的签名式标志?

4、从动力学角度说,网络存在之意义究竟为何?对于一个具体的网络,已知了限定条件,能否用物理量的优化直接计算得到这个网络的参数?

5、知道了一个网络的参数,我们能否用这些参数来做一些日常的预测?比如你在Alexa上查询某一家公司网站的访问统计,或者对某一种产品的查询,结合你对于网络结构的知识,你能否对于这家公司的股价或者这种产品的行情做出某种估计?这种估计应该是运用真正科学方法的,而不是单纯的“访问上升说明关注的人多,关注的人多表示股价可能上升。”

这样的问题可以提很多,不知道近来网络研究是否逐渐接近了可以回答这些问题的阶段。

本文作者 计算士 原文请点这里