【复杂性科学】之网络科学——更多资源,课程更新在
资源,名师讲座课程简介:
【复杂性科学】之网络科学
一、导论
相互连接引致的脆弱性
我们以讲一个故事或者动机的形式开始我们的课程。在这样的情景下,我们来讲讲由于互联性导致的脆弱性。我指的是什么呢?我们都知道网络,对于我们而言非常非常重要,因为它们能把不同的东西联系起来。课堂上,我们会见到许多例子。一个好的例子是电网。回想电网在几百年前才刚刚使用的时候,每一座城市都有它自己的发电机,以及自己局部的电力系统,但是那个时候人们意识到,当电产生自纽约,而且纽约不需要用电时,波士顿可以使用它,从经济上来讲,把不同的城市、不同的电网相互联系起来是很有用处的。然后国家电网就产生了。
现在问题是:好消息是国家电网提供了一个分享资源的机会,在这种情况下,指分享电力的机会。坏消息是它也会产生问题和造成隐患。有一个例子能够充分证明这一点,那就是2003年8月15日,发生在美国的一次大停电。如果你看一看下面这两张卫星图像,你可以看到右边那一张图,与左边的图不处在同一天,右边比左边的图晚了一天的时间。右边的电比左边的电要少得多。这座城市的大部分,与美国这部分地区一样,完全没有电。其原因是这一次大范围的停电,持续大约23秒时间,导致了美国东部的大部分地区和加拿大南部都停电了。2003年的这一次大停电,就是一个典型的例子,我们称之为级联性失效。这个时候,网络就是一个传输系统,局部的失效,不是仅仅影响那片地区而已,其影响会扩散到网络的其余部分,影响其它地区。所以,能够提供经济高效电力的网络,使我们能够把很多电力输送出去,同时它又造成了这样一种情况,那就是其隐患、问题和错误也输送出去了。
所以问题当然就是,这种现象仅仅存在于电网吗?当然不是,大规模的经济危机,如2008年的经济危机,又一次证明了这样的级联性失效。在银行网络里,钱也是流动的,所以当某些糟糕的情况发生时,钱就停止了流动,导致公司破产、崩溃等等。而在有一些例子中,这样的级联性失效,实际上能帮助我们。例如想要阻止恐怖主义,常常先从切断支持恐怖主义的经济来源开始,进而导致该组织的全面瘫痪。现在从这个故事里,我们可以学到几样东西:第一,若想知道一个电力系统是稳定还是容易崩溃,我们必须首先知道这个网络结构的作用是什么,即这个网络看起来是什么样子的,它是如何影响这个系统的稳定性的。第二,我们还必须开发定量工具,超出这个网络结构,知道在这个网络以外发生了什么。第三,我们还应该看到,即使这些故障看起来是随机的,似乎是偶然发生的,但事实上,级联性失效常常遵循着非常严格的规律和机制。我们可以使用网络科学的工具来说明。
网络是复杂系统的核心
所以在这接下来的时间里,我们会讲到这个网络所具有的规律、机制和特征,它们在控制着这些网络的运行。这对于我们,以及我们的生活而言意味着什么?我们为什么要关心网络?我们关心网络的其中一个原因是,网络是许多复杂系统的中心。复杂指的是什么?如果你看看字典对这个词复杂的定义,它的解释总是,一个由许多相互联系的部分组成的系统、混合体。所以复杂的定义说明了,他们讲的是,组成部分之间相互联系的系统。没有哪个系统比因特网的联系更加紧密了。下图是大约10年前因特网的地图。上面的每一个节点对应一个路由器,即一台电脑,之间的连线对应着连接这些不同路由器的线缆,这些是典型的光纤连接,或者是铜线线缆等等。
我之所以举这个例子,是因为我们今天,大部分的沟通都是通过这个通讯网络而进行的。我们的生物存在取决于如下图所示这个网络,这个网络是我们在我的哈佛实验室里反复研究的一个网络。我们在实验室里,会研究我们人体体内的分子网络,即我们细胞里的基因和蛋白质是如何相互联系的。我们会探索这个网络如果崩溃,会怎样导致疾病的发生。它之所以这么重要,是因为如果我们体内的分子相互之间如果没有联系,我们就不会有生命。生命的存在取决于不同组成部分之间的相互作用,
另一个对我们而言很重要的网络,是我们所生存的社交网络。如下图所示的是是脸书,但是当然在中国,也有其它类似的社交网络,所以这里有一片很大的空白。脸书和许多其它的社交网络,我们都是它们的一部分,这些线上的社交网络反应了或者蕴含着这样一个事实:那就是我们的社交存在、商业存在取决于我们与其他人之间的互动,我们与朋友、与同事、与家人之间的互动,我们不是这个社会里孤立的个体,而是我们只有通过与他人互动才能成功。所以,我们是这个社交网络里必不可少的部分,没有了这个社交网络,我们就很难成功。
换一个不同的视角来看,如下图,这个宇宙可以被看作是星系的网络,它常常被称为宇宙网,是天文学家研究的对象。每一个节点对应着一个星系,其连线对应着星系之间的万有引力。有越来越多的著作,通过这个独特的网络,来研究这个网络以及了解这个宇宙的大规模结构。
因为你们许多人都关心做生意。金融是我们生命中非常必要的一个部分,意味着我们的下一家企业、我们的下一个想法、我们的下一家公司赚钱的能力,实质上是通过主要的金融网络实现的,这个网络由银行、公司、个人等组成,甚至还包括国家本身。金融网络,尤其是2008年的金融危机起源于美国,最后影响到了欧洲。国家相互欠债,即使小的国家,如希腊也无法偿还它的债务。经济危机使主要的经济体,比如德国、法国等等都受到牵连,因为这些国家的金融网络是相互依存的。
我要给大家看的,最后一组例子是经济本身。我们经常分类,把经济看成一个公司和个人之间的贸易的网络。尽管许多教科书上的例子把这个过程描述为:个人与市场做交易、公司与市场做交易。事实上,每一笔贸易都是双边贸易,有人卖、有人买,这使之成为一个非常复杂的网络。如果你们看看股市,或者看看经济,大规模、小规模的结构,都是被这些局部的交易所决定的。
所以我给你们看这些幻灯片的目的非常简单。那就是让我们意识到,我们的生存,不管是生物、社会还是经济生存,都取决于多个网络。如果不观察这些网络、不去了解这个结构以及描述它们,我们就无法去了解我们周围的世界。所以在这堂课的最后,我要做的是给你们一些工具,让你们好好思考一下这些网络,告诉你们一些能够描述这些网络的原则。
二、原则一六度分隔
为什么会出现六度分隔法则
我要讲的第一个原则,也许是最著名的网络原则,它叫六度分隔。事实上六度分隔又称为小世界理论,简单地说,就是你可以随便拿地球上的两个人,如莎拉和皮特举例。莎拉也许不认识皮特,但是莎拉认识拉尔夫,拉尔夫认识简,而简认识皮特。换句话说,莎拉和皮特之间只相隔三段连接,世界很小。意味着,你可以拿世界上任意两个人举例,你可以找到他们之间一个相对短的通道。有一些短距离的中介,把他们两个联系到了一起。
我们为什么有六度分隔概念,原理非常非常简单,我来解释一下。我们是社会的一部分,我们每一个人有k个朋友,k指的是朋友的数量。现如今一个人一般会认识大约一千个人,指的是知道他们的名字。所以这意味着,我认识一千个人,他们每一个人又认识一千个人,因此,我与一千个人之间只相隔一段连接。一千乘以一千,我与一千的平方(一百万)个人只相隔两段连接。依此类推,我与一千的三次方个人之间只相隔三段连接。一千的四次方个人,比世界上的全部人口还要多,与我之间只相隔了四段连接。换句话说,如果你看看,我们周围的社会网络是如何扩展的指数过程,你就可以推出一个非常非常简单的公式:那就是两个任意的人之间的距离,是系统中节点数目的对数。对数是一个能把非常庞大的数字变得非常小的函数,就像以10为底的对数,10的7次方的对数只是7。于是我们发现两个任意的人之间的距离是非常非常短的。所以六度分隔背后的观点是:我与许多人之间只相隔两、三个人,也就是说,只间隔几个人,我们就认识了全世界的人。
现在我要做的是,把这些原则组织起来,利用一些简单的法则或原则,来描述不同类型的网络。第一个原则是六度分隔法则,我之所以称它为法则或者原则,是因为这个属性不仅仅属于社交网络,而且还属于各种类型的网络,这个属性就在那里。比如脸书,或者微博,它们就具备这个原则;再比如万维网,网页之间的相互联系就体现了这个原则。另外,如果你观察身体里的化学物质是如何相互联系的,这是一个小小的世界,它也遵守这条六度分隔法则。
随机网络模型
但是如我所说,六度分隔法则是最简单的一条原则。我们再进一步,比如说我们要如何看待这些网络?我们要如何给它们建模?我们要如何从数量上来描述它们?对于这个方向的研究,起源于两个匈牙利的数学家--保尔·鄂尔多斯和阿尔弗雷德·雷尼,他们从1959-1960年左右开始思考,我们要如何去描述大自然里的这些大型网络。他们说,一个网络是一个非常简单的对象,只是一些节点连接到一起形成的;但是我们作为数学家不知道,自然是如何选择把这些不同的节点连接到一起的。”因此他们说这些网络结构,乍一看非常地任意,因此不妨假设这些网络真的是随机连接到一起的。他们说,要如何连接呢?首先从一些节点开始,我们任意选择两个节点,就好像扔骰子,如果你得到六,你就把这些节点连接起来;如果你没有得到六,你就不要把它们连起来。因此,如果你给每一对节点都这样做的话,最后你会得到如下图所示的这样的对象。
上图中有一些节点是相互连接的,有一些节点不是。谁与谁连接是由几率决定的,我们有多少个连接也是由几率决定的。当然,它取决于我把这两个节点连接起来的可能性。在这个特别的例子中,右上方这个节点很幸运,它有四个连接;而左下方这个节点只有一个连接;左上方这个节点有两个连接。问题是,我们应该如何在一个非常非常大的网络里,把这些差异表述出来呢?如果要这么做,我们要测量我们所谓的连接度的分布,即多少个节点连接了一个连接、多少个节点有两个连接、多少个节点有十个连接等等。对于一个任意的网络,它就像一个海洋,从技术的角度来讲,这是我们所说的泊松分布。在这里,泊松分布指的是大量的节点有大致相同数量的连接,即大多数节点都是平均水平。尽管有非常非常少的节点的连接度比平均水平更大或者更小。事实上,这个分布告诉我们,很少能找到异常值,即很难发现有一些个体比普通的个体有更多的朋友,或者更少的朋友。换句话说,阿尔弗雷德·雷尼告诉我们,如果这个社会是随机的,那么如果我们任意地相互交朋友,那么这个社会就是一个非常一致的社会。即我们都有大致相同数量的朋友,没有人会特别受欢迎,也没有人不受欢迎。也就是说在一个随机的社会里,如果你看你的左边或你右边的人,你会发现他们与你的朋友的数量大致一样。
三、无标度特性
真实的网络与随机网络模型之间的差异
但是,现在这个预测是不可思议的?因为我们知道,不一定是这样的情况,许多个体有比我们更多的朋友。而且常常有的人,有数百万人都认识他们,可能是名人等等。但是很显然,在有多少人认识我们、追随我们和对我们感兴趣上,我们是不一样的。因此我们的预测和模型的预测的悖论告诉我们,也许随机的网络并不随机。在这方面,我的工作开始于大约20年前,当时我非常好奇,想要知道真实的网络与随机的网络模型之间有多大的差异。为了弄清楚答案,我把一些具体的网络画出来,然后把它们与一个随机的网络模型相比较。我们首先选择画出如下图所示的万维网。为什么选择万维网? 它的名字告诉我们它是一个网络,它的节点是网页,其连接对应着把网页连接到一起的。万维网是一个非常大的网络,现在它有超过一万亿个文件、一万亿个节点,但20年前,它要小得多,仅有大约8.5亿个节点。但是我们之所以选择把它画出来的主要原因是:它是公共的。因此你可以从某一个网页开始,看这个网页上有哪些连接,然后访问这些网络,最终也可以把那些连接画出来等等。所以从根本上来说,你可以做的是绘制一个局部的地图。如果你用它来设计软件,它就被叫做机器人或者搜索引擎,然后从原则上来讲, 你就可以继续自动地把这个东西绘制出来。这就是谷歌和许多大型的搜索引擎,每天正在做的事情,它们在绘制这个网络。
当我们给这个网络绘制了如上图所示的一副图像,我们就得到了像这样的一个网络(万维网)。现在我们的期待是什么?我们听说人们之间的联系是随机的,以他们的个人兴趣为基础。那么,如果这个网络是随机的,我们就应该发现,连接连接度分布应该遵循泊松分布,它是这个随机的网络模型给我们预测出来的。我们看一下我们的数据会感到很惊讶,我们发现有一个如上图所示的不一样的函数,它描述了每一个节点有多少个连接,这个函数就是幂律法则。在这里你可以看到,一个任意选择的网页将有k个连接的可能性。我用双对数尺度来表示它,你们看到在重双对数尺度上,这些测量数据点连成了一条直线。这意味着什么?这个幂律法则,事实上是有一个特定的含义的。为了了解它,请让我简单地类推一下。这个随机的网络从外观上来讲,它与中国或者美国的高速公路系统有点相似,节点就是城市,连接就是把城市相互连接的高速公路。你可以直接从一处去往另一处,这是一个相对均匀的网络,因为大多数城市都有一条或者两条高速公路,把它们与高速公路系统的其余城市连接起来。你找不到任何一个大城市有数百条高速公路,把它们与其它城市相连,就连北京也没有数百条高速公路,把它们与这个国家的其它城市相连。所以如果你要做一个连接连接度分布,一个城市有多少条高速公路?也许最多是一条或者两条,而且后面的会快速变少。但是我们发现,万维网上的网络,与美国、中国或者亚洲的航空系统更为相似。有许多许多小的机场,它们都有直达的航班,飞往几个主要的中心城市,如北京或上海。从表面上来看,这个网络与高速公路网络非常不一样,因为在这里有许多小的节点,通过几个大的枢纽连接到一起,这就是幂律法则的属性。因为幂律法则告诉我们,在万维网上,我们有许多许多小的节点、几个主要的枢纽,人人都与之相连,最后我们把这一类被那些大的枢纽所主导的网络,叫做无标度网络。
帕累托定律
不管我什么时候说无标度网络,你们都应该记得这些网络与一个随机的网络之所以不同,是因为这些网络有一些主要的枢纽把它们连接到一起。如果你记得这一点,接下来我要讲的所有内容,你就都能理解了。随机的网络是非常均匀的,所有的节点都有数量大致一样的连接,无标度网络都是非常不一致的,你有许多许多小的节点,它们通过一些主要的枢纽相互连接起来。这些枢纽对于这个网络而言是非常重要的。我们在万维网上发现的这个幂律法则,在其它的著作中曾经提到过,在经济学上它叫做帕累托定律,或者80/20法则。
帕累托是意大利的一位经济学家,他发现如下图所示的意大利和欧洲的收入的分布,有少数人他们的收入超级高,这个分布遵循了我们所讲的幂次法则。但是最重要的是,我们必须要记得,有两种不同类别的网络:随机的网络和无标度网络。
组织背后真正的网络
我刚告诉你们的是,我们发现了万维网的结构:在这个网络里有这些主要的枢纽。现在问题是,这仅仅是万维网的特征,还是许多其它的网络也有的特征呢?所以我们开始研究其它类型的网络。在这里我要讲一个例子,它是我在本堂课里会经常用到的一个例子。它让我们思考一个公司或者一个组织的结构是什么。我们都来自于不同的公司,公司的健康常常由网络的结构,即人们是如何互动的所决定。下图是匈牙利一家小型公司的员工,每一个节点是一个人,颜色对应着他们工作的地点。这家公司有三个不同的办公地点,其中的两个地点与位于布达佩斯的总部非常近,还有一个在布达佩斯以外地区的办公地点,这个办公地点离布达佩斯很远。
这家公司找到我们,因为这家公司的领导意识到,他们组织内部存在一个沟通上的问题。这意味着,每一次他们就公司的未来做出一个决定时,不知道怎么的,这些消息就是不能直接传达给公司里的员工。而且常常公司的成员的想法,与领导想要传达的意思恰恰相反。这不是一个不同寻常的问题,我确定你们当中的很多人已经感受到,在你们的组织里有同样的问题存在。所以这家公司想要知道他们做错了什么。因为他们已经按照习惯做法发送备忘录等等,但是这样做并没有带来什么大的改变。所以他们来找我们。我们所做的是:首先有效地利用一个线上平台采访了每一个人,问他们非常简单的问题。比如,他们每天跟谁谈话?当公司遇到问题时,他们会找谁寻求建议?他们是从哪里找到的工作?他们在哪里委派他们的任务?之所以会问这些问题,是为了弄清楚在公司里沟通发生在什么地方。
从原则上来说,沟通在组织的成员之间,信息在那里流动。这个调查允许我们把员工名单,替换成网络,从这些网络你们可以看到,有一些主要的枢纽点把这个公司联系起来。这些枢纽点以更大的节点来表示,每一个节点的大小与它们的连接数量成比例。我想要强调的是,这些人之所以是枢纽,不是因为他们提名了许多他们谈话的对象,而是因为许多人指出他们是当出现组织上的问题时,他们会找的人,他们是人们信任的人,他们是人们询问信息的对象。
你们在上图可以看到,甚至在我们所在的组织里,不是非常大的组织,这些枢纽点,无标度的网络的典型特点会自然而然地出现。所以我们是无标度网络的一部分,有些人是枢纽点或者他们的枢纽点在我们周围,但是这些枢纽点也是通信网络的一部分。如下图所示,节点是路由器,连接对应着线缆,你们可以看到,有许多个重要的枢纽点,这就是很典型的无标度网络。
最后一个例子,有一个特别的目的。因为到目前为止,我告诉你们的所有例子都是所谓的人类制造的网络,比如因特网、万维网、航空网络等等,这些都是我们人类制造的网络。这是不是暗示着,我们之所以有枢纽点,是因为我们人类喜欢在我们周围创建枢纽点。因此,为了验证一下是否真的是这样,我们需要先看看,不是由我们建造的网络,比如我们体内的网络,是不是这样的一个网络。下图左边所展示的是新陈代谢网络,这是化学反应的网络。如果你吃了早餐,这个网络会把你早上所吃的所有东西,分解成你的细胞所需的化学物质,如二磷酸腺苷和三磷酸腺苷。在下图右边,是我们所谓的蛋白质与蛋白质相互作用的网络。在这里,节点对应着蛋白质,连接对应它们之间的结合作用。它们是否相互结合、它们是否在细胞里相互作用。尤其,你就能清楚地看到,右图呈现了一个无标度的网络的特征,有一些主要的枢纽点,它把许多小的节点联系到一起。在新陈代谢的网络,我们也能找到相同的特征。那非常不可思议,因为这个网络不仅出现在我们之间,而且它已经存在和演化超过了40亿年,但是它与万维网有着相同的结构,但是我们一会儿再讲这个问题,为什么会这样。
无标度的网络
现在我要来讲一讲第二条法则,那就是我们很感兴趣的许多网络,比如社会网络、技术网络、、生物网络,都是我们称之为无标度的网络。这意味着它们有一些主要的枢纽点,把许多小的节点连接到一起。这个无标度的属性,对于网络的组织方式而言非常必要,这就提出了一个非常有趣的问题,为什么这些不同类型的网络都是无标度的网络?这些枢纽点来自于哪里,它们的源头是什么?为什么经过超过40亿年的进化的生物网络与过去30年里才产生的网络(如万维网)有着相同的结构?这真的令人感到不解,因为很显然这些网络相互之间没有关联,这显示了为什么所有这类网络都有相似的结构有一些更简单、更深层的解释,可以应用于所有不同类型的网络,不仅仅是万维网。
BA模型
我们要想办法解释它,这些枢纽点来自于哪里?或者说无标度的网络来源于哪里?为了回答这些问题,我们必须回过头来问问我们自己,随机的网络模型有什么问题?即为什么当我们随机地连接节点时,我们得不到枢纽点?那个模型缺少了什么?只有这样,我们才可以解释枢纽点的出现。结果证明,真实的网络有两个随机的网络模型所没有的属性。第一个是随机的网络模型假设。我们有一些节点是随机相连的。但是当我们那样做的时候,我们没有认识到这个事实:真实的网络是没有固定数量的节点的。恰恰相反,我们周围的网络都在持续地改变和扩展,不断有新的节点添加到这个系统里。
我们看一看万维网。蒂姆·伯纳斯·李是万维网的创始人。在1991年万维网被创建的时候,它只有一个网页。第一个网页在日内瓦的某个地方问世,而现在我们有超过一万亿个网页。我们是如何从一个节点变成万亿个节点的,我们一次增加一个节点,增添一些新的节点到这个系统里,那么你要如何建立那个模型?你要建立那个模型,你必须认识到:真实的网络总是在增长以及改变,新的节点在增加。鉴于此,我们从一个新的小的网络开始,我们问怎么可能有新的节点加入网络?当一个新的节点加入到这个网络时,这个节点要连接到哪里?如下图所示,这个随机的网络给了我们一个非常明确的方法,那就是新的节点会随机地与已经存在的节点相连。
四、富者越富
富者更富的机制
接下来我要讲的会让你感到惊讶,在现实的网络中,连接模式并不是随机的。我们来看看万维网,在那里我们可以看到,新的节点更喜欢与高度连接的节点相连。如我所说,在万维网上有超过一万亿个网页,你会与什么网页相连?大体而言,你会连接那一些那些已经有了很多连接的网页,这些连接越有名,你就越有可能知道它,以及你更有可能会与之相连接。这就是我们所谓的偏好连接。我们从数学的角度来描述它,你将与一个随机选择的节点相连接的可能性,与它拥有的连接数成比例关系,这就是数学原则。节点所拥有的连接数越多,你就越有可能会找到它,你越有可能会与之相连。所以说到上图这个小小的网络,你与有四个连接的节点相连接概率,是与只有两个连接节点相连接的概率的两倍。
如果我要利用这两个原则--增长和偏好连接来使一个网络增长会怎么样?枢纽点会自然而然地出现。这些枢纽点之所以会出现,是因为如果在这个系统里有一个大的和一个小的节点,新的节点更有可能会找到那个大的节点,而不是小的节点相连接,因此大的节点比小的节点增长得更快,这就是我们所谓的富者更富的现象。这个节点连接得越多,它就有更多的连接,因此,它不仅会变成一个枢纽点,而且会无限保持其枢纽点的地位。所以如果你想要利用我之前告诉你们的这条规则,使一个网络不断增长变得越来越大。你不仅会看到,枢纽点会自然而然地出现,而且你还会看到从数学上来说,它会变成一个无标度网络。这个连接度分布也会遵循幂次法则。就与我们在万维网,或许多其它的网络里看到的一样。
现在我想要提醒你们,在现实的系统中会发生许多不同的过程,那就是节点会消失、连接会消失、连接可能重新连线等等。在过去20年里,我们了解到,只要这个网络继续扩展下去,只要有偏好连接,节点就不会随机选择,它们会偏好那一些连接更多的节点,然后这些枢纽点会有效地涌现,这个网络会成为无标度网络,所有这两条原则都是必要的。而且如果想要成为无标度网络,这两条原则常常是必须的。它们常常存在于许多真实的网络之中,从细胞到万维网,这解释了为什么我们有这样的枢纽点产生于各种不同类型的系统。所以在所有有枢纽点的这些系统里,都有一个富者更富的机制,或者偏好连接在起作用。
适宜度模型: 后发者能后来居上吗?
现在,这个富者更富的机制存在一个问题,那就是它预测总是最早的节点会变得更大,它预测在商业的世界里有先发优势,无论谁先打进市场,谁就将拥有最高的市场份额。但是,我们知道这并不总是正确的。也许你们大多数人都没有听说过一个搜素引擎--Inktomi,Inktomi在谷歌出现之前,是美国最大的一个搜索引擎,它为雅虎和许多其它公司提供搜索服务。正因为如此,它是万维网里最大的一个节点之一,除了它不会把自己宣传成一项独立的服务。然后谷歌出现了,在短时间内,通过它的搜索引擎,使它成为了万维网上最大的节点,但是这种情况没有持续超过10年,只持续到脸书的出现。然后在短时间内,脸书超越谷歌,成为了万维网最大的枢纽点。所以我们在这个万维网的案例中可以看到,一个后来的节点是有可能超越之前的节点的。当然,我们都希望是这样的情况,因为我们知道,我们中的许多人,我们全部都是作为年轻的个体开始我们的职业生涯,我们都希望我们会成功,我们有一天会成为枢纽点。
为了实现这个愿望,我们必须解释一下,后来的节点如何能够比先前已经建立的节点更大呢?这是有可能的。首先,我们来回顾一下无标度模型告诉了我们什么?从数字上来讲,无标度模型预测了每个节点连接度的增长都将与时间的平方根呈同样的比例关系,这就是先发优势。看起来似乎是这样,不同时期到达的节点都遵循同样的曲线增长,因此无论谁最先来,它总是最大,而且将一直保持最大的状态。现在我们要如何解释,我们中的一个可以赶上,并且超越先前的节点这种可能性呢?这是有可能的,对此目的,我们必须认识到,节点有内在的属性:能够超越它们拥有的节点的数量。那就是每一个节点都有一个适应度,适应度告诉我们,你在市场上的竞争力有多大。以万维网来说,适应度就是这个网页所提供的服务,即如果你上那个网页,你想不想再次回到那个网页上。以社交网络来说,适应度告诉你,如果你见到某个人,你是否想要他或者她的电话号码,你是否想要再见到那个人,或者你是否再也不想见到他们了。
为了描述这个适应度,我们需要修正这个偏好连接。它说只有连接的数量决定连接的可能性。现在修正成适应度和连接度的一个组合,因为连接度告诉你你的可见度是多少,你难不难找,而适应度告诉你,我一旦找到你了,我是否想要与你有关联。因此有两个单独的过程。如果我们现在假设每个节点都有一个适应度,然后我们发现,现在每一个节点连接度的增长与时间都成幂次关系,而且幂次的大小与它的适应度成比例。意味着有可能,一个节点尽管出现的较晚,但是有着较高的适应度,并且随着时间的推移,超过之前的节点。想要超越已经存在的节点,是需要时间的,因为它必须花时间去赶上它,但是这样的可能性总是有的。
玻色-爱因斯坦凝聚
这就是我们所谓的适应度模型,适应度存在于大多数真实的系统中。这个理论还预测,在不同的系统之间可能存在一些有趣的差异。而且某些适应度分布,会导致非常不同寻常的行为。一个节点可以拥有系统里所有的连接,用技术术语来说,这是我们所谓的玻色-爱因斯坦凝聚态。你们在这个例子中会看到,第五个节点比所有其它的节点有更高的适应度,随着时间的推移,它将成为一个辐射式网络的中心枢纽点。新的节点会只与第五个节点相连,它成为了系统里的超级枢纽点。结果当那样的事情发生时,有一个特别的信号:在一个无标度的情况下,最大的枢纽点在保持它领先地位的同时,总是有随着这个网络变得越来越大,它的市场份额随着时间的推移而减少。也就是说,随着一个系统变得越来越大,最大的节点依然保持它的领先地位,但是它新增的连接与一个系统里新增的连接总数相比较,会变得越来越少。然而,在玻色-爱因斯坦凝聚态里,最大的节点将保持一个恒定的市场份额,不管这个网络变得多大,总会有固定份额的连接。
这让我们回忆起,微软在过去几十年里所做的事情。曾经Windows操作系统占据了85%的市场长达数十年时间,直到苹果电脑的出现,这种情况才真正改变,所以这个玻色-爱因斯坦凝聚态真的对应一种垄断的情况。那就是一个节点比其它节点更高,因此它将总是保持一个稳定的市场份额,不管这个市场变得多大。所以这帮助我们制定第三条法则,即富者变得更富,这也是我们之所以有这些枢纽点的原因。第二条法则告诉我们,在这个系统里有一些枢纽点,第三条法则告诉我们为什么会这样,那是因在真实的网络里 有这样一个富者更富的机制或者偏好连接。它们使这些重要的枢纽点自然而然地出现。