流网络保留页面

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索

然而,这个前提是有问题的,对于一般的流网络来说,η反映的是网络结构的特征,而非增长的特征。也就是说<math>C_i\propto T_i^{\eta}</math>并不能保证<math>TST\propto IS^{\eta}</math>的成立,网络的异速标度与异速生长不是一回事。

因此,我们认为η刻画的是网络的结构特征,而非动态的特征。在树的异速标度律研究中,我们已经看到当树的层数越多越瘦长的时候,网络的η越高,而越扁平的树,指数η越低。如果我们将一棵树理解成一个公司的组织结构的话,那么η越大的公司它的等级结构越森严,权利集中在大老板手里,如果η越小,则公司的管理越扁平化。所以,我们认为η刻画的是网络的集中性程度。

这种讨论也适用于一般的流网络。由于我们将C<sub>i</sub>描述为i节点对整个网络的影响程度,而A<sub>i</sub>描述的则是i节点的直接流量。还用公司的比喻来说,A<sub>i</sub>说的是员工i手头所掌握的直接资源(可支配的钱、人),而C<sub>i</sub>描述的是他在整个公司中的实际权力。这样<math>C_i\propto A_i^{\eta}</math>成立,就意味着随着i的升迁(A<sub>i</sub>越来越大),它的实际权力增长的相对速度大小。η越小则增长得越慢,因此组织比较扁平化(即使大老板的能力也不见得很大),η越大则增长越快,因此组织更加集中化。

例如,有两个网络具有相同的节点数,它们的A<sub>i</sub>和C<sub>i</sub>分别是:A<sub>i</sub>(1)={1,2,3,4,5}, C<sub>i</sub>(1)={1,2,3,4,5}, A<sub>i</sub>(2)={1,2,3,4,5}, C<sub>i</sub>(2)={1,4,9,16,25}。也就是说这两个网络的A<sub>i</sub>分布都一样,但是第一个网的η=1,第二个的是2。那么第一个网络中的最大节点拥有的实际权力是5,占全部网络的1/3,而第二个的是25,占全部网络的25/55=0.45比第一个网大很多。因此,第二个网络结构更加集中化。

因此,我们说,η刻画的是网络的中心化程度。扩展到流网络以后的异速标度律数值η取值范围不再局限在1到2之间,而是可以取全部实数,因此,我们根据η的范围将全部网络分为三大类:

  1. 当η>1,网络是中心化的
  2. 当η<1,网络是去中心化的
  3. 当η=1,网络是中性的

各种流网络的异速标度律

下面我们来列举各种流网络的异速标度律情况:

生态流量网

文献<ref name="scalingbehavior"/>研究了21个生态流网络的异速标度律情况,如下图所示:

800px

图示了4个生态流网络的异速标度律在双对数坐标系下的拟合情况。我们可以看出,对于这四个网络来说,A<sub>i</sub>、C<sub>i</sub>的散点分布得非常接近于异速标度律那条直线,而且斜率,也就是幂指数η非常接近于1。下表则列出了更多的生态流网络的异速标度律:

600px

我们看到,几乎所有的生态流网络遵循异速标度律的情况都比较好,而且幂指数η很接近于1,同时比1大一点点。但也有少数的网络幂指数小于1或大于1。我们说生态流网络几乎都是中性的。

点击流网络

我们来看第二种网络:点击流网络<ref name="wulingfei">Wu, Lingfei; Zhang, Jiang (2013). "The decentralized flow structure of clickstreams on the web". European Physics Journal B. 86: 266.</ref>。这里的三个点击流网络都是文章<ref name="wulingfei"/>作者在不同时间从Alax网站获得的流量数据,包含了全部互联网上流量排名前1000名的所有网站。但是由于Alax网站数据的限制,每个网站的出度仅仅是10,也就是说我们只能获得从该节点流出的10条边的数据。下图展示了这三个网络A<sub>i</sub>、C<sub>i</sub>数据点画在双对数坐标系下的情况:


600px

该图中不同颜色的数据点对应了三个不同的网络。这三个网络也是符合异速标度律的,它们的幂指数分别是0.95,0.92和0.96,它们都是小于1的,也就是说这些点击流构成的流网络是去中心化的。

国际贸易网

作为对比,我们再来考察另一种流网络:国际贸易网,用同样的方法可以得到2000年国际贸易网全网的异速标度指数η大约等于1.02,也是非常接近1的,即是一种中性的网络<ref name="shipeiteng"/>。

有趣的是,国际贸易网中的流量数据还包含了具体的产品种类,也就是说,我们可以按照产品种类的不同而把原始的国际贸易流量网分解成一系列的子流网络,每个子网络对应一种产品,参见国际贸易网。我们可以分别计算这些产品对应流网络的异速标度律,从而计算它们的异速标度指数。

600px

该图展示的是Power-generating equipment即发电设备这种产品的异速标度律图,其中幂指数η=1.14显著大于1。下图展示了该商品的贸易网络:

800px

我们看到少数几个大国(美国、日本等国)作为大的出口国控制了整个网络,该网络属于中心化的。

与此形成对比的是蔬菜和水果这类产品构成的贸易网络,如图:

Tradenetworkvegetable.PNG

在该网络中,那些大节点(流量A<sub>i</sub>大,如美国、德国)基本都是进口国,即贸易逆差的国家(红色节点)。也就是说它们处于整个蔬菜水果贸易的末端,因此,流经它们的商品在整个网络中不会有很大的影响范围,所以它们的C<sub>i</sub>不会太大,这样,该网络就会具有较小的幂指数,事实上该网络的η=1.04,远比发电设备产品的幂指数小。

进一步,文章作者对将近800种商品子网络计算了η,得到了下面的统计图:

800px

该图的横坐标是η数值,纵坐标是该数值在这800个商品网络中出现的频率。通过这张图,我们能看出大部分商品的η值集中在1.09附近,也就是说这些产品的贸易网络大体上是中心化的。

该文作者将频率又涂上了不同的柱状,以便表示不同的商品大分类所具备的η值范围。我们看到,大部分的工业产品集中在图形的右侧(右图),而农产品集中在左侧。所以,工业品所构成的贸易网络更加中心化——即少数国家控制了工业品的贸易流。

另外一个有趣的现象是:虽然平均来看大部分产品都是比较中心化的,但是由这些子网络合起来的整个贸易网却是比较中性的。一个可能的原因是,不同种产品的贸易可能存在着互相取长补短的作用。虽然对于A,B两种产品来说,它们都是由少数几个大国控制的中心化的网络,但是将A贸易网与B贸易网合在一起的时候,整个网络却没有那么中心化。一个可能的原因是:控制A产品的国家刚好不能控制B,而控制B的国家刚好短缺A,因此这两种网络合起来以后就没有哪个国家控制了全部的产品。因此,整个贸易网就是一种中性的结构。

综合

综合上述三种网络,我们可以得到下表:

网络 η 中心化与否 含义
生态流网络 ≈1 中性的 大物种在网络中的控制力与该物种的流量成比例
点击流网络 <1 去中心化的 大网站的影响力没有达到与流量匹配的程度
国际贸易网全网 ≈1 中性的 大国在贸易中的控制力与该国的流量成比例
工业产品贸易网 >1 中心化的 大国在贸易中的地位远超过了与流量匹配的程度
农业等基础产品贸易网 <≈1 去中心化的 大国的影响力没有达到与流量匹配的程度

影响η指数的因素

我们已经看到不同流网络具有不同的η指数,有的时候大于1,有的时候小于1。然而,是什么影响了网络的异速标度指数η呢?文章<ref name="zhang"/>揭示了这个问题:虽然网络的拓扑结构也会影响幂指数η,但是,在流网络中,起到最关键作用的因素还要数网络的耗散律指数,而非网络的拓扑结构。这个结果多少有些反直觉。

耗散律

首先,需要指出,很多流网络都具有耗散律这一普适的规律。耗散律这一词条给出了详细的说明和结果展示。那么,影响η的各种因素中,耗散律指数γ起到了最关键的作用。为什么会是这样呢?让我们以一维的链为例来对此进行说明。

一维链结构

Chainexample.png

我们考虑如上图所示的一维链状结构,因为它比较简单,方便我们分析。

假设链状结构的耗散满足耗散律,即:

<math> D_i=c (T_i)^{\gamma} </math>

并且,每个节点都满足流量平衡,即:

<math> T_i=D_{i}+T_{i+1}=cT_i^{\gamma}+T_{i+1} </math>

利用这个递推关系,能够得到:

<math> T_i=\sum_{j=i}^ND_j </math>

对于这样的一维链状结构,我们又知道每个节点的C<sub>i</sub>刚好就是i右侧所有节点的T<sub>i</sub>之和:

<math> C_i=\sum_{j=i}^{N}T_j=\frac{1}{c^{1/\gamma}}\sum_{j=i}^{N}D_j^{\frac{1}{\gamma}} </math>

我们看到,T<sub>i</sub>是i右侧节点的各个节点的耗散的总和,而C<sub>i</sub>则是右侧节点耗散的1/γ次幂的总和。因此,若γ>1,那么随着节点沿着网络向左移动,T<sub>i</sub>会比C<sub>i</sub>长得快;反之,若γ<1,则T<sub>i</sub>会比C<sub>i</sub>长得慢。

假设网络满足异速标度律,即:

<math> C_i=b T_i^{\eta} </math>

其中,b是常数,那么,我们得到:

<math> \frac{1}{c^{1/\gamma}}\sum_{j=i}^{N}D_j^{\frac{1}{\gamma}}=b(\sum_{j=i}^ND_j)^{\eta} </math>

若γ>1,则<math>\sum_{j=i}^{N}D_j^{\frac{1}{\gamma}}<N^{1-\frac{1}{\gamma}}(\sum_{j=i}^{N}D_j)^{\frac{1}{\gamma}}</math>,所以:

<math>b(\sum_{j=i}^ND_j)^{\eta}<N^{1-\frac{1}{\gamma}}(\sum_{j=i}^{N}D_j)^{\frac{1}{\gamma}}</math>

若我们忽略常数(事实上我们仅仅关心随着i的变化问题,所以常数可以忽略),则可以近似地得到:<math>\eta<\frac{1}{\gamma}</math>。同样的道理,我们可以得到,当γ>1的时候,会有:<math>\eta>\frac{1}{\gamma}</math>。而当γ=1的时候,η=1,这样,综合起来就有:

<math> \eta \left \{\begin{array}{lll} <\frac{1}{\gamma} & \mbox {if } \gamma>1, \\

>\frac{1}{\gamma} & \mbox {if } \gamma<1,\\

=1 & \mbox {if } \gamma=1 \end{array}\right. </math>

通俗地说,耗散律指数越大,左侧的大流量节点就会把越少的能量投入到后续的网络节点上,这样从该节点出发的红色粒子总量就会减少,因此C<sub>i</sub>也就相应减少了。

生态流网络

下面,我们来考察真实的生态流网络中耗散律指数与异速标度指数的关系<ref name="zhang">Zhang, Jiang; Wu, Lingfei (2013). "Allometry and Dissipation of Ecological Flow Networks". Plos One.</ref>。

800px

该图展示了19个生态流网络的耗散律指数γ与异速标度律指数η之间的关系,其中蓝色的线为原始数据点,而红色的线是经过算法调整,去除原始数据噪音后的结果。我们看到了两个指数存在着明显的负相关。但是,我们由于有噪声的存在,以及网络的结构的影响,因此,这两个指数的负相关并不严格成立。

国际贸易网

接下来,我们来研究国际贸易网的耗散律指数与异速标度指数的负相关。在国际贸易网中,由于我们可以根据不同商品而得到不同的流网络,对于每个子网络都可以计算耗散律指数和异速标度律指数,因此,我们可以把这些子网络所对应的数据点列出来画在坐标系下,如下图所示:

Gammaandetainternationaltrade.png

从该图中可以观察到,耗散律指数与异速标度律指数之间的负相关关系很明显。

网络结构

树的异速标度律中,我们已经看到了不同的树状结构会带来不同的异速标度律指数。但是,当我们综合考虑网络拓扑结构和流量分布的时候,耗散律指数对异速标度指数的影响更加显著、明显。具体结果请参看文献<ref name="zhang"/>中的补充材料。

鲁棒性与异速标度律

上面的讨论指出,流网络的异速标度律刻画了网络的中心化的程度。指数η>1,则表示网络是中心化的,而η<1则表示网络是去中心化的。所谓的中心化程度可以理解为网络的权力集中程度。因此η越大,则网络的中央集权性就越高。

我们的一个直觉认识是,集中程度越高的网络越脆弱,也就是网络的鲁棒性就会越差。由于大量的资源集中在少数人的手中,这样只要是有意的攻击这些大尺度节点就会很容易地摧毁整个网络。这样,如果η刻画了流网络的集中性程度,那么,显然η也会跟网络的鲁棒性存在着联系。也就是η越高,流网络中心化的趋势越明显,那么网络的抗攻击性,也就是鲁棒性就会越差。这种直觉认识是对的吗?我们必须找到能够定量刻画鲁棒性的手段。

流网络的鲁棒性

复杂网络的鲁棒性问题是一个复杂网络研究中的重要问题。人们研究鲁棒性的通常做法是对网络进行攻击——即删除节点,然后考察网络的各种性质——如连通性随着节点的删除是如何变化的。删除节点的做法通常有两种:1、随机删除节点;2、蓄意攻击,即先删除重要节点(通常是度大的节点),然后删除不重要的节点……。

对于我们要研究的流网络,我们也可以采取类似的方式:蓄意攻击,即删除流量大的节点,看整个网络的流量受影响的程度如何变化。假如网络的鲁棒性越高,那么它对我们删除节点的操作并不敏感,这样,即使毁掉了网络的80%的节点,网络整个流量的变化可能也就达到了20%;而如果网络鲁棒性差,那么也许删除了仅仅10%的节点,整个网络的流量只剩下原来的1%都不到了。因此,我们可以用总流量达到原始流量1%的时候所对应的删除节点的百分比来作为整个流网络鲁棒性的衡量标准

具体地,我们采用如下算法来计算流网络的鲁棒性:

 1、输入流量网络F,以及对应的马尔科夫链M,将所有节点(不包括源和汇)按照它们的流量大小T<sub>i</sub>进行从大到小排序构成列表L;
 2、从流网络F中删除L中的前i个节点,具体做法是:
    2.1. 将M中每个删除节点所对应的列都设置为0,得到M'
    2.2  根据方程T'M'+S'=T',得到新的各个节点的流量分布:T'。其中S'为源到除去删除节点以外各个节点的流量。
    2.3  计算整个网络总流量减少的百分比Δ=(ΣT-ΣT')/ΣT
 3、如果Δ大于给定的阈值(如0.1),则回到2,继续删除节点
 4、否则计算出已删除节点的比例r,则r就是流网络的鲁棒性。

为了看清楚网络的异速标度律与鲁棒性的关系,我们还是先看一种非常简单的网络:树。首先,我们按照文献<ref name="trees">Frank, F.; Murrell, D. (2005). "A simple explanation for universal scaling rela- tions in food webs". Ecology. 86: 325-3263. {{cite journal}}: line feed character in |title= at position 49 (help)</ref>中的模型,通过调整参数β和θ,生成了各种形状的树。然后我们计算这些树的异速标度律指数与网络的鲁棒性之间的关系,得到下图:

Etaandrobustnesstrees.png

我们可以清楚地看出异速标度律指数η与鲁棒性之间的负相关。其中红色拟合直线的斜率为-7.26。

生态流网络

下面我们考察实际的生态流网络与网络鲁棒性之间的关系。还是采用上述21个生态流网络,我们将它们的异速标度律指数和鲁棒性的关系画出来如下图:

Etarobustecological.png

我们看到η和r的确存在着负相关,但是这种相关性并不十分显著,这可能是跟因为鲁棒性指标对于网络的结构而非流量的分布更敏感。

国际贸易网

下面我们再来考察不同商品构成的贸易流网络的η与鲁棒性r之间的关系:

Etaandrobustnessinternationaltrade.png

对于不同商品的国际贸易网络来说,这种异速标度律指数与鲁棒性r之间的关系从图形上看,似乎更加明显。

参考文献

<references/>

相关WIKI