第70行: |
第70行: |
| | | |
| | | |
− | [[File:iimage.png|500px|thumb|upright=3|一个演示社团结构的小型网络草图,包含三组内部紧密连接的节点,各组之间连接较为稀疏|right]] | + | [[File:iimage.png|500px|thumb|upright=3|一个演示'''社团结构'''的小型网络示意图,包含三组内部紧密连接的节点,各组之间连接较为稀疏|right]] |
− | 社团结构在实际网络中相当常见,社会网络包括基于共同位置、兴趣、职业等的社团团体(实际上是这个术语的起源)。在网络中找到一个潜在的社团结构(如果它存在的话)是很重要的,重要原因有很多: | + | 社团结构在实际网络中相当常见,社会网络包括基于共同位置、兴趣、职业等的社团团体(实际上是这个术语的起源)。<ref name=escri_FaniE17/><ref>{{cite journal|last=Hamdaqa|first=Mohammad |author2=Tahvildari, Ladan |author3=LaChapelle, Neil |author4=Campbell, Brian|title=Cultural Scene Detection Using Reverse Louvain Optimization|journal=Science of Computer Programming|date=2014|doi=10.1016/j.scico.2014.01.006|volume=95|pages=44–72|url=https://zenodo.org/record/889712/files/article.pdf}}</ref> |
| | | |
| | | |
− | 首先,社团允许我们创建一个大范围的网络地图,因为单个社团就像网络中的元节点,这使得研究更加容易;其次,由于社团通常与系统的功能单元相对应,因此单个社团也能阐明网络所代表的系统功能。如在代谢网络中,这些功能组对应于周期或路径;而在'''蛋白质相互作用网络 Protein interaction network '''中,社团对应于生物细胞内具有类似功能的蛋白质;在引用网络中,社团对应于研究主题。 而识别网络中的子结构,有助于深入了解网络的功能以及拓扑效应之间是如何相互影响的。这种见解对于改进'''谱聚类 Spectral clustering '''等图的数据处理算法有一定的参考价值。
| + | 在网络中找到一个潜在的社团结构(如果它存在的话)是很重要的,重要原因有很多: |
| | | |
| + | 第一,社团允许我们创建一个大范围的网络地图,因为单个社团就像网络中的元节点,这使得研究更加容易;<ref name=Nemaneigen>{{cite journal |author1=M.E.J.Neman|title=Finding community structure in networks using the eigenvectors of matrices|journal=Phys. Rev. E|volume=74|pages=1–19|issue=3|doi=10.1103/PhysRevE.74.036104|pmid=17025705|year=2006|arxiv=physics/0605087|bibcode=2006PhRvE..74c6104N}}</ref> |
| | | |
− | 此外,社团的重要性还体现在:它们的属性通常与网络的普遍属性迥异。因此,只关注普遍属性通常会忽略网络内部许多重要且有趣的特性。例如,在一个给定的社交网络中,爱交际的群体和沉默寡言的群体可能同时存在。
| |
| | | |
| + | 第二,由于社团通常与系统的功能单元相对应,因此单个社团也能阐明网络所代表的系统功能。如在代谢网络中,这些功能组对应于周期或路径;而在'''蛋白质相互作用网络 Protein interaction network '''中,社团对应于生物细胞内具有类似功能的蛋白质;在引用网络中,社团对应于研究主题。 而识别网络中的子结构,有助于深入了解网络的功能以及拓扑效应之间是如何相互影响的。这种见解对于改进'''谱聚类 Spectral clustering '''等图的数据处理算法有一定的参考价值。<ref>{{cite journal|last=Zare|first=Habil |author2=P. Shooshtari |author3=A. Gupta |author4=R. Brinkman|title=Data reduction for spectral clustering to analyze high throughput flow cytometry data|journal=BMC Bioinformatics|date=2010|doi=10.1186/1471-2105-11-403|pmid=20667133|pmc=2923634|volume=11|pages=403|issue=1}}</ref> |
| | | |
− | 其次,社团的存在通常也会影响到传播过程,如在网络上发生的谣言传播或流行病传播。 因此,为了正确理解这些过程,最重要的就是检测社团,并研究它们如何在各种环境下影响传播过程。
| |
| | | |
| + | 第三,社团的重要性还体现在:它们的属性通常与网络的普遍属性迥异。因此,只关注普遍属性通常会忽略网络内部许多重要且有趣的特性。例如,在一个给定的社交网络中,爱交际的群体和沉默寡言的群体可能同时存在。<ref name="Nemaneigen"/> |
| | | |
− | 最后,社团检测在网络科学中的一个重要应用是预测网络中的缺失链接和识别网络中的错误链接。 在测量过程中,由于多种原因,有些链接可能无法被观察到。 同样,由于测量中的失误,一些链接可能会错误地输入数据。 社团检测算法很好地处理了这两种情况,因为它允许给定节点对之间存在连边。 | + | |
| + | 第四,社团的存在通常也会影响到传播过程,如在网络上发生的谣言传播或流行病传播。 因此,为了正确理解这些过程,最重要的就是检测社团,并研究它们如何在各种环境下影响传播过程。 |
| + | |
| + | |
| + | 最后,社团检测在网络科学中的一个重要应用是预测网络中的缺失链接和识别网络中的错误链接。 在测量过程中,由于多种原因,有些链接可能无法被观察到。 同样,由于测量中的失误,一些链接可能会错误地输入数据。 社团检测算法很好地处理了这两种情况,因为它允许给定节点对之间存在连边。<ref name=clauset_missing>{{cite journal|author1=Aaron Clauset|author2=Cristopher Moore|author3=M.E.J. Newman|title=Hierarchical structure and the prediction of missing links in networks|journal=Nature|volume=453|issue=7191|pages=98–101|doi=10.1038/nature06830|pmid=18451861|year=2008|arxiv=0811.0484|bibcode=2008Natur.453...98C}}</ref> |
| | | |
| ==社团检测算法== | | ==社团检测算法== |