2016年集智俱乐部研读营

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索

主题:网络、几何与机器学习

“网络、几何与机器学习”研读营是由集智俱乐部主办,凯风基金会资助的“复杂系统的信息物理研讨会”系列活动的第一期。我们计划将于2016年10月举行的为期5天的前沿文献研读、讨论的活动,主题范围涵盖:复杂网络、统计物理、量子物理与机器学习。其目的是为了从这些前沿科学领域获得新的研究灵感以及促进集智科学家成员之间的彼此互动、交流,从而孕育全新的科研思想。


背景

2016年伊始,两个划时代的科学发现震撼了所有人:一是“引力波”的发现,二是人工智能AlphaGo 4比1大败围棋世界冠军。AlphaGo的胜利代表着人工智能技术的成功,而人工智能的进一步发展可能将最终要回答“意识是什么”这样的终极问题。同样,引力波的发现也是意义重大,它牵扯到了时空与宇宙的本源。

网络、几何与机器学习研讨会旨在把握引力波与人工智能的本质与内涵。一方面,复杂网络模型可以用于理解时空的本源,也可以构建复杂的神经网络,模拟大脑的思维。另一方面,网络是几何学的进一步延伸与拓展,我们利用几何化的思路来抓住网络背后的简单原理,机器学习则是一种必要的技术。 传统的社会科学研究的一个主要目标是模仿自然科学把社会活动及其背后的原理运用数学进行定量化。近年来在科学界掀起的注重关系而非实体的思潮可能给这种社会科学-自然科学的交融的产生很大的影响,从而产生新的研究范式。这种范式注重数据分析和社会活动所依托的复杂网络,运用近年来在人工智能领域很有可能在不远的将来颠覆以往的社会科学的研究方式。因此,本研讨会的研讨结果将有可能对社会科学研究产生重要的作用。

详细

背景

我们都是生活在三维空间中,各种物理过程、社会事件的发生都是在我们熟悉的四维时空中。然而,随着技术的进步,我们在日常生活中所面临的更多的是一种网络空间而不是物理空间。现实生活中的很多复杂系统都可以被抽象成复杂网络模型,其中节点代表系统中的实体,连线代表相互作用关系。无论是交通网络还是通讯网络,它们都无疑缩短了世界上任意两点的距离,从而使得我们所在的空间发生了严重的变形。因此,网络空间具备一种完全不同的几何属性,对这种几何属性的研究将有助于我们理解现代网络是如何影响我们的日常生活的。

近年来的研究进一步指出,很多网络的生长过程都可以被嵌入到一个双曲几何空间中,许多无标度网络的幂律行为都可以从双曲几何得以解释。更有意思的是,双曲空间也是在物理学中被广泛讨论的Anti-de Sitter (AdS)空间。物理学家发现AdS空间中的量子引力与其边界上的无标度共形场论之间存在着对偶关系。这种对偶关系揭示了引力与量子纠缠的深刻联系,并有可能为我们最终统一广义相对论和量子力学这两大物理学分支提供重要思路。另一方面,量子纠缠可以由张量网络来描述。张量网络也是一种复杂网络,可以具有与神经网络、社交网络类似的无标度行为,从而具有双曲几何等演生的时空结构。要从量子多体波函数的大数据中挖掘张量网络和演生几何,则需要应用到深度学习等技术。因此,从复杂网络的演生几何角度看待各种不同的复杂系统将能给我们􏱑供一种全新的统一视角,并且可以借助很多基础物理学和计算机科学中的方法和工具来创建统一的􏱐述框架。

另一方面,近些年来的机器学研究发展了很多成熟的技术可以将网络嵌入到空间中,从而对复杂网络形成全新的认识。例如,DeepWalk技术可以在一个复杂网络上赋予随机游走,生成一种模拟的“语言”,再利用机器学习中的Word2Vector技术为每一个节点计算出一个坐标,将网络嵌入到一个高维空间中。

人文与社会科学背景

更多内容见这里 大数据对社会科学与艺术的影响

传统的社会科学研究的一个主要目标是模仿自然科学把社会活动及其背后的原理运用数学进行定量化。然而这个目标现在看来没有成功过,至少没有像物理学那样成功。然而近年来在科学界掀起的注重关系而非实体的思潮可能给这种社会科学-自然科学的交融的产生很大的影响,从而产生新的研究方式。这种新的研究方式注重数据分析和社会活动所依托的复杂网络,运用近年来在人工智能领域很有可能在不远的将来颠覆以往的社会科学的研究方式。

500px

回顾科学史,我们发现,所有当代科学都经历了前科学摸索时期。而一个领域与哲学的关系越大,说明越处于前科学阶段,因为数据不够,所以严重依赖假设。


  • 计算社会科学:大数学对社会科学的革命

我们知道,在任何学科中,数据都是及其主要的。例如没有第谷积累的大量数据,就没有开普勒简洁又美妙的模型 “Kepler … was not satisfied with the complex and still slightly inaccurate result; at certain points the model differed from the data by up to eight arcminutes … ”

半个多世纪以来,社会科学家其实一直在处理及其小规模的数据。无论是数千上万人的社会调查,还是多次累积的实验,其规模一般都在MB以下。所以,在他们的概念里,超过这个规模的数据就是大数据,更有及其无知者,把数值的大与数据规模的大混为一谈,如此算来,宏观经济研究的GDP也算大数据了。在大数据处理的问题上,物理学家和计算科学家远远走在社会科学家前面。欧洲粒子对撞机每天产生42T新数据,哈勃望远镜每天搜集17G新数据,而像谷歌这样的互联网公司每天处理的用户数据在PB级以上。仅仅一个大的互联网社区每天可以就产生几T新数据。(1 P = 103 T = 106 G)总结起来,我们认为,以现有人类的数据处理能力,只有在PB级以上,不得不使用并行计算架构处理的,才叫大数据。我们是否有理由期待,人们很快就可以像了解基本粒子和黑洞一样了解我们自己的社会?


  • 人类思想史简单回顾

两千四百年前(古希腊时代),学科之间只有思考对象的分别,没有研究方法的区别。亚里斯多德使用同样的方法研究行星运动与诗歌,柏拉图把几何定理和城邦政治混为一谈。一千一百年前(中世纪),基督教神学(经院哲学)占据统治地位,其他学科几乎完全消亡。经院哲学的意义在于以神学为外壳,保留了部分古希腊思想。三百六十年前(启蒙时代),哲学(形而上学)带领所有的其他学科反叛基督教神学。在反叛过程中,哲学获得极高地位,自然科学叫自然哲学,社会科学叫道德哲学,都是哲学的附庸。各个学科之间在研究方法上仍然没有壁垒。达芬奇,笛卡尔,康德,这些人,各有所长,但都有跨界行为。启蒙时代时,站在第谷和开普勒肩膀上的牛顿出生。自然科学的黄金时代开始,以物理学为代表的自然科学与其他学科,在研究方法上分道扬镳。但牛顿本人还没有清晰看见这个未来,所以他的书很谦虚地叫《自然哲学的数学原理》。两百六十年前,自然科学的积累引发技术的飞跃,工业革命爆发。从此自然科学与技术相互扶持,其他学科望尘莫及。孔德等人非常羡慕,创立“社会物理学”,想要为研究人类社会建立严格的方法论,但并不成功。直到今天,比起物理学等自然科学,社会科学在描述和预测研究对象的规律上,还处在非常落后的状态。

  • 为什么孔德的社会物理学没有成功?

孔德的思想:社会同自然并无不同,没有必要在自然科学和社会科学之间作出划分。研究社会要采取实证的办法。社会物理学可以分为社会静力学和社会动力学。社会静力学就是从静止的状态去研究社会,是研究一般的社会秩序;社会动力学是在静力学的基础上研究人类社会发展的动态规律。孔德以后,实证主义尝试一直在社会科学中被延续,例如学习工程力学的帕累托式经济分析,从统计学借力的涂尔干式社会调查研究,效仿博物学对社会结构贴标签分类的马克思韦伯等。但是收效甚微,一直没有建立起主导性的范式。

数据与假设,是一对trade-off。从这个角度看,实证社会科学的问题是:早期没有数据,所以只好依赖假设和对假设的演绎推进认知;后期有了数据,但量非常少,而且关于收集什么样的数据没有达成共识。还是依赖假设和对假设的演绎推进认知,这就是所谓的“讲故事”。一个社会学理论就是一个故事,读者信了,研究就结束了。所以孔德的一个大问题,就是他没有充分的数据来验证哪一个关于人类微观行为的假设是真实的。这不仅是孔德的问题,也是包括博弈论等学科在内的经济学的共同问题。思考变成了无法证伪的文字和数学游戏,就离科学越来越远。

考察历史,就会发现社会科学研究与自然科学研究的技术和思想差距在不断拉大。孔德时期希望借鉴的是牛顿经典力学,直到最近二三十年,社会科学家才开始借鉴统计力学,取得了不小成功,但是对于更深刻,更前沿的物理洞察和数学工具,社会科学家可以说是一无所知。本次研讨会,就是打破这个局面的一种尝试。我们试图用比现有的统计力学和复杂网络范式更深刻,更前沿的数学工具来理解人类行为,理解社会。

  • 计算社会科学的崛起与迷思

2009年,David Lazer等15个来自社会学、计算机科学、物理学的学者联名在Science发表文章The coming age of computational social science一文,宣告计算社会科学诞生。随后Nature 等杂志也发表了Computational social science: making the links等评论,进行推波助澜。但是,过去十年随着计算社会科学快速崛起,越来越多的人进入这个领域,泥沙俱下,产生了一些迷思。例如:1. 计算社会科学是社会科学的一个快速崛起的子领域。这个不对。计算社会科学不是一个子领域,而是社会科学可计算化的过程,是一个新阶段。 就好像实验生物学->分子生物学->信息生物学。现在信息生物学渐渐没落,不是因为不流行,而是 因为太流行了,已经成为共识了,它的历史使命也宣告结束。等到每一个社会科学的学生都掌握 使用互联网搜集分析大数据的技巧,计算社会科学就没落了; 2.计算社会科学的扩展要很久。其实不用。这是一场来自外部的殖民,而不是来自内部的革命。研究大规模人类行 为,研究社交网络,计算机科学家和物理学家已经做了大量工作,社会科学家正在失去话语权。 社会科学面临这样的情况:要么进行“内部革命”,要么被外力代替;3. 计算社会科学还是要服务“讲故事”的社会学研究思路,让数据为思考服务。这个也不对。暂时也许是这样,但是我们可以认为经过五十年,一百年的发展,在数据积累和数学工具进步的条件成熟之际,社会科学必然走上物理学的道路。不再执着“讲故事”,不再执着追求只能适用于一时一地的所谓“理论”,而是追求不以时空为转移的人类行为规律。类似于阿西莫夫科幻小说《基地》中的“心理史学”。

  • 为什么我们相信社会物理学是可能的

一句话:我们看到的宇宙,不管怎么看,都应该是一样的。没有这个信仰,就没有科学,也没有物理学定律。

宇宙这样以一种奇妙的方式构成:我们处理的对象每上一个层级,数量和复杂性就迫使我们放弃依靠下一个层级获得的知识来理解本层级的对象。因此,如果我们要相信科学,我们只能坚信科学原理具有这样的特征:每一个层级的对象,只要我们忽略足够多细节,都能看到类似足够简洁的物理法则。这种性质可以被称为Eadem Mutata Resurgo。其实这种观点并不新,它是物理学的平权原理的推演。即把物理宇宙的各项同性(isotropy)加多一个维度:观察的层次(scale)。物理法则不仅invariant of time-space operation,还要invariant of scale operation。例如,人们现在各粒子的运动方式相对清晰,化学键也基本明白,到大分子有点搞不定,生命有机体如何形成基本靠猜,到人的行为和社会运动,要从基本粒子开始解释按道理完全就是瞎扯了。但奇怪的是,大规模人类运动的方式又满足基本粒子的levy flight方程了 (Gonzalez et al. , Nature, 2008)。对抗复杂性的办法就是忽略信息,但没有大数据,就不知道该忽略什么信息。因为在大规则行为中,次要的信息相互抵消,主要的趋势不断加强,最后涌现出强力的统计法则。 Anderson (1972) 说,More is different。但我们要说,他说得还不够透彻。 More is different, but massive is simple。

从面向对象到面向关系的范式转变

以往的自然科学与社会科学研究对象大多是实体对象,但是最近无论是在物理,还是在社会科学,都出现了从面向对象到面向关系的范式转变。这体现在:

  • 在理论物理学中,人们更加注重粒子之间的关系而非粒子本身的属性
  • 在社会学研究中,人们不再是考察一个人的性别,教育,阶级对一个人决策和行动的影响,而是考察彼此间的相互关系对个人的影响。

面向关系的研究范式恰恰是复杂性科学的基本观点

人工智能等技术的发展引发的社会变革

现代的人类社会很难将人工因素完全剔除,技术已经深深变革了我们这个社会。因此,研究人工智能、大数据等最新技术对人类社会的影响也是积极有意义的,同时也是复杂系统人们关注的普遍话题。

技术与自然科学背景

2016年伊始发生了两件必将载入科学技术发展史的里程碑式的事件:一是2月11日LIGO和VIRGO共同宣布人类首次直接探测到了来自双黑洞合并的引力波辐射,二是3月中旬由Google DeepMind开发的人工智能围棋程序AlphaGo击败李世乭九段。AlphaGo的胜利代表着基于深度神经网络的人工智能技术的成功,而人工智能的进一步发展可能将最终帮助我们回答“意识是什么”这样的终极问题。在另一方面,引力波的发现同样意义重大。引力波是时空的涟漪,是宇宙宏伟的交响乐。现在人类第一次能够“聆听”来自宇宙的“交响乐”,这必将推动人类对引力、时空和宇宙的认识,并可能促进基础物理学特别是量子引力理论的发展和完善。总而言之,人类正站在两个新时代的边缘:从十年的时间尺度来看,人类正站在人工智能的时代边缘;从百年的时间尺度来看,人类正站在引力文明(星际文明)的时代边缘。在这样的时代背景之下,什么是科学领域的大问题不言而喻。我们相信“智能”和“引力”至少是两个重要的关键词。

复杂系统的信息物理研讨会系列活动正是在这些大问题的驱动下应运而生。神经网络作为复杂系统的一个研究对象已经毋庸多言。而近期的物理学研究发现,引力现象与时空几何很可能也演生于复杂的量子多体纠缠,并且能够以张量网络这样的复杂网络来描述。越来越多的科学家正在从信息论(特别是量子信息)的角度去理解智能和引力的起源。因此,我们相信对复杂系统的信息物理的深入探讨,将有助于我们发现智能和引力之间的深刻联系,并最终理解智能和引力的本质。本次研读营作为这一系列活动的第一次,我们希望以复杂网络作为一个具体的切入点,将网络生长、衍生几何和机器学习这些具体的问题综合起来加以讨论,以推动相关领域的跨学科研究。

第二次量子力学革命

第二次量子力学革命是当前物理学正在发生的变革,其主题是信息与物质的统一,主要观点包括:物质是由量子信息构成的,时空起源于量子纠缠。可能的交叉点包括:

  • 用张量网络来描写量子纠缠和时空几何
  • 用机器学习的方式来构建张量网络
深度神经网络和重整化
  • 基于复杂网络的重整化方法
  • 重整化与衍生几何的关系,从量子重整化的角度理解全息对偶和量子引力
  • 深度学习作为一种重整化算法的应用
复杂系统中的数学和物理学问题
  • 网络的统计力学和临界现象

在大数据时代,数据的规模不断增加,我们所研究的网络规模也不断增大。在这种情况下很多网络可以用无穷大的网络系宗来描述,也就是说在统计物理所说的“热力学极限”下,大网络中的性质 和系宗的平均性质是一样的。这个性质又被称为”自平均性质“(self-averaging)。因此在大的网络中我们可以见到物理系统中的一些现象比如相变和临界现象,这些现象可以用统计力学的平均场方法加以描述。

  • 信息科学与统计物理

信息科学和统计物理在很早的时候就被联系了在一起, E.T. Jaynes早在1957年中就建立了最大熵原理, 并且解释了统计力学和贝叶斯统计的关系。近年来随着稀疏系统平均场理论的发展,统计物理中的自旋玻璃理论在信息科学和计算机科学的很多问题中得到了应用。

  • 神经网络和Ising模型

广义地定义在任意图上的Ising模型,更确切的说是Ising自旋玻璃模型,是给定数据的一阶矩和二阶矩的最大熵模型。Ising模型的正问题是给定系统的参数,例如温度和耦合参数,求解系统输出的宏观统计值,例如磁化率和自旋关联。而反问题则是给出系统的输出,要求求解系统的参量以期望拟合所给定的数据。由于Ising模型中的构型服从Boltzmann分布,Ising反问题又被称为Boltzmann Machine。由于Botzmann machine难以求解,后来从工程的角度又演化出在Bipartite图上的Restricted Boltzmann Machine(RBM)以及Deep RBM,甚至近来火热的LSTM。另外一个被大家熟悉的一个广义Ising模型的例子就是用来描述联想记忆的经典的模型,Hopfield模型。

拟邀请人员

拟邀请的主要人员,每个人需要提供简历

  • 张江,北京师范大学系统科学学院副教授,集智俱乐部创始人、现任主席、集智科学家,研究兴趣包括:复杂系统、集体注意力流、流网络、异速生长律等。
  • 张潘,中国科学院理论物理研究所副研究员,集智科学家,研究方向为统计物理与复杂系统,具体来说是用统计物理中的一些理论如自旋玻璃理论,副本对称破缺理论研究应用数学,网络和计算机科学中的一些问题。张潘的研究兴趣广泛,涉及物理,统计,网络和机器学习的很多方面并且在不断地拓宽自己的研究领域。
  • 尤亦庄,加州大学圣塔芭芭拉分校物理系博士后,集智科学家,主要研究领域是量子多体物理,关注集体行为导致的演生现象和临界现象。对信息论(特别是量子信息),复杂系统,人工智能等领域也很感兴趣。
  • 吴令飞,芝加哥大学计算中心知识实验室博士后,集智俱乐部核心成员、集智科学家,社会科学背景但自我定位成物理学家。研究兴趣:注意力动力学和知识生产(Attention dynamics and knowledge production)。目前在研究的项目是科学家的跨学科注意力流动。
  • 王成军,南京大学新闻传播学院助理研究员,集智俱乐部集核成员,集智科学家,集智俱乐部南京读书会成员、奥美数据科学实验室主任、计算传播学实验中心成员、香港城市大学互联网挖掘实验室成员,对复杂性科学和可计算方法(如机器学习)感兴趣,现在的研究主要集中于采用网络科学方法分析计算社会科学的研究问题,例如,采用重整化方法分析手机用户的注意力网络和移动网络。
  • 唐乾元,南京大学物理系物理学在读博士,集智核心成员,「知乎盐 Club 2014」荣誉会员,曾出版知乎盐系列电子书《写在物理边上》《临界:智能的设计原则》和知乎一小时电子书《能量守恒》。主要研究方向为统计物理及其在生命科学问题中的应用,曾作为中国博士生代表参加在德国林岛举办的「诺贝尔奖获得者大会」。
  • 苑明理,北京彩彻区明公司软件工程师,集智核心成员,数学系毕业、程序员生涯,年龄渐长,但对许多事情仍然充满好奇和困惑。因维基对知识工程发生兴趣,想去探寻知识大厦搭建之道。通过一些长期的思考,认为知识表示的几何化有助于揭示概念创生过程的秘密。
  • 董磊,清华大学建筑学院在读博士,本科学过建筑学和经济学,一直对城市复杂系统、城市网络、计算社会科学等领域有浓厚的兴趣,也曾在百度研究院做过移动互联网与地区发展,Mobility Econometrics等相关工作。希望通过数据和模型的思考来认识城市的演化规律和多样性的起源。
  • 方弦,法国巴黎七大信息学博士生,组合数学方向,目前主要研究领域是组合地图。
  • 王雄,职于深圳大学高等研究院任研究员,集智科学家,主持混沌量化投资实验室,从事复杂性科学与量化投资研究与教学。自大学时代起一直坚持研究自然规律的统一性与复杂性两个科学的极致问题。
  • 章彦博,中国科学技术大学凝聚态物理系在读本科生,对统计物理、复杂系统等领域有一些兴趣,并计划向此方向发展。现在在合肥微尺度国家实验室与导师合作高维逾渗模型、键逾渗的拓扑结构等工作。
  • 李嫣然,香港理工大学在读博士生,研究方向为自然语言处理中的语义表达和语言生成,致力于利用深度学习、认知科学等相关领域的方法和成果探究人类语言习得和语言表达的奥秘。
  • 甄慧玲,中国科学院理论物理所第二实验室博士后,应用数学博士,统计物理博士后。研究兴趣:深度学习,尤其是记忆网络(包括LSTM, question answering, neural turing machine, attention)和机器翻译的统计物理机制。目前正在研究的内容与RBM及其各种varients有关。
  • 仇玮祎,北京生物工程研究所,集智核心成员,动物医学背景,肿瘤分子生物学博士,现从事生物制药方面工作。一直对生命系统的复杂性有浓厚兴趣和好奇,以生命科学为职业亦起因于此。业余探索和思考生命物理化学起源的细节和背后的深层逻辑,目前的研究除研发抗肿瘤免疫药物外,也对基于细胞信号通路网路的肿瘤发生机制及抗肿瘤免疫机制进行探讨。
  • 罗秀哲, 中国科学技术大学光学,计算机在读本科生,感兴趣的方向是量子计算(Quantum Computing)和量子物理基础 (Quantum Foundations), 具体来说包括但不限于量子算法, 量子纠错, 量子计算的物理实现。 业余正在给Julia语言造量子计算的轮子。曾参与或完成过一些等离子,绝热量子计算,非经典路径的工作。
  • 程嵩,中国科学院物理研究所在读博士,研究方向为凝聚态理论量子多体与强关联系统,具体来说是基于张量重整化群的强关联数值算法。张量重整化群是近年来一个新兴的且还在不断发展的方法,为了不断优化这个方法,我自己的兴趣面也不断地在纠缠,网络,几何,机器学习等等方面拓展。
  • 曾培,南京大学物理学院本科,现清华大学交叉信息研究院博一新生。本科主要参与的科研为光学、量子信息、深度学习相关,现准备从事量子信息理论工作,主要感兴趣的方向为:量子通讯有关的理论(Quantum Shannon Theory),量子反馈与控制;量子信息与机器学习的关系。对于神经科学很感兴趣,尤其是想了解大脑是否具有量子特性。

基本信息

  • 时间:2016年10月8日-10月12日
  • 地点:古北水镇

日程安排

条目 第一天 第二天 第三天 第四天 第五天
第一单元(8:30~10:00) 小世界、无标度、网络重整化 统计物理,优化问题和统计推断 量子信息:从一到无穷 网络:结构、生长与流动 从量子重整化群到区块链智能网络
主讲人 张江 张潘 尤亦庄 吴令飞 韩锋
第二单元 (10:00~11:30) 微分几何、双曲几何初步 一些网络上问题的统计物理描述 张量网络:空间几何的量子织锦 流形学习 重整化群到区块链智能网络
主讲人 尤亦庄 张潘 尤亦庄 吴令飞 韩锋
第三单元 (13:30~15:00) 复杂网络的双曲模型 网络与随机矩阵 宇宙智能:机器学习与演生时空 几何遐思 自由讨论或待定
主讲人 张江 张潘 尤亦庄 吴令飞
第四单元 (15:00~16:30) 复杂网络的空间嵌入算法 从Ising模型到神经网络 Ignite Discussion Ignite Discussion 自由讨论或待定
主讲人 李嫣然 张潘
第五单元 (19:00~20:30) Ignite Discussion Ignite Discussion 休息 休息 自由讨论或待定
本日主持人 尤亦庄 吴令飞 张潘 张江 吴令飞

说明

  • 一个单元包含了讲解、讨论与休息,时间分配由主持人把握
  • Ignite Discussion:这种讨论是参与人在听过本日讨论内容后受到启发而提出来的新研究课题
  • 自由讨论:最后一天的自由讨论将由所有参与者自由、自愿发言,主题应与本研读营内容相关
  • 每日主持人:负责时间控制与协调

详细内容安排

研讨会前奏

读书会:微分几何与双曲几何入门


第一天

网络与几何,领读人:张江、尤亦庄

复杂网络基础与前沿
  1. 无标度、小世界、社团结构,各类网络
  2. 网络重整化
双曲几何
  1. 双曲几何基本介绍
  2. 复杂网络的双曲空间模型
  3. 后续发展
网络的空间嵌入
  1. 加权网络的空间嵌入
  2. 流网络的空间嵌入
参考文献
  • Papadopoulos F, Kitsak M, Serrano M Á, et al. Popularity versus similarity in growing networks[J]. Nature, 2012, 489(7417): 537-540.
  • Krioukov D, Papadopoulos F, Kitsak M, et al. Hyperbolic geometry of complex networks[J]. Physical Review E, 2010, 82(3): 036106.
  • Serrano M A, Krioukov D, Boguná M. Self-similarity of complex networks and hidden metric spaces[J]. Physical review letters, 2008, 100(7): 078701.
  • Brockmann D, Helbing D. The hidden geometry of complex, network-driven contagion phenomena[J]. Science, 2013, 342(6164): 1337-1342.
  • Allard A, Serrano M, García-Pérez G, et al. The hidden geometry of weighted complex networks[J]. arXiv preprint arXiv:1601.03891, 2016.
  • García-Pérez G, Boguñá M, Allard A, et al. Rethinking distance in international trade: World Trade Atlas 1870-2013[J]. arXiv preprint arXiv:1512.02233, 2015.

第二天

统计物理, 网络与机器学习,领读人:张潘
详细内容,参考书目和文献列表(逐渐更新): 2016研读营之统计物理,网络与机器学习

统计物理与信息处理
  1. Ising模型与最大熵分布
  2. 自旋玻璃与组合优化
  3. Boltzmann分布与贝叶斯统计
一些网络中问题的统计物理描述
  1. 网络中的流行病传播,网络鲁棒性与Percolation 相变
  2. 从四色地图问题到社区结构探测: Modularity, Stochastic Block Model及可探测相变
网络与随机矩阵
  1. 邻接矩阵, 随机行走矩阵,Laplacian矩阵及它们的简单谱性质
  2. Gaussian orthogonal ensemble, 谱密度,Wigner's Semi-cycle,
  3. 统计推断,消息传递与谱方法
从Ising模型到神经网络
  1. Ising自旋玻璃模型,平均场方法和副本对称破缺
  2. Ising模型反问题, Boltzmann Machine及Restricted Boltzmann Machine
  3. 深度神经网络与重整化群

第三天

张量网络,量子引力与机器学习,领读人:尤亦庄

具体计划与书目将逐步在此页面更新:2016研读营之张量网络

量子信息:从一到无穷
  1. 量子力学基础:量子比特,量子态,密度矩阵
  2. 量子信息基础:量子纠缠,纠缠熵,量子互信息
  3. 量子信息理论的几何化:张量网络图,面向关系的物理学
张量网络:空间几何的量子织锦
  1. 纠缠熵在张量网络中的几何意义
  2. 量子临界:双曲空间中的张量网络,量子重整化与深度张量网络
  3. 局域化与热化,空间撕裂与坍缩
宇宙智能:机器学习与演生时空
  1. 从测地线几何到复杂网络上的Ising模型
  2. 基于Boltzmann机的神经网络(此部分移到第二天详细讨论)
  3. 随机张量网络,纠缠特征学习,时空几何的演生
参考文献

科普介绍:

  • Jennifer Ouellette, How Quantum Pairs Stitch Space-Time, Quanta Magazine 2015 [1]
  • Beni Yoshida, Quantum Gravity from Quantum Error-Correcting Codes? Quantum Frontiers 2015 [2]

学术论文:

  • Roman Orus, A Practical Introduction to Tensor Networks: Matrix Product States and Projected Entangled Pair States, Annals of Physics 349 (2014) 117-158 arXiv:1306.2164
  • G. Evenbly, G. Vidal, Tensor Network States and Geometry, J Stat Phys (2011) 145:891-918 arXiv:1106.1082
  • Mark Van Raamsdonk, Building up Spacetime with Quantum Entanglement, Gen.Rel.Grav.42:2323-2329, (2010) arXiv:1005.3035
  • Brian Swingle, Entanglement Renormalization and Holography, Phys. Rev. D 86, 065007 (2012) arXiv:0905.1317
  • Xiao-Liang Qi, Exact Holographic Mapping and Emergent Space-Time Geometry, (2013) arXiv:1309.6282
  • Fernando Pastawski, Beni Yoshida, Daniel Harlow, John Preskill, Holographic Quantum Error-Correcting Codes: Toy Models for the Bulk/Boundary Correspondence, JHEP 06 (2015) 149 arXiv:1503.06237
  • Patrick Hayden et. al., Holographic Duality from Random Tensor Networks, (2016) arXiv:1601.01694
  • Yi-Zhuang You, Xiao-Liang Qi, Cenke Xu, Entanglement Holographic Mapping of Many-Body Localized System by Spectrum Bifurcation Renormalization Group, Phys. Rev. B 93, 104205 (2016) arXiv:1508.03635

第四天

机器学习中的几何问题,领读人:张潘 (不懂啊!而且第三天的内容可以在第四天专门进行讨论一天)

可以是综合前三天的内容,而且前三天都数学物理比较多,第四天可以有些网络生长和机器学习的讨论?--EverettYou讨论) 2016年4月13日 (三) 11:54 (CST)

第五天

真实世界的复杂系统:网络、流形学习、与几何,领读人:吴令飞

网络
  1. 网络结构:朋友网络,引文网络,超链网络
  2. 网络生长:日常出行,兴趣转移,城市扩张
  3. 网络流动:流行病传播
流形学习
  1. Isomap:人脸识别,手写字体识别
  2. LLE:人脸识别,单词归类
几何遐思
  1. 网络动力学的几何化理解
  2. 从测地线几何到Isomap
  3. 宇宙在思考,还是我们在模仿宇宙?网络生长(流动)与机器学习背后的几何原理
参考文献
  • Kunegis, J., Blattner, M., & Moser, C. (2013, May). Preferential attachment in online networks: measurement and explanations. In Proceedings of the 5th Annual ACM Web Science Conference (pp. 205-214). ACM.
  • Capocci, A., Servedio, V. D., Colaiori, F., Buriol, L. S., Donato, D., Leonardi, S., & Caldarelli, G. (2006). Preferential attachment in the growth of social networks: The internet encyclopedia Wikipedia. Physical Review E, 74(3), 036116.
  • Wang, D., Song, C., & Barabási, A. L. (2013). Quantifying long-term scientific impact. Science, 342(6154), 127-132.
  • Song, C., Koren, T., Wang, P., & Barabási, A. L. (2010). Modelling the scaling properties of human mobility. Nature Physics, 6(10), 818-823.
  • Zhao, Y. M., Zeng, A., Yan, X. Y., Wang, W. X., & Lai, Y. C. (2015). Universal underpinning of human mobility in the real world and cyberspace. arXiv preprint arXiv:1512.04669.
  • Zhang, J., Li, X., Wang, X., Wang, W. X., & Wu, L. (2015). Scaling behaviours in the growth of networked systems and their geometric origins. Scientific reports, 5.
  • Brockmann, D., & Helbing, D. (2013). The hidden geometry of complex, network-driven contagion phenomena. Science, 342(6164), 1337-1342.
  • Tenenbaum, J. B., De Silva, V., & Langford, J. C. (2000). A global geometric framework for nonlinear dimensionality reduction. science, 290(5500), 2319-2323.
  • Roweis, S. T., & Saul, L. K. (2000). Nonlinear dimensionality reduction by locally linear embedding. Science, 290(5500), 2323-2326.


问题凝练

  • 在一个平面网络上,对Boltzmann机做各种变异操作,希望找到更好的拓扑结构
  • 在GAN模型中,从信息论的角度达到的平衡是真正的平衡。
  • 逆ISING模型的求解,从能量的角度来分析GAN网络模型。
  • 因素网络、Compress sensing


  • 自然语言中,hierarchy和relevance之间的。
  • 科学系统的神经网络建模方法,比如如何确定层高和层中Size的变化。
  • 重整化群做网络的压缩问题,怎样跟神经网络的问题结合
  • 动力学和机器学习技术的结合,除了BP以外的学习方式


  • 如何利用机器学习中的一些压缩信息的方法,例如:压缩感知,Autoencoder、residual 网络来做物理学中的重整化群


  • 用薛定谔方程描述同态图(可能有量子芝诺效应)。
  • 如何量子化Boltzmann机?并做量子计算


  • 复杂网络中的高聚集系数不一定意味着有空间结构,也有可能是局域动力学造成的
  • 流形学习是否能放到低维的双曲空间中?


  • 蛋白质和神经的问题:关联容易测量,相互作用不清楚,高聚集系数的网络。
  • 唯一的网络结构可能意味着唯一的几何。如何形成的很有意义。发生功能的点会不会与网络节点的位置有没有关系。
  • 什么样的网络可以做重整化
  • 能不能用重整化方法把一个网络压缩到双曲空间中?


  • 可以基于一些LOCAL property来做重整化。从LOCAL的结构里recover dimension。用这种做重整化(尤亦庄)
  • 考虑Network redundance,比如Boltzman机,多个可以有相同的输出。
  • 寻找一般网络中的basic move。可以把任何平面图:re-triangle,及其可逆操作,包括flipflop,这样可以保输出一致。
  • 可以把贝叶斯推断用于Tensor network,也知道了如何量子化的几何。虚时间和实时间就是量子力学和统计力学的关系。
  • 城市(network和Geometry)。补充:实在的模型或算法:增强学习(policy network(gradient))。另一个:贝叶斯pragmatics reasoning(利用一些别的经验去辅助learning的过程)


  • 社会科学和TensorNetwork的结合如何应用。应用到复杂网络里面的研究。算法效率很低。
  • 回到社会科学问题:寻找问题的场景,几何意义究竟是什么


  • 纯粹的神经网络问题:有没有方法能学出来一种结构(大自然有可塑性),如何长出一个神经网络出来。
  • 把神经网络嵌入一个空间中,然后用一种gradient的方法把网络学习出来。拓扑结构的gradient的。


  • 网络的结构和几何的对应关系:网络的hierarchical structure决定了网络所在的双曲空间的曲率,以及如何把网络嵌套进双曲空间的法则。
  • 如果从其他角度找到了把网络嵌套进双曲空间的方法,也就找到了一种寻找hierarchical structure和community structure(即hierarchy的顶层分组)的方法。


  • 更加完善的双曲空间网络生长模型(考虑自然的densification),看看是否增长特性也符合实证
  • 开发一种新的网络嵌入算法:通过局域的重整化操作(收缩high clustering的节点团),得到重整化流做到网络的popularity维度上,然后再来根据聚类的情况确定similarity的维度和空间,也许算法会更加高效


  • 知识流形的问题
  • 是否可以利用动力学+机器学习的方式来做三维动画


讨论区

  1. 是否要加入如下议题?(by jake)

开放流网络 开放流网络的几何嵌入

  1. 对议题的讨论和补充(by 吴令飞)

一个是三者的联系介绍得不够深刻,我感觉是否可以从“局域性”来谈谈。所有的物理模型要几何化最后一定是局域性的。几何比如流形,当然是局域性的。而机器学习和复杂网络这两个方向,其中比较成熟的机器学习方法例如流形学习,SVD,各种降维,都是要获得一个局域的,连续的结构,以便切割;复杂网络方法例如BA网络,随机几何,prefrential return,这三类方程的rate equation解法,最核心的假设就是一个局域连续的节点序列,因为只有这样才能做微积分,才能把度k关于时间的方程变成累积概率方程。而这两个方法各自的新发现,深度学习与双曲网络,我认为还是有关局域性,是把这个问题又推向了更深刻的地方。 大量的物理方法,就是把不连续的,跳跃的,难以理解的,变成局域的,连续的,trivial的东西。复杂网络和机器学习,最后还是要走这条路的。 另外一个补充是,复杂网络这块的内容对于与会者可能太浅了。建议同时讨论BA网络,随机几何,prefrential return,重整化四个模型。

    1. “局域性”的观点很好,双曲网络的要点就在于原来一个无标度(非局域)的网络通过嵌入双曲空间就获得了局域化的连接。这也是AdS/CFT的思路,把一个临界系统(共形场论,CFT)对偶AdS空间局域的几何。而bulk geometry演生的过程实际上是一个重整化的过程,一个慢慢粗粒化细节从而把大尺度结构变得局域的过程。卷积神经网络对图像的识别也是这样一个过程。所以可以说这几个主题的共同点是背后的重整化思想。重整化从复杂的临界系统中铺呈出一套局域的演生几何,这个演生的几何维度就是重整化的标度。(by Everett)
  1. 是否需要准备入门知识?(by 苑明理)

(一)有无必要介绍一些微分几何的入门知识?我查阅了一些文献,觉得这些入门知识可以包括: 必要的数学工具:流形、微分流形、切从、微分形式、李群 涉及几何的基本概念:曲率、联络、平行移动、黎曼度量、测底线 (二)机器学习这部分的内容是否需要包括 Manifold Learning 的内容?毕竟 Word2Vec 还是嵌入到欧式空间。 (三)重整化貌似也是机器学习和AdS/CFT有关的共同话题,是否需要介绍? 另外在研讨的材料上,我有一个建议: 对于三个方向复杂网络、双曲几何与AdS/CFT、机器学习,分别定义出来: 最精简的入阶内容,以帮助不熟悉的成员快速掌握 有重点的前沿进展,以帮助研究者进入

  1. 建议在研读营之前开设基础知识(在线)讨论组,争取在研读营之前同步参与者在微分几何和张量网络方面的基础知识,以便在研读营中能够深入讨论。 (by 张潘)