第1行: |
第1行: |
| 本词条翻译自论文《Measuring emergence via nonlinear Granger causality》(Anil K. Seth 英国苏塞克斯大学信息学系) | | 本词条翻译自论文《Measuring emergence via nonlinear Granger causality》(Anil K. Seth 英国苏塞克斯大学信息学系) |
− | <math></math>
| + | |
− | =='''摘要'''== | + | ==简介== |
| [[涌现]](emergence)在人工生命和复杂性科学中至关重要。然而目前关于涌现的定量、直观且易于应用的测量方法却极为匮乏。本文提出了一种名为“G-涌现”(G-emergence)的新测量方法,它将涌现过程“既受到底层因果因素的影响,同时又具备自身独立性”的这一概念进行了具体化和应用。G-涌现基于“格兰杰因果关系”的非线性时间序列分析,能够同时衡量涌现现象和明显的[[向下因果]] (downward causation)。我通过一个经典的涌现实例——基于[[智能体]](Agent)的鸟群模拟来展示这一方法的应用,并探讨了它对科学中最具挑战性的涌现问题之一的意识问题可能产生的深远影响。 | | [[涌现]](emergence)在人工生命和复杂性科学中至关重要。然而目前关于涌现的定量、直观且易于应用的测量方法却极为匮乏。本文提出了一种名为“G-涌现”(G-emergence)的新测量方法,它将涌现过程“既受到底层因果因素的影响,同时又具备自身独立性”的这一概念进行了具体化和应用。G-涌现基于“格兰杰因果关系”的非线性时间序列分析,能够同时衡量涌现现象和明显的[[向下因果]] (downward causation)。我通过一个经典的涌现实例——基于[[智能体]](Agent)的鸟群模拟来展示这一方法的应用,并探讨了它对科学中最具挑战性的涌现问题之一的意识问题可能产生的深远影响。 |
| | | |
− | ==引言==
| |
| 近年来,随着人工生命和复杂性科学的发展,人们对涌现现象重新产生了兴趣。虽然涌现的概念有着悠久的哲学历史<ref name="Broad_mind_nature">{{cite book|editor=Broad C|title=The mind and its place in nature|publisher=Routledge and Kegan Paul|year=1925|location=London}}</ref><ref name="Kim_making_sense_emergence">{{cite journal|author=Kim J|title=Making sense of emergence|journal=Philosophical Studies|year=1999|volume=95|issue=3–36}}</ref>,其核心思想其实非常简单:一种涌现的属性通常是“整体大于部分的总和”。在各类复杂系统中,涌现属性非常普遍,比如在生物系统、认知系统、社会系统和技术系统中。总体来说,人工生命和复杂性科学主要是解释看似与涌现相关的现象,而这些领域中的模型通常被描述为具有涌现性质<ref name="Bedau_downward_causation">{{cite journal|author=Bedau M|title=Downward causation and the autonomy of weak emergence|journal=Principia|year=2003|volume=6|issue=5–50}}</ref>。因此,令人惊讶且值得注意的是,目前缺乏定量且易于应用的涌现测量方法。而这很可惜,因为科学上对现象的有效描述很大程度上依赖于是否能对其进行测量<ref name="Chang_inventing_temperature">{{cite book|editor=Chang H|title=Inventing temperature: Measurement and scientific progress|publisher=Oxford University Press|year=2004|location=New York, NY}}</ref>。 | | 近年来,随着人工生命和复杂性科学的发展,人们对涌现现象重新产生了兴趣。虽然涌现的概念有着悠久的哲学历史<ref name="Broad_mind_nature">{{cite book|editor=Broad C|title=The mind and its place in nature|publisher=Routledge and Kegan Paul|year=1925|location=London}}</ref><ref name="Kim_making_sense_emergence">{{cite journal|author=Kim J|title=Making sense of emergence|journal=Philosophical Studies|year=1999|volume=95|issue=3–36}}</ref>,其核心思想其实非常简单:一种涌现的属性通常是“整体大于部分的总和”。在各类复杂系统中,涌现属性非常普遍,比如在生物系统、认知系统、社会系统和技术系统中。总体来说,人工生命和复杂性科学主要是解释看似与涌现相关的现象,而这些领域中的模型通常被描述为具有涌现性质<ref name="Bedau_downward_causation">{{cite journal|author=Bedau M|title=Downward causation and the autonomy of weak emergence|journal=Principia|year=2003|volume=6|issue=5–50}}</ref>。因此,令人惊讶且值得注意的是,目前缺乏定量且易于应用的涌现测量方法。而这很可惜,因为科学上对现象的有效描述很大程度上依赖于是否能对其进行测量<ref name="Chang_inventing_temperature">{{cite book|editor=Chang H|title=Inventing temperature: Measurement and scientific progress|publisher=Oxford University Press|year=2004|location=New York, NY}}</ref>。 |
| | | |
第15行: |
第14行: |
| | | |
| =='''涌现的类型'''== | | =='''涌现的类型'''== |
− | 从直观上看,涌现可以指两种情况:一种是宏观层面的属性,它“超越了微观部分的总和”(称为“属性涌现”或“共时涌现”,property/synchronic emergence);另一种是随着时间推移,出现了某种全新的、有质的区别的现象(称为“时间涌现”或“历时涌现”,temporal/diachronic emergence)。一个属性涌现的典型例子是当鸟群在天空中飞行时,鸟群似乎拥有独立的形状和轨迹,远远超越了每只鸟的个体行为。历时涌现的典型例子则可以从胚胎发育过程中,新形态特征逐渐形成的过程看出。本文主要探讨如何衡量属性涌现,但也指出了衡量时间涌现的潜在机会。 | + | 从直观上看,涌现可以指两种情况:一种是宏观层面的属性,它“超越了微观部分的总和”(称为“属性涌现”或“共时涌现”,property/synchronic emergence);另一种是随着时间推移,出现了某种全新的、有质的区别的现象(称为“时间涌现”或“历时涌现”,temporal/diachronic emergence)。一个属性涌现的典型例子是当鸟群在天空中飞行时,鸟群似乎拥有独立的形状和轨迹,远远超越了每只鸟的个体行为。历时涌现的典型例子则可以从胚胎发育过程中,新形态特征逐渐形成的过程看出。本文主要探讨如何衡量属性涌现,但也指出了衡量时间涌现的潜在机会。根据 Bedau<ref name="Bedau_weak_emergence">{{cite journal|author=Bedau M|title=Weak emergence|journal=Philosophical Perspectives|year=1997|volume=11|page=375–399}}</ref><ref name="Bedau_downward_causation" />的分类,属性涌现和时间涌现都可以进一步划分为三类:[[强涌现]](strong emergence)、[[弱涌现]](weak emergence)和[[名义涌现]](nominal emergence)。 |
| | | |
− | 根据 Bedau<ref name="Bedau_weak_emergence">{{cite journal|author=Bedau M|title=Weak emergence|journal=Philosophical Perspectives|year=1997|volume=11|page=375–399}}</ref><ref name="Bedau_downward_causation" />的分类,属性涌现和时间涌现都可以进一步划分为三类:[[强涌现]](strong emergence)、[[弱涌现]](weak emergence)和[[名义涌现]](nominal emergence)。最不具争议性的是名义涌现,它指的是一种宏观层面的属性,虽然它存在于宏观对象或过程之中,但在微观层面是没有的。例如,一个圆是由一组点构成的,但圆这个属性是这些点在宏观层面的涌现,因为它不能简单地从每个点中得到。由于名义涌现的推导非常简单,本文不再详细讨论。
| + | === 名义涌现 === |
| + | 最不具争议性的是名义涌现,它指的是一种宏观层面的属性,虽然它存在于宏观对象或过程之中,但在微观层面是没有的。例如,一个圆是由一组点构成的,但圆这个属性是这些点在宏观层面的涌现,因为它不能简单地从每个点中得到。由于名义涌现的推导非常简单,本文不再详细讨论。 |
| | | |
| + | === 强涌现 === |
| 最具挑战性和争议性的是强涌现,它包括两个密切相关的观点。首先,宏观层面的属性原则上无法从微观层面的观察中辨别出来。其次,宏观层面的属性具有不可还原的因果力量。第一个观点完全否定了机械论解释的可能性,似乎意味着如果没有新的自然基本原理,科学的进展将停止<ref name="Chalmers_strong_weak_emergence">{{cite book|author1=Chalmers D|editor1=Clayton P|editor2=Davies P|title=The re-emergence of emergence|publisher=Oxford University Press|year=2006|location=Oxford}}</ref>。第二个观点引发了“向下因果作用”(downward causation)这一复杂概念。向下因果作用的问题在于,它违背了“宏观的存在方式是由微观决定的”这一合理理论,这一理论被称为“因果基础论”(causal fundamentalism)<ref name="Jackson_defence_explanatory_ecumenism">{{cite journal|author1=Jackson F|author2=Pettit P|title=In defence of explanatory ecumenism|journal=Economics and Philosophy|year=1992|volume=8|issue=1–21}}</ref>或“附属性”(supervenience)<ref name="Kim_making_sense_emergence" />。此外,向下因果作用还带来另一个挑战,即如何解决微观层面与宏观层面之间的因果冲突<ref name="Bedau_downward_causation" />。即便如此,强涌现最大的挑战可能在于其在科学上的不重要性<ref name="Bedau_downward_causation" />。目前科学文献中唯一反复出现的强涌现例子是意识状态(如感质,qualia)从神经生物过程中的涌现<ref name="Sperry_modified_concept_consciousness">{{cite journal|author=Sperry R|title=A modified concept of consciousness|journal=Psychological Review|year=1969|volume=76|issue=532–536}}</ref><ref name="Chalmers_strong_weak_emergence" />,这更多地说明我们对意识的理解不足,而非对涌现深层原理的掌握有限。后文将进一步探讨这一可能性。 | | 最具挑战性和争议性的是强涌现,它包括两个密切相关的观点。首先,宏观层面的属性原则上无法从微观层面的观察中辨别出来。其次,宏观层面的属性具有不可还原的因果力量。第一个观点完全否定了机械论解释的可能性,似乎意味着如果没有新的自然基本原理,科学的进展将停止<ref name="Chalmers_strong_weak_emergence">{{cite book|author1=Chalmers D|editor1=Clayton P|editor2=Davies P|title=The re-emergence of emergence|publisher=Oxford University Press|year=2006|location=Oxford}}</ref>。第二个观点引发了“向下因果作用”(downward causation)这一复杂概念。向下因果作用的问题在于,它违背了“宏观的存在方式是由微观决定的”这一合理理论,这一理论被称为“因果基础论”(causal fundamentalism)<ref name="Jackson_defence_explanatory_ecumenism">{{cite journal|author1=Jackson F|author2=Pettit P|title=In defence of explanatory ecumenism|journal=Economics and Philosophy|year=1992|volume=8|issue=1–21}}</ref>或“附属性”(supervenience)<ref name="Kim_making_sense_emergence" />。此外,向下因果作用还带来另一个挑战,即如何解决微观层面与宏观层面之间的因果冲突<ref name="Bedau_downward_causation" />。即便如此,强涌现最大的挑战可能在于其在科学上的不重要性<ref name="Bedau_downward_causation" />。目前科学文献中唯一反复出现的强涌现例子是意识状态(如感质,qualia)从神经生物过程中的涌现<ref name="Sperry_modified_concept_consciousness">{{cite journal|author=Sperry R|title=A modified concept of consciousness|journal=Psychological Review|year=1969|volume=76|issue=532–536}}</ref><ref name="Chalmers_strong_weak_emergence" />,这更多地说明我们对意识的理解不足,而非对涌现深层原理的掌握有限。后文将进一步探讨这一可能性。 |
| | | |
| + | === 弱涌现 === |
| 弱涌现的概念介于强涌现和名义涌现之间<ref name="Bedau_weak_emergence" /><ref name="Bedau_downward_causation" />。在弱涌现中,宏观层面的属性来源于微观层面组成部分的相互作用,但这种相互作用非常复杂,以至于宏观属性无法简单地通过微观解释来得出。与强涌现不同,弱涌现的宏观属性原则上是可以从微观层面辨别出来的;与名义涌现不同,微观到宏观的推理路径并不简单。据 Bedau 所述,弱涌现的宏观属性在本体上依赖于并可还原为微观因果因素,但由于微观到宏观的推导路径复杂,导致在认识上无法轻易还原。 | | 弱涌现的概念介于强涌现和名义涌现之间<ref name="Bedau_weak_emergence" /><ref name="Bedau_downward_causation" />。在弱涌现中,宏观层面的属性来源于微观层面组成部分的相互作用,但这种相互作用非常复杂,以至于宏观属性无法简单地通过微观解释来得出。与强涌现不同,弱涌现的宏观属性原则上是可以从微观层面辨别出来的;与名义涌现不同,微观到宏观的推理路径并不简单。据 Bedau 所述,弱涌现的宏观属性在本体上依赖于并可还原为微观因果因素,但由于微观到宏观的推导路径复杂,导致在认识上无法轻易还原。 |
| | | |
第27行: |
第29行: |
| 本文提出了一个连续的弱涌现版本,认为宏观属性在多大程度上无法从微观层面观察中辨别,决定了其弱涌现的程度。这种变化之所以有价值,首先是因为对于许多系统来说,证明“只能通过模拟推导”可能并不现实;其次,从测量的角度来看,连续值比二元分类更有用。 | | 本文提出了一个连续的弱涌现版本,认为宏观属性在多大程度上无法从微观层面观察中辨别,决定了其弱涌现的程度。这种变化之所以有价值,首先是因为对于许多系统来说,证明“只能通过模拟推导”可能并不现实;其次,从测量的角度来看,连续值比二元分类更有用。 |
| | | |
− | =='''测量弱涌现'''== | + | =='''格兰杰涌现(G-涌现)方法'''== |
| 为了得出一种连续的弱涌现的测量方法,我从一个基本概念开始:一个弱涌现的宏观属性同时具备(i) 自主性和(ii) 对其底层因果因素的依赖性<ref name="Bedau_weak_emergence" />。为了将这一概念转化为统计学上的操作方法,我提出可以通过如下方式来衡量一个宏观变量<math>M</math>相对于一组微观变量<math>m</math>(其中 <math>(m = m_1, m_2, ..., m_N)</math>)的弱涌现程度:条件1:<math>M</math>的过去观测值能够比仅基于<math>m</math>的过去观测值更准确地预测<math>M</math>的未来观测值。条件2:<math>m</math>的过去观测值能够比仅基于<math>M</math>的过去观测值更准确地预测M的未来观测值。 | | 为了得出一种连续的弱涌现的测量方法,我从一个基本概念开始:一个弱涌现的宏观属性同时具备(i) 自主性和(ii) 对其底层因果因素的依赖性<ref name="Bedau_weak_emergence" />。为了将这一概念转化为统计学上的操作方法,我提出可以通过如下方式来衡量一个宏观变量<math>M</math>相对于一组微观变量<math>m</math>(其中 <math>(m = m_1, m_2, ..., m_N)</math>)的弱涌现程度:条件1:<math>M</math>的过去观测值能够比仅基于<math>m</math>的过去观测值更准确地预测<math>M</math>的未来观测值。条件2:<math>m</math>的过去观测值能够比仅基于<math>M</math>的过去观测值更准确地预测M的未来观测值。 |
| | | |
| 第一个条件提供了一个客观的度量标准,来衡量从微观到宏观的推导路径是否具有非平凡性;第二个条件则检验了从微观到宏观的因果依赖性。这个定义依赖于宏观和微观描述层次的选择,同时也依赖于预测方法的选择。正如后文所述,格兰杰<ref name="Granger_investigating_causal_relations">{{cite journal|author=Granger C|title=Investigating causal relations by econometric models and cross-spectral methods|journal=Econometrica|year=1969|volume=37|page=424–438}}</ref>最早提出的因果关系的统计定义,为这种预测提供了适当的框架,因此本文将这种测量方法称为G-涌现(G-emergence)。 | | 第一个条件提供了一个客观的度量标准,来衡量从微观到宏观的推导路径是否具有非平凡性;第二个条件则检验了从微观到宏观的因果依赖性。这个定义依赖于宏观和微观描述层次的选择,同时也依赖于预测方法的选择。正如后文所述,格兰杰<ref name="Granger_investigating_causal_relations">{{cite journal|author=Granger C|title=Investigating causal relations by econometric models and cross-spectral methods|journal=Econometrica|year=1969|volume=37|page=424–438}}</ref>最早提出的因果关系的统计定义,为这种预测提供了适当的框架,因此本文将这种测量方法称为G-涌现(G-emergence)。 |
| | | |
− | ==='''格兰杰因果'''=== | + | ==='''格兰杰因果测量'''=== |
| 1969年,Granger提出了“格兰杰因果”(Granger causality,简称G-causality)的概念,这是对Wiener直觉的形式化表达。Wiener的直觉是,如果知道变量<math>Y</math>有助于预测变量<math>X</math>的未来,那么我们就可以说<math>Y</math>“导致”了<math>X</math><ref name="Granger_investigating_causal_relations" /><ref name="Seth_granger_causality">{{cite journal|author=Seth A|title=Granger causality|journal=Scholarpedia|year=2007|volume=2|issue=7|page=1667}}</ref>。根据格兰杰因果关系,如果在一个包含<math>X</math>和<math>Y</math>的线性回归模型中,加入的<math>Y</math>过去观测值能够减少<math>X</math>的预测误差,相比于仅使用<math>X</math>的过去观测值的模型,那么可以被认为<math>Y</math>是导致了<math>X</math>。 | | 1969年,Granger提出了“格兰杰因果”(Granger causality,简称G-causality)的概念,这是对Wiener直觉的形式化表达。Wiener的直觉是,如果知道变量<math>Y</math>有助于预测变量<math>X</math>的未来,那么我们就可以说<math>Y</math>“导致”了<math>X</math><ref name="Granger_investigating_causal_relations" /><ref name="Seth_granger_causality">{{cite journal|author=Seth A|title=Granger causality|journal=Scholarpedia|year=2007|volume=2|issue=7|page=1667}}</ref>。根据格兰杰因果关系,如果在一个包含<math>X</math>和<math>Y</math>的线性回归模型中,加入的<math>Y</math>过去观测值能够减少<math>X</math>的预测误差,相比于仅使用<math>X</math>的过去观测值的模型,那么可以被认为<math>Y</math>是导致了<math>X</math>。 |
| | | |
第48行: |
第50行: |
| 其中,<math>\xi_{1R(12)}</math>是从省略了第一个方程中的 <math>A_{12,j}</math>(对所有 <math>j</math>)系数的模型中得出的,而<math> \xi_{1U} </math> 是从完整模型中得出的。重要的是,格兰杰因果关系很容易推广到多变量的情况,在这种情况下,检验的是在多个变量<math>X₂...Xₙ</math>的上下文中的格兰杰因果关系(对所有 <math>Xᵢ ≠ Xⱼ</math>)。在这种情况下,如果当所有其他变量 <math>X₃...Xₙ</math> 的活动也包含在回归模型中时,知道 <math>X₂</math> 会减少<math> X₁</math> 预测误差的方差,那么<math>X₂</math>对<math> X₁</math>具有格兰杰因果性(参见下文)。有关格兰杰因果关系的教程介绍,请参阅 Seth<ref name="Seth_granger_causality" />。 | | 其中,<math>\xi_{1R(12)}</math>是从省略了第一个方程中的 <math>A_{12,j}</math>(对所有 <math>j</math>)系数的模型中得出的,而<math> \xi_{1U} </math> 是从完整模型中得出的。重要的是,格兰杰因果关系很容易推广到多变量的情况,在这种情况下,检验的是在多个变量<math>X₂...Xₙ</math>的上下文中的格兰杰因果关系(对所有 <math>Xᵢ ≠ Xⱼ</math>)。在这种情况下,如果当所有其他变量 <math>X₃...Xₙ</math> 的活动也包含在回归模型中时,知道 <math>X₂</math> 会减少<math> X₁</math> 预测误差的方差,那么<math>X₂</math>对<math> X₁</math>具有格兰杰因果性(参见下文)。有关格兰杰因果关系的教程介绍,请参阅 Seth<ref name="Seth_granger_causality" />。 |
| | | |
− | ==='''格兰杰自主性'''=== | + | ==='''格兰杰自主性测量'''=== |
| 格兰杰因果关系的一个简单扩展允许对变量相对于其他变量集的“统计自主性”进行量化<ref name="Seth_measuring_autonomy">{{cite conference|author=Seth A|title=Measuring autonomy via multivariate autoregressive modelling|editor1=Almeida e Costa F|conference=Proceedings of the Ninth European Conference on Artificial Life|year=2007|page=475–485|publisher=Springer-Verlag}}</ref>。在这种情况下,我们不是询问通过包括 的过去观测是否减少了 的预测误差,而是询问在给定一组外部变量的情况下,通过包括自身的过去是否减少了它的预测误差。也就是说,变量的格兰杰自主性体现在其自身的过去状态在基于一组外部变量的过去状态的预测之外,是否有助于预测其未来状态。与格兰杰因果关系类似,相对于的格兰杰自主性定义为: | | 格兰杰因果关系的一个简单扩展允许对变量相对于其他变量集的“统计自主性”进行量化<ref name="Seth_measuring_autonomy">{{cite conference|author=Seth A|title=Measuring autonomy via multivariate autoregressive modelling|editor1=Almeida e Costa F|conference=Proceedings of the Ninth European Conference on Artificial Life|year=2007|page=475–485|publisher=Springer-Verlag}}</ref>。在这种情况下,我们不是询问通过包括 的过去观测是否减少了 的预测误差,而是询问在给定一组外部变量的情况下,通过包括自身的过去是否减少了它的预测误差。也就是说,变量的格兰杰自主性体现在其自身的过去状态在基于一组外部变量的过去状态的预测之外,是否有助于预测其未来状态。与格兰杰因果关系类似,相对于的格兰杰自主性定义为: |
| | | |
第57行: |
第59行: |
| 格兰杰自主性放大了“自我决定”这一自主性概念,与其他更为抽象的概念(如“组织封闭性”<ref name="Varela_principles_biological_autonomy">{{cite book|author=Varela F|title=Principles of biological autonomy|publisher=Elsevier|year=1979|location=North Holland, NY}}</ref>)形成对比。它与这样一种观点相一致,即(在行为上)自主的系统不应完全由其环境决定,且随机系统不应具有高度自主性 <ref name="Bertschinger_autonomy_information_theoretic_perspective">{{cite journal|author1=Bertschinger N|author2=Olbrich E|author3=Ay N|author4=Jost J|title=Autonomy: an information theoretic perspective|journal=Biosystems|year=2008}}</ref>。简而言之,变量的格兰杰自主性在于它依赖于自身的历史,而这些依赖关系不能通过外部因素来解释。之前我已表明,格兰杰自主性在简单模型系统中表现符合预期,并且可以作为进化适应的结果而增加<ref name="Seth_measuring_autonomy" />。 | | 格兰杰自主性放大了“自我决定”这一自主性概念,与其他更为抽象的概念(如“组织封闭性”<ref name="Varela_principles_biological_autonomy">{{cite book|author=Varela F|title=Principles of biological autonomy|publisher=Elsevier|year=1979|location=North Holland, NY}}</ref>)形成对比。它与这样一种观点相一致,即(在行为上)自主的系统不应完全由其环境决定,且随机系统不应具有高度自主性 <ref name="Bertschinger_autonomy_information_theoretic_perspective">{{cite journal|author1=Bertschinger N|author2=Olbrich E|author3=Ay N|author4=Jost J|title=Autonomy: an information theoretic perspective|journal=Biosystems|year=2008}}</ref>。简而言之,变量的格兰杰自主性在于它依赖于自身的历史,而这些依赖关系不能通过外部因素来解释。之前我已表明,格兰杰自主性在简单模型系统中表现符合预期,并且可以作为进化适应的结果而增加<ref name="Seth_measuring_autonomy" />。 |
| | | |
− | ==='''格兰杰涌现'''=== | + | ==='''线性格兰杰涌现测量'''=== |
| 在定义了格兰杰因果和格兰杰自主性之后,扩展到格兰杰涌现是直接的。当且仅当<math>M</math>对一组微观变量<math>m</math>是格兰杰自主的,且<math>M</math>由<math>m</math>引起时,宏观变量<math>M</math>被认为是从一组微观变量<math>m</math>中涌现的。因此,衡量<math>M</math>从<math>m</math>中的格兰杰涌现性的一个简单方法为: | | 在定义了格兰杰因果和格兰杰自主性之后,扩展到格兰杰涌现是直接的。当且仅当<math>M</math>对一组微观变量<math>m</math>是格兰杰自主的,且<math>M</math>由<math>m</math>引起时,宏观变量<math>M</math>被认为是从一组微观变量<math>m</math>中涌现的。因此,衡量<math>M</math>从<math>m</math>中的格兰杰涌现性的一个简单方法为: |
| | | |
第66行: |
第68行: |
| 在什么情况下格兰杰涌现性可能会很高?如果有“隐藏”或“潜在”的影响,即回归中未表现出来的相关微观因果因素,宏观变量可能从一组微观变量中涌现。然而,即使所有微观因果因素都存在,格兰杰涌现性仍可能因为依赖于所用的预测算法而产生。可以认为,事实上,为了在实践中有用,格兰杰涌现性是必要的,因为在某些情况下,宏观变量对预测算法来说比微观变量的集合更具有认识透明性。这也与Bedau的弱涌现性一致,在这种情况下,“除了通过模拟外不可导出”被格兰杰因果关系的“(不)可预测性”所取代。 | | 在什么情况下格兰杰涌现性可能会很高?如果有“隐藏”或“潜在”的影响,即回归中未表现出来的相关微观因果因素,宏观变量可能从一组微观变量中涌现。然而,即使所有微观因果因素都存在,格兰杰涌现性仍可能因为依赖于所用的预测算法而产生。可以认为,事实上,为了在实践中有用,格兰杰涌现性是必要的,因为在某些情况下,宏观变量对预测算法来说比微观变量的集合更具有认识透明性。这也与Bedau的弱涌现性一致,在这种情况下,“除了通过模拟外不可导出”被格兰杰因果关系的“(不)可预测性”所取代。 |
| | | |
| + | === '''非线性格兰杰涌现测量''' === |
| 对使用线性建模测量格兰杰涌现的一个明显批评是,一个宏观变量可能由于其是微观层面组件的非线性函数而表现为格兰杰涌现。因此,一个令人满意的涌现性度量不应依赖于线性方法未能检测到的非线性依赖性。幸运的是,扩展格兰杰因果关系(从而扩展格兰杰自主性和格兰杰涌现)到非线性情况是容易的,例如通过泰勒展开: | | 对使用线性建模测量格兰杰涌现的一个明显批评是,一个宏观变量可能由于其是微观层面组件的非线性函数而表现为格兰杰涌现。因此,一个令人满意的涌现性度量不应依赖于线性方法未能检测到的非线性依赖性。幸运的是,扩展格兰杰因果关系(从而扩展格兰杰自主性和格兰杰涌现)到非线性情况是容易的,例如通过泰勒展开: |
| | | |
第95行: |
第98行: |
| 值得注意的是,格兰杰涌现性的概念并不依赖于使用特定的非线性回归方法。还有其他更为复杂的方法比泰勒展开更不易受噪声观测的影响,并且涉及更少的参数。例如,Ancona等人<ref name="Ancona_nonlinear_granger">{{cite journal|author1=Ancona N|author2=Marinazzo D|author3=Stramaglia S|title=Radial basis function approaches to nonlinear granger causality of time series|journal=Physical Review E|year=2004|volume=70|issue=056221}}</ref>已经表明,径向基函数可以作为有效的回归核来测量非线性格兰杰因果关系。然而,出于当前的目的,泰勒方法是更可取的,因为(i)它简单易于描述和实施,(ii)统计显著性可以很容易地评估,以及(iii)它提供了格兰杰涌现性的明确公式(如公式 (4))。最后,注意格兰杰涌现性的值将取决于包含在 中的微观变量集。因此,在异质系统中,可以通过识别一个格兰杰涌现集,即能够最大化 的微观变量集。 | | 值得注意的是,格兰杰涌现性的概念并不依赖于使用特定的非线性回归方法。还有其他更为复杂的方法比泰勒展开更不易受噪声观测的影响,并且涉及更少的参数。例如,Ancona等人<ref name="Ancona_nonlinear_granger">{{cite journal|author1=Ancona N|author2=Marinazzo D|author3=Stramaglia S|title=Radial basis function approaches to nonlinear granger causality of time series|journal=Physical Review E|year=2004|volume=70|issue=056221}}</ref>已经表明,径向基函数可以作为有效的回归核来测量非线性格兰杰因果关系。然而,出于当前的目的,泰勒方法是更可取的,因为(i)它简单易于描述和实施,(ii)统计显著性可以很容易地评估,以及(iii)它提供了格兰杰涌现性的明确公式(如公式 (4))。最后,注意格兰杰涌现性的值将取决于包含在 中的微观变量集。因此,在异质系统中,可以通过识别一个格兰杰涌现集,即能够最大化 的微观变量集。 |
| | | |
− | =='''示例:群集行为'''== | + | =='''格兰杰涌现方法的应用示例'''== |
| | | |
| === 鸟群模拟=== | | === 鸟群模拟=== |
− |
| |
− |
| |
− |
| |
| 现在,我将展示在一个简单的计算模型中,格兰杰涌现性如何表现出适当的行为。如前所述,一个经典的属性涌现示例是鸟群中的群集行为。在人工生命的开创性工作中,Reynolds<ref name="Reynolds_flocks_herds_schools">{{cite conference|author=Reynolds C|title=Flocks, herds, and schools: A distributed behavioral model|conference=Computer Graphics|year=1987|volume=21|issue=4|page=25–34}}</ref>表明,通过为模拟的鸟(boids)组合三个简单规则,可以模拟出视觉上引人注目的鸟群集行为: | | 现在,我将展示在一个简单的计算模型中,格兰杰涌现性如何表现出适当的行为。如前所述,一个经典的属性涌现示例是鸟群中的群集行为。在人工生命的开创性工作中,Reynolds<ref name="Reynolds_flocks_herds_schools">{{cite conference|author=Reynolds C|title=Flocks, herds, and schools: A distributed behavioral model|conference=Computer Graphics|year=1987|volume=21|issue=4|page=25–34}}</ref>表明,通过为模拟的鸟(boids)组合三个简单规则,可以模拟出视觉上引人注目的鸟群集行为: |
| | | |
第127行: |
第127行: |
| '''图2:'''boid群的质心(CM)的格兰杰涌现性。左上角:不同条件下线性和非线性格兰杰涌现性的均值和标准差(星号表示统计显著性)。其他面板:在条件<math>H</math>(高格兰杰涌现性)、<math>L</math>(低格兰杰涌现性)和<math>R</math>(随机)下,boid(灰色)和CM(红色)的示例轨迹(500时间步片段)。 | | '''图2:'''boid群的质心(CM)的格兰杰涌现性。左上角:不同条件下线性和非线性格兰杰涌现性的均值和标准差(星号表示统计显著性)。其他面板:在条件<math>H</math>(高格兰杰涌现性)、<math>L</math>(低格兰杰涌现性)和<math>R</math>(随机)下,boid(灰色)和CM(红色)的示例轨迹(500时间步片段)。 |
| | | |
| + | === 鸟群涌现测量 === |
| 对于每个条件,boid模拟运行了25次,每次运行持续5000个时间步;在每次运行中,记录了每个boid的x和y坐标以及全局质心。在计算格兰杰涌现性之前,进行了几个预处理步骤。为了降低数据集的维度,并增强对边界效应的鲁棒性,将每对x和y坐标转换为反映环境中心距离的单个变量。前500个数据点被移除,以消除初始瞬态效应,结果得到的时间序列被转换为零均值的等效时间序列。最后,为了确保协方差平稳性<ref name="Seth_causal_connectivity_evolved_neural_networks">{{cite journal|author=Seth A|title=Causal connectivity of evolved neural networks during behavior|journal=Network: Computation in Neural Systems|year=2005|volume=16|issue=35–54}}</ref>,对每个时间序列进行了一级差分处理。预处理完成后,在每个条件下的每次运行中,使用最小二乘回归分别计算了CM的线性和非线性格兰杰涌现性。我选择了模型阶数<math>p = 5</math>和(用于非线性分析的)多项式阶数<math>q=3</math>。模型阶数是基于所有75次运行的平均Akaike信息准则<ref name="Seth_measuring_autonomy" />选定的。 | | 对于每个条件,boid模拟运行了25次,每次运行持续5000个时间步;在每次运行中,记录了每个boid的x和y坐标以及全局质心。在计算格兰杰涌现性之前,进行了几个预处理步骤。为了降低数据集的维度,并增强对边界效应的鲁棒性,将每对x和y坐标转换为反映环境中心距离的单个变量。前500个数据点被移除,以消除初始瞬态效应,结果得到的时间序列被转换为零均值的等效时间序列。最后,为了确保协方差平稳性<ref name="Seth_causal_connectivity_evolved_neural_networks">{{cite journal|author=Seth A|title=Causal connectivity of evolved neural networks during behavior|journal=Network: Computation in Neural Systems|year=2005|volume=16|issue=35–54}}</ref>,对每个时间序列进行了一级差分处理。预处理完成后,在每个条件下的每次运行中,使用最小二乘回归分别计算了CM的线性和非线性格兰杰涌现性。我选择了模型阶数<math>p = 5</math>和(用于非线性分析的)多项式阶数<math>q=3</math>。模型阶数是基于所有75次运行的平均Akaike信息准则<ref name="Seth_measuring_autonomy" />选定的。 |
| | | |
第140行: |
第141行: |
| '''图3:'''boid模型的参数空间。参数向量<math> \alpha_H</math> 由绿色线的交点表示。灰度显示全局CM的平均线性和非线性格兰杰涌现性。每个值是5000时间步的三次评估的平均值。红点表示导致时间序列可靠地非平稳的参数组合。 | | '''图3:'''boid模型的参数空间。参数向量<math> \alpha_H</math> 由绿色线的交点表示。灰度显示全局CM的平均线性和非线性格兰杰涌现性。每个值是5000时间步的三次评估的平均值。红点表示导致时间序列可靠地非平稳的参数组合。 |
| | | |
− | ==='''向下因果'''=== | + | ==='''鸟群向下因果测量'''=== |
| 一个关于涌现的普遍直觉是它涉及从宏观层面到微观层面的“向下”因果关系。对于强涌现的支持者来说,向下因果关系实际上是涌现本质的一个关键方面<ref name="Kim_making_sense_emergence" />。然而,向下因果关系的物理解释会引发复杂的形而上学问题,例如,如何解决微观和宏观因果之间的竞争<ref name="Bedau_downward_causation" />。格兰杰涌现性由于是统计定义的,提供了一种形而上学上无害的替代方案,其中向下因果关系反映为宏观变量对微观变量的格兰杰因果关系。 | | 一个关于涌现的普遍直觉是它涉及从宏观层面到微观层面的“向下”因果关系。对于强涌现的支持者来说,向下因果关系实际上是涌现本质的一个关键方面<ref name="Kim_making_sense_emergence" />。然而,向下因果关系的物理解释会引发复杂的形而上学问题,例如,如何解决微观和宏观因果之间的竞争<ref name="Bedau_downward_causation" />。格兰杰涌现性由于是统计定义的,提供了一种形而上学上无害的替代方案,其中向下因果关系反映为宏观变量对微观变量的格兰杰因果关系。 |
| | | |
第150行: |
第151行: |
| 图4展示了从全局质心到boid个体轨迹的向下(格兰杰)因果关系,涵盖了线性和非线性的格兰杰因果关系测量。在每个条件下,对所有boid和所有25次运行取平均值。与涌现与向下因果关系之间的关联一致,向下因果关系的两种测量在条件<math>H</math>下明显高于条件<math>R</math>或<math>L</math>。尽管有这一结果,原则上弱涌现似乎可能在没有向下因果关系的情况下发生(当然,强涌现按定义需要向下因果关系)。拥有可分别应用的弱涌现和向下因果关系的测量方法,使得探索涌现和向下因果关系不同时发生的条件(如果存在)成为可能,从而潜在地细化和深化了涌现的概念。 | | 图4展示了从全局质心到boid个体轨迹的向下(格兰杰)因果关系,涵盖了线性和非线性的格兰杰因果关系测量。在每个条件下,对所有boid和所有25次运行取平均值。与涌现与向下因果关系之间的关联一致,向下因果关系的两种测量在条件<math>H</math>下明显高于条件<math>R</math>或<math>L</math>。尽管有这一结果,原则上弱涌现似乎可能在没有向下因果关系的情况下发生(当然,强涌现按定义需要向下因果关系)。拥有可分别应用的弱涌现和向下因果关系的测量方法,使得探索涌现和向下因果关系不同时发生的条件(如果存在)成为可能,从而潜在地细化和深化了涌现的概念。 |
| | | |
− | =='''讨论'''== | + | =='''格兰杰涌现方法的局限性'''== |
| 在本文中,我介绍了一种通过物理测量来检测系统中弱涌现程度的方法。由于该方法基于因果关系的统计解释,它规避了微观和宏观因果关系之间的竞争等概念上的难题,同时为微观到宏观推理路径的复杂性提供了客观且分级的评估方法。作者在个人网站上提供了用于计算G-涌现的 MATLAB 代码,适用于任意时间序列数据。 | | 在本文中,我介绍了一种通过物理测量来检测系统中弱涌现程度的方法。由于该方法基于因果关系的统计解释,它规避了微观和宏观因果关系之间的竞争等概念上的难题,同时为微观到宏观推理路径的复杂性提供了客观且分级的评估方法。作者在个人网站上提供了用于计算G-涌现的 MATLAB 代码,适用于任意时间序列数据。 |
| | | |
− | ==='''历时涌现'''=== | + | ==='''历时涌现问题'''=== |
| 历时涌现(或称为时间涌现,Diachronic emergence)指的是随着时间推移,系统中出现新的属性,比如进化或发育过程中的变化。历时涌现的过程本质上是统计上不稳定的,因此不能直接用 G-涌现来测量。然而,我们可以假设历时涌现的过程由不同的、统计上稳定的时间段构成,而这些时间段有着不同的 G-涌现特性。通过这种方式,G-涌现可以间接推断出历时涌现的存在。 | | 历时涌现(或称为时间涌现,Diachronic emergence)指的是随着时间推移,系统中出现新的属性,比如进化或发育过程中的变化。历时涌现的过程本质上是统计上不稳定的,因此不能直接用 G-涌现来测量。然而,我们可以假设历时涌现的过程由不同的、统计上稳定的时间段构成,而这些时间段有着不同的 G-涌现特性。通过这种方式,G-涌现可以间接推断出历时涌现的存在。 |
| | | |
− | ==='''与其他测量方法的关系'''=== | + | ==='''相变问题'''=== |
| + | 近年来,物理学家开始对boid 模型中的自驱动粒子集体行为产生了兴趣<ref name="Vicsek_novel_type_phase_transition">{{cite journal|author1=Vicsek T|author2=Czirok A|author3=Ben-Jacob E|author4=Cohen I|author5=Shochet O|title=Novel type of phase transition in a system of self-driven particles|journal=Physical Review Letters|year=1995|volume=75|issue=1226}}</ref><ref name="Edelman_naturalizing_consciousness">{{cite journal|author=Edelman G|title=Naturalizing consciousness: A theoretical framework|journal=Proceedings of the National Academy of Sciences, USA|year=2003|volume=100|issue=9|page=5520–5524}}</ref>。在这些系统中,可以观察到从“气态”相(每个粒子独立运动)、“液态”相(粒子集体移动但相对彼此仍有扩散)、到“固态”相(粒子集体移动并彼此保持固定)等相变(Phase transitions)。这些相变可能分别对应于本文模型中的 <math>R</math>、<math>H</math> 和<math> L</math> 条件,图3中的边界可能代表了相变。不过,相变分析更侧重于转变的动态过程,并假定涌现行为在某些相中显而易见,而在其他相中不存在。相比之下,本文重点在于通过物理测量检测涌现程度。 |
| + | |
| + | =='''与其他测量方法的关系'''== |
| + | |
| + | === 宏观预测 === |
| 有学者<ref name="Shalizi_macrostate">{{cite journal|author1=Shalizi C|author2=Moore C|title=What is a macrostate: Subjective observations and objective dynamics|year=2006|url=http://arxiv.org/abs/cond-mat/0303625}}</ref>认为,预测能力的差异在定义宏观层次属性时可能至关重要。不过,他们的研究主要聚焦于澄清宏观状态的概念,而不是明确结合自主性和因果依赖的测量。相比之下,他们的预测效率测量是基于信息理论模型重构的,虽然很强大,但在实际应用中比本文提到的时间序列度量更复杂。类似的,Polani<ref name="Polani_emergence_intrinsic_structure_information">{{cite journal|author=Polani D|title=Emergence, intrinsic structure of information, and agenthood|journal=Interjournal Complex Systems|year=2006|page=1973}}</ref>提出的“涌现描述”还进一步涉及将系统分解为独立的信息子成分。 | | 有学者<ref name="Shalizi_macrostate">{{cite journal|author1=Shalizi C|author2=Moore C|title=What is a macrostate: Subjective observations and objective dynamics|year=2006|url=http://arxiv.org/abs/cond-mat/0303625}}</ref>认为,预测能力的差异在定义宏观层次属性时可能至关重要。不过,他们的研究主要聚焦于澄清宏观状态的概念,而不是明确结合自主性和因果依赖的测量。相比之下,他们的预测效率测量是基于信息理论模型重构的,虽然很强大,但在实际应用中比本文提到的时间序列度量更复杂。类似的,Polani<ref name="Polani_emergence_intrinsic_structure_information">{{cite journal|author=Polani D|title=Emergence, intrinsic structure of information, and agenthood|journal=Interjournal Complex Systems|year=2006|page=1973}}</ref>提出的“涌现描述”还进一步涉及将系统分解为独立的信息子成分。 |
| | | |
− | 根据 Atmanspacher<ref name="Atmanspacher_contextual_emergence">{{cite journal|author=Atmanspacher H|title=Contextual emergence from physics to cognitive neuroscience|journal=Journal of consciousness studies|year=2007|volume=14|issue=18–36}}</ref>提出的“情境涌现”(contextual emergence),推导宏观属性需要结合微观属性和特定情境条件(这些条件通过动力系统分析中的稳定性标准来定义)。这一概念不同于因果基础论,它表明微观属性只是推导宏观属性的必要但非充分条件,这暗示了强涌现的存在。Bar-Yam<ref name="Bar-Yam_mathematical_theory_strong_emergence">{{cite journal|author=Bar-Yam Y|title=A mathematical theory of strong emergence using multiscale variety|journal=Complexity|year=2004|volume=9|issue=6|page=15–24}}</ref>提出了一种测量强涌现的方法,基于在多尺度上测量系统的熵。多尺度多样性的波动被认为揭示了不同变量值之间的约束,而这些约束在单独的变量中不存在,且被认为是强涌现的标志。然而,考虑到强涌现本质上拒绝机械解释,全面分析 Bar-Yam 的测量方法超出了本文的讨论范围。 | + | === 情境涌现 === |
| + | 根据 Atmanspacher<ref name="Atmanspacher_contextual_emergence">{{cite journal|author=Atmanspacher H|title=Contextual emergence from physics to cognitive neuroscience|journal=Journal of consciousness studies|year=2007|volume=14|issue=18–36}}</ref>提出的“情境涌现”(contextual emergence),推导宏观属性需要结合微观属性和特定情境条件(这些条件通过动力系统分析中的稳定性标准来定义)。这一概念不同于因果基础论,它表明微观属性只是推导宏观属性的必要但非充分条件,这暗示了强涌现的存在。 |
| | | |
− | ==='''相变'''=== | + | === 多尺度系统熵 === |
− | 近年来,物理学家开始对boid 模型中的自驱动粒子集体行为产生了兴趣<ref name="Vicsek_novel_type_phase_transition">{{cite journal|author1=Vicsek T|author2=Czirok A|author3=Ben-Jacob E|author4=Cohen I|author5=Shochet O|title=Novel type of phase transition in a system of self-driven particles|journal=Physical Review Letters|year=1995|volume=75|issue=1226}}</ref><ref name="Edelman_naturalizing_consciousness">{{cite journal|author=Edelman G|title=Naturalizing consciousness: A theoretical framework|journal=Proceedings of the National Academy of Sciences, USA|year=2003|volume=100|issue=9|page=5520–5524}}</ref>。在这些系统中,可以观察到从“气态”相(每个粒子独立运动)、“液态”相(粒子集体移动但相对彼此仍有扩散)、到“固态”相(粒子集体移动并彼此保持固定)等相变(Phase transitions)。这些相变可能分别对应于本文模型中的 <math>R</math>、<math>H</math> 和<math> L</math> 条件,图3中的边界可能代表了相变。不过,相变分析更侧重于转变的动态过程,并假定涌现行为在某些相中显而易见,而在其他相中不存在。相比之下,本文重点在于通过物理测量检测涌现程度。
| + | Bar-Yam<ref name="Bar-Yam_mathematical_theory_strong_emergence">{{cite journal|author=Bar-Yam Y|title=A mathematical theory of strong emergence using multiscale variety|journal=Complexity|year=2004|volume=9|issue=6|page=15–24}}</ref>提出了一种测量强涌现的方法,基于在多尺度上测量系统的熵。多尺度多样性的波动被认为揭示了不同变量值之间的约束,而这些约束在单独的变量中不存在,且被认为是强涌现的标志。然而,考虑到强涌现本质上拒绝机械解释,全面分析 Bar-Yam 的测量方法超出了本文的讨论范围。 |
| | | |
− | ==='''强涌现与意识'''===
| + | =='''在意识与强涌现领域的潜在应用'''== |
| 如前所述,强涌现与弱涌现有根本的不同,强涌现的属性被认为是无法从其微观成分中还原的,并且对这些微观成分产生向下的因果影响<ref name="Kim_emergence_core_ideas_issues">{{cite journal|author=Kim J|title=Emergence: core ideas and issues|journal=Synthese|year=2006|volume=151|issue=547–559}}</ref>。因此,强涌现给科学带来了极大的挑战,因为它暗示了世界上存在一些无法通过已知物理相互作用解释的真实属性。 | | 如前所述,强涌现与弱涌现有根本的不同,强涌现的属性被认为是无法从其微观成分中还原的,并且对这些微观成分产生向下的因果影响<ref name="Kim_emergence_core_ideas_issues">{{cite journal|author=Kim J|title=Emergence: core ideas and issues|journal=Synthese|year=2006|volume=151|issue=547–559}}</ref>。因此,强涌现给科学带来了极大的挑战,因为它暗示了世界上存在一些无法通过已知物理相互作用解释的真实属性。 |
| | | |
第173行: |
第180行: |
| 相比之下,神经机制与意识体验之间的联系很可能在许多方面涉及弱涌现。意识体验的一个显著特征是,它看起来像是某种“整体大于部分之和”的现象(每个意识体验都是一个整体),并且具有鲜明的时间流动感(William James 的“意识流”)。可以用弱涌现分析的意识模型因此有可能通过神经机制层面的动态过程来解释意识现象的特征。开发和实验测试这样的“解释关联”(explanatory correlates)<ref name="Seth_consciousness_complexity" />是科学描述意识的一个非常有前途的方向。考虑到弱涌现的测量方法最终可能用于解释自由意志,并帮助弥合神经机制与现象体验之间的解释鸿沟,这是令人兴奋的。 | | 相比之下,神经机制与意识体验之间的联系很可能在许多方面涉及弱涌现。意识体验的一个显著特征是,它看起来像是某种“整体大于部分之和”的现象(每个意识体验都是一个整体),并且具有鲜明的时间流动感(William James 的“意识流”)。可以用弱涌现分析的意识模型因此有可能通过神经机制层面的动态过程来解释意识现象的特征。开发和实验测试这样的“解释关联”(explanatory correlates)<ref name="Seth_consciousness_complexity" />是科学描述意识的一个非常有前途的方向。考虑到弱涌现的测量方法最终可能用于解释自由意志,并帮助弥合神经机制与现象体验之间的解释鸿沟,这是令人兴奋的。 |
| | | |
− | =='''结论'''== | + | ==总结== |
| 理解现象的科学进展依赖于是否能够对其进行测量。到目前为止,“涌现”一直难以发展出有用的测量方法,可能是因为人们怀疑涌现必然违反机械或还原论的解释。然而,这种怀疑仅适用于强涌现,且强涌现的测量方法往往难以应用和解释<ref name="Bar-Yam_mathematical_theory_strong_emergence" />。在本文中,我提出并展示了一种量化、直观且实际可操作的弱涌现测量方法。G-涌现基于这样一种直观想法,即涌现属性既依赖于其组成部分,又具有一定的自主性<ref name="Bedau_weak_emergence" />,并通过线性和非线性时间序列分析进行了操作。 | | 理解现象的科学进展依赖于是否能够对其进行测量。到目前为止,“涌现”一直难以发展出有用的测量方法,可能是因为人们怀疑涌现必然违反机械或还原论的解释。然而,这种怀疑仅适用于强涌现,且强涌现的测量方法往往难以应用和解释<ref name="Bar-Yam_mathematical_theory_strong_emergence" />。在本文中,我提出并展示了一种量化、直观且实际可操作的弱涌现测量方法。G-涌现基于这样一种直观想法,即涌现属性既依赖于其组成部分,又具有一定的自主性<ref name="Bedau_weak_emergence" />,并通过线性和非线性时间序列分析进行了操作。 |
| | | |