格兰杰因果关系

来自集智百科 - 复杂系统|人工智能|复杂科学|复杂网络|自组织
跳到导航 跳到搜索
当时间序列X可以作为格兰杰原因引起时间序列Y时,X中的模式在经过一段时间迟滞后与Y大致重复(两个示例用箭头表示)。因此,X的过去值可用于预测Y的未来值。

格兰杰因果关系 (Granger causality)格兰杰因果关系检测是一种统计假设检验方法,用于确定一个时间序列是否可以用来预测另一个时间序列,于1969年首次提出。[1] 一般来说,回归反映的是“纯粹的”相关性,但克莱夫 · 格兰杰 Clive Granger认为,可以通过衡量使用一个时间序列的先验值来预测另一个时间序列未来值的能力来检验经济学中的因果关系。由于“真正因果关系”的问题是一个深刻的哲学问题,并且存在着后此谬误(后发者因此而发)的问题,即:因为A先于B,所以A引起B这种假设本身存在着谬误,因此计量经济学者断言格兰杰因果检验只能发现“预测因果关系”。[2]


时间序列X可以作为格兰杰原因 Granger-cause引起时间序列Y,通常当且仅当通过对[math]\displaystyle{ X }[/math]的滞后值(包括[math]\displaystyle{ Y }[/math]的滞后值)进行一系列t检验和F检验之后,这些[math]\displaystyle{ X }[/math]值可以提供关于[math]\displaystyle{ Y }[/math]的未来值的显著统计信息。


格兰杰本人还强调,在经济学以外的领域,有一些研究使用“格兰杰因果关系”检验得出了“荒谬”的结论。 他在诺贝尔奖演讲中说道:“当然,出现了许多荒谬的论文。”。 [3] 然而,由于计算简单,格兰杰因果关系检验仍然是时间序列因果关系分析的一种常用方法。格兰杰因果关系的原始定义没有考虑到潜在的混杂效应,也没有捕捉到瞬时的和非线性的因果关系,不过现在已经提出了几种扩展方法来解决这些问题。[4]


问题思路

我们认为,在预测Y值时,如果综合使用Y和X的过去值优于仅使用Y的过去值,则随时间演化的变量X可以导致另一个演化变量Y。


基本原则

格兰杰基于两个原则定义了因果关系:[4][5]

  1. 自变量发生在因变量之前。
  2. 这一自变量对于被其影响的因变量的未来值有着独特的信息。


鉴于这两个关于因果关系的假设,格兰杰提出了如下假说,用来衡量[math]\displaystyle{ 𝑋 }[/math][math]\displaystyle{ 𝑌 }[/math]的因果影响:

[math]\displaystyle{ \mathbb{P}[Y(t+1) \in A\mid \mathcal{I}(t)] \neq \mathbb{P}[Y(t+1) \in A\mid \mathcal{I}_{-X}(t)], }[/math]


其中[math]\displaystyle{ \mathbb{P} }[/math]是概率,[math]\displaystyle{ 𝐴 }[/math]是任意的非空集合,[math]\displaystyle{ \mathcal{I}(t) }[/math][math]\displaystyle{ \mathcal{I}_x(t) }[/math]分别表示整个宇宙中截止到时间[math]\displaystyle{ 𝑡 }[/math]的可用信息和排除了[math]\displaystyle{ 𝑋 }[/math]的修正宇宙中的可用信息。如果上述假设成立,我们可以说[math]\displaystyle{ X }[/math][math]\displaystyle{ Y }[/math]的格兰杰原因([math]\displaystyle{ X }[/math]可以格兰杰引起[math]\displaystyle{ Y }[/math])。

格兰杰因果分析方法

如果时间序列是平稳过程,则使用两个(或更多)变量的水平值执行测试。如果变量是非平稳的,则使用一阶差分(或高阶差分)进行测试。通常使用信息准则来选择要包含的滞后数,例如赤池信息量准则 the Akaike information criterion施瓦兹信息准则the Schwarz information criterion。当满足以下条件时,变量之一的任意特定滞后值在回归中被保留,即(1)根据t检验 t-test它是显著的,并且(2)根据F检验 F-test ,它和变量的其他滞后值共同增加了模型的解释力。只有当且仅当回归中没有保留解释变量的滞后值时,才不否定无格兰杰因果关系的零假设。


实践中可能会出现两个变量均不互为格兰杰原因,或两个变量均互为格兰杰原因的情况。


数学表述

[math]\displaystyle{ y }[/math][math]\displaystyle{ x }[/math]均为平稳时间序列。为了检验[math]\displaystyle{ x }[/math]不是[math]\displaystyle{ y }[/math]的格兰杰原因这一零假设,首先要[math]\displaystyle{ y }[/math]的适当滞后值,以包含在[math]\displaystyle{ y }[/math]的单变量自回归中:

[math]\displaystyle{ y_t = a_0 + a_1y_{t-1} + a_2y_{t-2} + \cdots + a_my_{t-m} + \text{error}_t. }[/math]


接下来,使用包含[math]\displaystyle{ x }[/math]的滞后值来扩展这一自回归:

[math]\displaystyle{ y_t = a_0 + a_1y_{t-1} + a_2y_{t-2} + \cdots + a_my_{t-m} + b_px_{t-p} + \cdots + b_qx_{t-q} + \text{error}_t. }[/math]


在这个回归中,保留了根据t统计量所有单个显著的[math]\displaystyle{ x }[/math]的滞后值,前提是根据F检验,它们共同增加了回归的解释力(F检验的零假设不是x联合增加的解释力)。 在上述增广回归的式子中,对于显著的[math]\displaystyle{ x }[/math]的滞后值,[math]\displaystyle{ p }[/math]是最短的滞后期,[math]\displaystyle{ q }[/math]是最长的滞后期。


当且仅当回归中没有保留[math]\displaystyle{ x }[/math]的滞后值时,[math]\displaystyle{ x }[/math]不是[math]\displaystyle{ y }[/math]的格兰杰原因的零假设被接受。


多元分析

多元格兰杰因果关系分析通常是通过对时间序列拟合一个向量自回归模型 VAR来完成的。特别地,对 [math]\displaystyle{ t=1, \ldots, T }[/math] 是一个 [math]\displaystyle{ d }[/math] 维多元时间序列,设 [math]\displaystyle{ X(t) \in \mathbb{R}^{d\times 1} }[/math] 。格兰杰因果关系可以通过拟合一个带[math]\displaystyle{ L }[/math] 时滞的 VAR 模型来执行:

[math]\displaystyle{ X(t) = \sum_{\tau=1}^L A_{\tau}X(t-\tau) + \varepsilon(t), }[/math]


其中,[math]\displaystyle{ 𝜀(t) }[/math] 是一个白高斯随机向量 white Gaussian random vector[math]\displaystyle{ A_\tau }[/math] 是每个 [math]\displaystyle{ \tau }[/math] 的矩阵。如果其中至少一个元素 [math]\displaystyle{ A_{\tau}(j, i) }[/math] 对于 [math]\displaystyle{ \tau = 1, \ldots, L }[/math] (绝对值)显著大于零,则时间序列 [math]\displaystyle{ X_i }[/math] 被称为另一个时间序列 [math]\displaystyle{ X_j }[/math] 的格兰杰原因。[6]


非参数检验

上述线性的方法适用于检验格兰杰因果关系的均值。但是,这种方法无法在高阶矩中检测格兰杰因果关系,例如方差。格兰杰因果关系的非参数检验就是为了解决这个问题而设计的。[7]这些检验中的格兰杰因果关系为一般定义,不涉及任何建模假设,如线性自回归模型。格兰杰因果关系的非参数检验可以作为诊断工具,用来建立包括高阶矩和/或非线性的更优参数模型。[8]

局限性

顾名思义,格兰杰因果关系并不一定是真正的因果关系。实际上,格兰杰因果关系检验只能满足休谟因果关系定义,而休谟定义用经常性联结来定义因果关系。[9]如果,[math]\displaystyle{ x }[/math][math]\displaystyle{ y }[/math]都是由具有不同滞后的共同第三过程驱动的,人们可能仍然无法拒绝格兰杰因果关系的备择假设。然而,操纵其中一个变量不会改变另一个变量。实际上,格兰杰因果检验是为了处理成对变量而设计的,当真实关系涉及三个或更多变量时,还可能会产生误导性的结果。尽管如此,有人认为,考虑原因的概率视角的话,格兰杰因果关系仍然可以被认为是真正的因果关系,特别是当考虑到赖欣巴哈的概率因果关系中的“屏蔽”概念时。[10] 其他可能导致产生误导检验结果的原因有:

  1. 采样不够频繁或过于频繁;
  2. 非线性因果关系
  3. 时间序列的非平稳性和非线性
  4. 理性预期的存在。

一个包含更多变量的类似检验可以应用向量自回归


扩展

从误差项是正态分布的假设中,发展出了一种对偏差不敏感的格兰杰因果关系分析方法。[11] 由于许多金融变量是非正态分布的,因此这种方法在金融经济学中有着很大的用处。[12] 最近,文献中提出了非对称因果关系检验,以区分积极变化和消极变化的因果影响。[13] 同时,格兰杰(非)因果关系检验在面板数据上的扩展也是可行的。[14]


在神经科学领域

关于神经功能的一个长期观念认为,大脑的不同区域是用来执行特定任务的;与特定区域局部的结构性连结以某种方式决定了该部分的功能。通过收集多年来完成的工作,已经有了一种不同的、以网络为中心的方法来描述大脑中的信息流。对功能的解释开始包括在大脑不同层次和不同位置存在的网络这一概念。[15] 这些网络的行为可以用随时间演化的非确定性过程来描述。也就是说,给定相同的输入刺激,网络的输出会是不同的。这些网络的动态是由概率控制的,所以我们把它们当作随机过程,这样我们就可以捕捉到大脑不同区域之间的这种动态。


过去人们曾探索过从神经元及其周围集合的放电活动中获得某种信息流度量的不同方法,但是这些方法可以得出的结论种类有限,对信息的方向性流动、其影响大小以及它如何随时间变化提供的见解很少。[16] 最近,格兰杰因果关系已经应用于解决其中一些问题,并取得了巨大成功。[17] 简单地说,就是研究如何最好地预测一个神经元的未来:要么使用整个神经元集合,要么使用除了某个目标神经元之外的整个集合。如果把目标神经元排除在外使预测变得更糟,那么我们说它与当前神经元存在“g-因果”关系。


点过程模型的扩展

以往的格兰杰因果关系分析方法只能对连续值数据进行分析,因此对神经尖峰序列 neural spike train记录的分析涉及到了转换,这些转换最终改变了数据的随机属性,从而间接地改变了由此得出的结论的有效性。 然而,在2011年,一个新的通用格兰杰因果关系框架被提出,使用这种框架可以直接操作任何模态,包括神经尖峰序列。[16]


神经尖峰序列数据可以被建模为一个点过程 Point process。时间点过程是一个连续时间内发生的二元事件的随机时间序列。它只能在每个时间点采用两个值,表示事件是否实际发生。由于单个神经元的动作电位具有典型的波形,这种信息的二值表示形式适合于神经元集群的活动。通过这种方式,携带从神经元输出的实际信息是“尖峰”的出现,以及连续尖峰之间的时间。利用这种方法,可以将神经网络中的信息流简单概括为每个神经元在一个观察周期内的峰值时间。点进程可以用尖峰本身的计时,尖峰之间的等待时间以及使用计数过程来表示,或者,如果时间离散到足以确保每个空当只有一个事件有可能发生,即,一个时间段只能包含一个事件,作为1和0的集合,也可以被表示为非常类似于二进制的方式。


最简单的神经尖峰模型之一是泊松过程 Poisson process。然而,这是有限的,因为它是无记忆性的。在计算当前的放电概率时,它不考虑任何峰值历史。然而,神经元通过其相对和绝对不应期表现出基本的(生物物理)历史依赖性。为了解决这个问题,一个条件强度函数被用来表示一个神经元在其历史条件下出现尖峰的概率。条件强度函数表示瞬时放电概率,并隐式定义点过程的完整概率模型。它定义了每个单位时间的概率。因此,如果这个单位时间足够小,以确保在那个时间窗口中只能发生一个尖峰,那么我们的条件强度函数完全指定了一个给定神经元在一定时间内放电的概率。


参阅


参考文献

  1. Granger, C. W. J. (1969). "Investigating Causal Relations by Econometric Models and Cross-spectral Methods". Econometrica. 37 (3): 424–438. doi:10.2307/1912791. JSTOR 1912791.
  2. Diebold, Francis X. (2001). Elements of Forecasting (2nd ed.). Cincinnati: South Western. p. 254. ISBN 978-0-324-02393-0. 
  3. Granger, Clive W. J (2004). "Time Series Analysis, Cointegration, and Applications" (PDF). American Economic Review. 94 (3): 421–425. CiteSeerX 10.1.1.370.6488. doi:10.1257/0002828041464669. Retrieved 12 June 2019.
  4. 4.0 4.1 Eichler, Michael (2012). "Causal Inference in Time Series Analysis". In Berzuini, Carlo. Causality : statistical perspectives and applications (3rd ed.). Hoboken, N.J.: Wiley. pp. 327–352. ISBN 978-0470665565. http://researchers-sbe.unimaas.nl/michaeleichler/wp-content/uploads/sites/31/2014/02/causalstatistics.pdf. 
  5. Granger, C.W.J. (1980). "Testing for causality: A personal viewpoint". Journal of Economic Dynamics and Control. 2: 329–352. doi:10.1016/0165-1889(80)90069-X.
  6. Lütkepohl, Helmut (2005). New introduction to multiple time series analysis (3 ed.). Berlin: Springer. pp. 41–51. ISBN 978-3540262398. 
  7. Diks, Cees; Panchenko, Valentyn (2006). "A new statistic and practical guidelines for nonparametric Granger causality testing" (PDF). Journal of Economic Dynamics and Control. 30 (9): 1647–1669. doi:10.1016/j.jedc.2005.08.008.
  8. Francis, Bill B.; Mougoue, Mbodja; Panchenko, Valentyn (2010). "Is there a Symmetric Nonlinear Causal Relationship between Large and Small Firms?" (PDF). Journal of Empirical Finance. 17 (1): 23–28. doi:10.1016/j.jempfin.2009.08.003.
  9. Mariusz, Maziarz (2015-05-20). "A review of the Granger-causality fallacy". The Journal of Philosophical Economics: Reflections on Economic and Social Issues (in English). VIII. (2). ISSN 1843-2298.
  10. Mannino, Michael; Bressler, Steven L (2015). "Foundational perspectives on causality in large-scale brain networks". Physics of Life Reviews. 15: 107–23. Bibcode:2015PhLRv..15..107M. doi:10.1016/j.plrev.2015.09.002. PMID 26429630.
  11. Hacker, R. Scott; Hatemi-j, A. (2006). "Tests for causality between integrated variables using asymptotic and bootstrap distributions: Theory and application". Applied Economics. 38 (13): 1489–1500. doi:10.1080/00036840500405763.
  12. Mandelbrot, Benoit (1963). "The Variation of Certain Speculative Prices". The Journal of Business. 36 (4): 394–419. doi:10.1086/294632.
  13. Hatemi-j, A. (2012). "Asymmetric causality tests with an application". Empirical Economics. 43: 447–456. doi:10.1007/s00181-011-0484-x.
  14. Dumistrescu, E.-I.; Hurlin, C. (2012). "Testing for Granger non-causality in heterogeneous panels". Economic Modelling. 29 (4): 1450–1460. CiteSeerX 10.1.1.395.568. doi:10.1016/j.econmod.2012.02.014.
  15. Knight, R. T (2007). "NEUROSCIENCE: Neural Networks Debunk Phrenology". Science. 316 (5831): 1578–9. doi:10.1126/science.1144677. PMID 17569852.
  16. 16.0 16.1 Kim, Sanggyun; Putrino, David; Ghosh, Soumya; Brown, Emery N (2011). "A Granger Causality Measure for Point Process Models of Ensemble Neural Spiking Activity". PLoS Computational Biology. 7 (3): e1001110. Bibcode:2011PLSCB...7E1110K. doi:10.1371/journal.pcbi.1001110. PMC 3063721. PMID 21455283.
  17. Bressler, Steven L; Seth, Anil K (2011). "Wiener–Granger Causality: A well established methodology". NeuroImage. 58 (2): 323–9. doi:10.1016/j.neuroimage.2010.02.059. PMID 20202481.


扩展阅读


编者推荐

格兰杰计量经济学文集封面
格兰杰是最具创造力的现代计量经济学家之一,他对帮助我们理解因果关系、建模方法、非平稳性、季节性和预测做出了重要的贡献。一些被广泛应用的时间序列计量经济学概念就来自于他的研究成果,这是因为格兰杰善于将观测到的经济结果系统地用模型来表述,而且这些模型很好地反映了经济体复杂和进化的本质,这本书收录了他发表过的作品,而且把主要主题下相关联的研究集合到一起,这样便更容易找到相关的论文,里面的很多文章值得我们认真反复研读。


在现代科学之前,无论东西方,都是从经验出发,通过归纳获得知识,而这样的知识,导致于观察,无法产生突破性的成果。而现代科学是先根据事实假设模型,再使用数据去验证模型。即先假设因果关系是存在的,考察再在特定场景下该如何量化的因果关系的强弱程度。本文则是对因果推测方法的一篇概述。


这篇博文的讲述主要围绕格兰杰因果关系的原理、标准化流程、变种及其应用领域、怎样用代码实现等几个方面进行。



本中文词条由Yillia Jing编译,苏格兰审校,乐多多编辑,欢迎在讨论页面留言。


本词条内容源自wikipedia及公开资料,遵守 CC3.0协议。