更改

跳到导航 跳到搜索
添加6字节 、 2020年10月18日 (日) 17:18
无编辑摘要
第30行: 第30行:     
== Definitions 定义 ==
 
== Definitions 定义 ==
  −
      
=== Definition of heavy-tailed distribution 重尾分布的定义 ===
 
=== Definition of heavy-tailed distribution 重尾分布的定义 ===
  −
      
The distribution of a [[random variable]] ''X'' with [[cumulative distribution function|distribution function]] ''F'' is said to have a heavy (right) tail if the [[moment generating function]] of ''X'', ''M<sub>X</sub>''(''t''), is infinite for all ''t''&nbsp;>&nbsp;0.<ref name="ReferenceA">Rolski, Schmidli, Scmidt, Teugels, ''Stochastic Processes for Insurance and Finance'', 1999</ref>
 
The distribution of a [[random variable]] ''X'' with [[cumulative distribution function|distribution function]] ''F'' is said to have a heavy (right) tail if the [[moment generating function]] of ''X'', ''M<sub>X</sub>''(''t''), is infinite for all ''t''&nbsp;>&nbsp;0.<ref name="ReferenceA">Rolski, Schmidli, Scmidt, Teugels, ''Stochastic Processes for Insurance and Finance'', 1999</ref>
第125行: 第121行:     
所有长尾分布都是重尾分布,但反之不一定,事实是可以构造出非长尾分布的重尾分布。
 
所有长尾分布都是重尾分布,但反之不一定,事实是可以构造出非长尾分布的重尾分布。
 +
 +
    
=== Subexponential distributions 次指数分布 ===
 
=== Subexponential distributions 次指数分布 ===
第196行: 第194行:     
所有次指数分布都是长尾分布,但可以构造非次指数分布的长尾分布示例。
 
所有次指数分布都是长尾分布,但可以构造非次指数分布的长尾分布示例。
 +
 +
    
== Common heavy-tailed distributions 常见的重尾分布 ==
 
== Common heavy-tailed distributions 常见的重尾分布 ==
第285行: 第285行:     
其中<math>X_{(n-k(n)+1,n)}=\max \left(X_{n-k(n)+1},\ldots  ,X_{n}\right)</math>。 此估计量的概率收敛到<math>\xi</math>。
 
其中<math>X_{(n-k(n)+1,n)}=\max \left(X_{n-k(n)+1},\ldots  ,X_{n}\right)</math>。 此估计量的概率收敛到<math>\xi</math>。
        第307行: 第306行:     
其中<math>X_{(i,n)}</math>是<math>X_1, \dots, X_n</math>的i阶统计量。该估计量收敛于<math>\xi</math>的概率,并且当<math>k(n) \to \infty  </math>基于较高阶的正则变化性质受到限制时,它是渐近正态的。一致性和渐近正态性适用于一大类相关序列和异类序列,它与是否观测到<math>X_t</math>无关,也无关于是否从大量模型和估计量(包括错误指定的模型和具有相关误差的模型)中计算出的残差或滤波数据。
 
其中<math>X_{(i,n)}</math>是<math>X_1, \dots, X_n</math>的i阶统计量。该估计量收敛于<math>\xi</math>的概率,并且当<math>k(n) \to \infty  </math>基于较高阶的正则变化性质受到限制时,它是渐近正态的。一致性和渐近正态性适用于一大类相关序列和异类序列,它与是否观测到<math>X_t</math>无关,也无关于是否从大量模型和估计量(包括错误指定的模型和具有相关误差的模型)中计算出的残差或滤波数据。
 +
 +
    
=== Ratio estimator of the tail-index 尾部指数的比率估计器 ===
 
=== Ratio estimator of the tail-index 尾部指数的比率估计器 ===
第316行: 第317行:     
A comparison of Hill-type and RE-type estimators can be found in Novak.<ref name="Novak2011"/>
 
A comparison of Hill-type and RE-type estimators can be found in Novak.<ref name="Novak2011"/>
 +
 +
    
=== Software 应用软件===
 
=== Software 应用软件===
 
* [http://www.cs.bu.edu/~crovella/aest.html aest], [[C (programming language)|C]] tool for estimating the heavy-tail index.<ref>{{Cite journal | last1 = Crovella | first1 = M. E. | last2 = Taqqu | first2 = M. S. | title = Estimating the Heavy Tail Index from Scaling Properties| journal = Methodology and Computing in Applied Probability | volume = 1 | pages = 55–79 | year = 1999 | doi = 10.1023/A:1010012224103 | url = http://www.cs.bu.edu/~crovella/paper-archive/aest.ps| pmid =  | pmc = }}</ref>
 
* [http://www.cs.bu.edu/~crovella/aest.html aest], [[C (programming language)|C]] tool for estimating the heavy-tail index.<ref>{{Cite journal | last1 = Crovella | first1 = M. E. | last2 = Taqqu | first2 = M. S. | title = Estimating the Heavy Tail Index from Scaling Properties| journal = Methodology and Computing in Applied Probability | volume = 1 | pages = 55–79 | year = 1999 | doi = 10.1023/A:1010012224103 | url = http://www.cs.bu.edu/~crovella/paper-archive/aest.ps| pmid =  | pmc = }}</ref>
 +
 +
    
== Estimation of heavy-tailed density 重尾密度的估计 ==
 
== Estimation of heavy-tailed density 重尾密度的估计 ==
第344行: 第349行:     
Markovich中给出了估计重尾和超重尾概率密度函数的非参数方法。这些是基于可变带宽和长尾核估计器的方法。将初步数据以有限或无限间隔变换为新的随机变量,这样更便于估计,然后对获得的密度估计进行逆变换;以及“拼合方法”,它为密度的尾部提供了一定的参数模型,并为近似密度的模式提供了非参数模型。非参数估计器需要适当选择调整(平滑)参数,例如内核估计器的带宽和直方图的bin宽度。这种选择大众化数据驱动方法是基于均方误差(MSE)及其渐近及其上限的最小化的交叉验证及修改方法。通过使用著名的非参数统计数据(例如Kolmogorov-Smirnov's,von Mises和Anderson-Darling的统计数据)作为分布函数(dfs)空间中的度量,并将后来的统计数据的分位数作为已知的不确定性或差异值,来寻找差异。Bootstrap是另一种工具,可以通过不同的重采样选择方案使用未知MSE的近似值来查找平滑参数。
 
Markovich中给出了估计重尾和超重尾概率密度函数的非参数方法。这些是基于可变带宽和长尾核估计器的方法。将初步数据以有限或无限间隔变换为新的随机变量,这样更便于估计,然后对获得的密度估计进行逆变换;以及“拼合方法”,它为密度的尾部提供了一定的参数模型,并为近似密度的模式提供了非参数模型。非参数估计器需要适当选择调整(平滑)参数,例如内核估计器的带宽和直方图的bin宽度。这种选择大众化数据驱动方法是基于均方误差(MSE)及其渐近及其上限的最小化的交叉验证及修改方法。通过使用著名的非参数统计数据(例如Kolmogorov-Smirnov's,von Mises和Anderson-Darling的统计数据)作为分布函数(dfs)空间中的度量,并将后来的统计数据的分位数作为已知的不确定性或差异值,来寻找差异。Bootstrap是另一种工具,可以通过不同的重采样选择方案使用未知MSE的近似值来查找平滑参数。
 +
 +
    
== See also 其他参考资料 ==
 
== See also 其他参考资料 ==
第354行: 第361行:  
*[[Fat-tailed distribution]]
 
*[[Fat-tailed distribution]]
 
**[[Taleb distribution]] and [[Holy grail distribution]]
 
**[[Taleb distribution]] and [[Holy grail distribution]]
       
961

个编辑

导航菜单