第30行: |
第30行: |
| | | |
| == Definitions 定义 == | | == Definitions 定义 == |
− |
| |
− |
| |
| | | |
| === Definition of heavy-tailed distribution 重尾分布的定义 === | | === Definition of heavy-tailed distribution 重尾分布的定义 === |
− |
| |
− |
| |
| | | |
| The distribution of a [[random variable]] ''X'' with [[cumulative distribution function|distribution function]] ''F'' is said to have a heavy (right) tail if the [[moment generating function]] of ''X'', ''M<sub>X</sub>''(''t''), is infinite for all ''t'' > 0.<ref name="ReferenceA">Rolski, Schmidli, Scmidt, Teugels, ''Stochastic Processes for Insurance and Finance'', 1999</ref> | | The distribution of a [[random variable]] ''X'' with [[cumulative distribution function|distribution function]] ''F'' is said to have a heavy (right) tail if the [[moment generating function]] of ''X'', ''M<sub>X</sub>''(''t''), is infinite for all ''t'' > 0.<ref name="ReferenceA">Rolski, Schmidli, Scmidt, Teugels, ''Stochastic Processes for Insurance and Finance'', 1999</ref> |
第125行: |
第121行: |
| | | |
| 所有长尾分布都是重尾分布,但反之不一定,事实是可以构造出非长尾分布的重尾分布。 | | 所有长尾分布都是重尾分布,但反之不一定,事实是可以构造出非长尾分布的重尾分布。 |
| + | |
| + | |
| | | |
| === Subexponential distributions 次指数分布 === | | === Subexponential distributions 次指数分布 === |
第196行: |
第194行: |
| | | |
| 所有次指数分布都是长尾分布,但可以构造非次指数分布的长尾分布示例。 | | 所有次指数分布都是长尾分布,但可以构造非次指数分布的长尾分布示例。 |
| + | |
| + | |
| | | |
| == Common heavy-tailed distributions 常见的重尾分布 == | | == Common heavy-tailed distributions 常见的重尾分布 == |
第285行: |
第285行: |
| | | |
| 其中<math>X_{(n-k(n)+1,n)}=\max \left(X_{n-k(n)+1},\ldots ,X_{n}\right)</math>。 此估计量的概率收敛到<math>\xi</math>。 | | 其中<math>X_{(n-k(n)+1,n)}=\max \left(X_{n-k(n)+1},\ldots ,X_{n}\right)</math>。 此估计量的概率收敛到<math>\xi</math>。 |
− |
| |
| | | |
| | | |
第307行: |
第306行: |
| | | |
| 其中<math>X_{(i,n)}</math>是<math>X_1, \dots, X_n</math>的i阶统计量。该估计量收敛于<math>\xi</math>的概率,并且当<math>k(n) \to \infty </math>基于较高阶的正则变化性质受到限制时,它是渐近正态的。一致性和渐近正态性适用于一大类相关序列和异类序列,它与是否观测到<math>X_t</math>无关,也无关于是否从大量模型和估计量(包括错误指定的模型和具有相关误差的模型)中计算出的残差或滤波数据。 | | 其中<math>X_{(i,n)}</math>是<math>X_1, \dots, X_n</math>的i阶统计量。该估计量收敛于<math>\xi</math>的概率,并且当<math>k(n) \to \infty </math>基于较高阶的正则变化性质受到限制时,它是渐近正态的。一致性和渐近正态性适用于一大类相关序列和异类序列,它与是否观测到<math>X_t</math>无关,也无关于是否从大量模型和估计量(包括错误指定的模型和具有相关误差的模型)中计算出的残差或滤波数据。 |
| + | |
| + | |
| | | |
| === Ratio estimator of the tail-index 尾部指数的比率估计器 === | | === Ratio estimator of the tail-index 尾部指数的比率估计器 === |
第316行: |
第317行: |
| | | |
| A comparison of Hill-type and RE-type estimators can be found in Novak.<ref name="Novak2011"/> | | A comparison of Hill-type and RE-type estimators can be found in Novak.<ref name="Novak2011"/> |
| + | |
| + | |
| | | |
| === Software 应用软件=== | | === Software 应用软件=== |
| * [http://www.cs.bu.edu/~crovella/aest.html aest], [[C (programming language)|C]] tool for estimating the heavy-tail index.<ref>{{Cite journal | last1 = Crovella | first1 = M. E. | last2 = Taqqu | first2 = M. S. | title = Estimating the Heavy Tail Index from Scaling Properties| journal = Methodology and Computing in Applied Probability | volume = 1 | pages = 55–79 | year = 1999 | doi = 10.1023/A:1010012224103 | url = http://www.cs.bu.edu/~crovella/paper-archive/aest.ps| pmid = | pmc = }}</ref> | | * [http://www.cs.bu.edu/~crovella/aest.html aest], [[C (programming language)|C]] tool for estimating the heavy-tail index.<ref>{{Cite journal | last1 = Crovella | first1 = M. E. | last2 = Taqqu | first2 = M. S. | title = Estimating the Heavy Tail Index from Scaling Properties| journal = Methodology and Computing in Applied Probability | volume = 1 | pages = 55–79 | year = 1999 | doi = 10.1023/A:1010012224103 | url = http://www.cs.bu.edu/~crovella/paper-archive/aest.ps| pmid = | pmc = }}</ref> |
| + | |
| + | |
| | | |
| == Estimation of heavy-tailed density 重尾密度的估计 == | | == Estimation of heavy-tailed density 重尾密度的估计 == |
第344行: |
第349行: |
| | | |
| Markovich中给出了估计重尾和超重尾概率密度函数的非参数方法。这些是基于可变带宽和长尾核估计器的方法。将初步数据以有限或无限间隔变换为新的随机变量,这样更便于估计,然后对获得的密度估计进行逆变换;以及“拼合方法”,它为密度的尾部提供了一定的参数模型,并为近似密度的模式提供了非参数模型。非参数估计器需要适当选择调整(平滑)参数,例如内核估计器的带宽和直方图的bin宽度。这种选择大众化数据驱动方法是基于均方误差(MSE)及其渐近及其上限的最小化的交叉验证及修改方法。通过使用著名的非参数统计数据(例如Kolmogorov-Smirnov's,von Mises和Anderson-Darling的统计数据)作为分布函数(dfs)空间中的度量,并将后来的统计数据的分位数作为已知的不确定性或差异值,来寻找差异。Bootstrap是另一种工具,可以通过不同的重采样选择方案使用未知MSE的近似值来查找平滑参数。 | | Markovich中给出了估计重尾和超重尾概率密度函数的非参数方法。这些是基于可变带宽和长尾核估计器的方法。将初步数据以有限或无限间隔变换为新的随机变量,这样更便于估计,然后对获得的密度估计进行逆变换;以及“拼合方法”,它为密度的尾部提供了一定的参数模型,并为近似密度的模式提供了非参数模型。非参数估计器需要适当选择调整(平滑)参数,例如内核估计器的带宽和直方图的bin宽度。这种选择大众化数据驱动方法是基于均方误差(MSE)及其渐近及其上限的最小化的交叉验证及修改方法。通过使用著名的非参数统计数据(例如Kolmogorov-Smirnov's,von Mises和Anderson-Darling的统计数据)作为分布函数(dfs)空间中的度量,并将后来的统计数据的分位数作为已知的不确定性或差异值,来寻找差异。Bootstrap是另一种工具,可以通过不同的重采样选择方案使用未知MSE的近似值来查找平滑参数。 |
| + | |
| + | |
| | | |
| == See also 其他参考资料 == | | == See also 其他参考资料 == |
第354行: |
第361行: |
| *[[Fat-tailed distribution]] | | *[[Fat-tailed distribution]] |
| **[[Taleb distribution]] and [[Holy grail distribution]] | | **[[Taleb distribution]] and [[Holy grail distribution]] |
− |
| |
| | | |
| | | |