更改

添加14字节 、 2020年7月8日 (三) 17:21
第429行: 第429行:  
例如Zipf定律与Pareto定律都是简单的幂函数,我们称之为幂律分布;而幂律分布还有其他的很多表现形式,像名次——规模分布、规模——概率分布,这四种形式在数学上是等价的,该幂律分布的示意图如下图所示:
 
例如Zipf定律与Pareto定律都是简单的幂函数,我们称之为幂律分布;而幂律分布还有其他的很多表现形式,像名次——规模分布、规模——概率分布,这四种形式在数学上是等价的,该幂律分布的示意图如下图所示:
   −
[[文件:长尾.png|缩略图|长尾分布]]
+
[[文件:长尾.png|缩略图|长尾分布|居中]]
    
其通式可写成y=c*x^(-r),其中x,y是正的随机变量,c,r一般为大于零的常数。这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。
 
其通式可写成y=c*x^(-r),其中x,y是正的随机变量,c,r一般为大于零的常数。这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。
第436行: 第436行:  
判断两个随机变量是否满足线性关系,可以求解两者之间的相关系数;利用一元线性回归模型和最小二乘法可得lny对lnx的经验回归直线方程,从而得到y与x之间的幂律关系式。下图显示的是上图在双对数坐标下的图形,由于某些因素的影响,前半部分的线性特性并不是很强,而在后半部分(对应于上图“长尾”分布的尾部),则近乎为一直线,其斜率的负数就是幂指数。
 
判断两个随机变量是否满足线性关系,可以求解两者之间的相关系数;利用一元线性回归模型和最小二乘法可得lny对lnx的经验回归直线方程,从而得到y与x之间的幂律关系式。下图显示的是上图在双对数坐标下的图形,由于某些因素的影响,前半部分的线性特性并不是很强,而在后半部分(对应于上图“长尾”分布的尾部),则近乎为一直线,其斜率的负数就是幂指数。
   −
[[文件:幂律-双对数坐标.png|缩略图|双对数坐标下的幂律关系]]
+
[[文件:幂律-双对数坐标.png|缩略图|双对数坐标下的幂律关系|居中]]
    
而我们常见的指数分布,其图形表面上看与幂律分布很相似,实际两者有极大不同———指数分布的收敛速度远快过幂律分布。
 
而我们常见的指数分布,其图形表面上看与幂律分布很相似,实际两者有极大不同———指数分布的收敛速度远快过幂律分布。
463

个编辑