更改

跳到导航 跳到搜索
删除25字节 、 2022年1月9日 (日) 13:36
无编辑摘要
第5行: 第5行:  
[[文件:KS_Example.png|缩略图|右|Kolmogorov–Smirnov统计数据的图示。 红线是累积分布函数,蓝线是经验分布函数,黑色箭头是K–S统计量。]]
 
[[文件:KS_Example.png|缩略图|右|Kolmogorov–Smirnov统计数据的图示。 红线是累积分布函数,蓝线是经验分布函数,黑色箭头是K–S统计量。]]
   −
在统计学中,'''<font color="#ff8000"> Kolmogorov–Smirnov检验</font>'''(亦称'''K-S检验'''或'''KS检验''')是一种连续(或不连续,请参见第2.2节)的一维概率分布均等性的非参数检验,可用于比较一个样本与一个参考概率分布(单一样本K-S检验),或比较两个样本(两个样本的K-S检验)。它是以安德雷·柯尔莫哥洛夫 Andrey Kolmogorov和尼古莱·斯米尔诺夫 Nikolai Smirnov的名字命名。
+
在统计学中,'''Kolmogorov–Smirnov检验'''(亦称'''K-S检验'''或'''KS检验''')是一种连续(或不连续,请参见第2.2节)的一维概率分布均等性的非参数检验,可用于比较一个样本与一个参考概率分布(单一样本K-S检验),或比较两个样本(两个样本的K-S检验)。它是以安德雷·柯尔莫哥洛夫 Andrey Kolmogorov和尼古莱·斯米尔诺夫 Nikolai Smirnov的名字命名。
      −
Kolmogorov-Smirnov统计定量描述了一个样本分布的'''<font color="#ff8000">经验分布函数 Empirical distribution function</font>'''与一个参考分布的'''<font color="#ff8000">累积分布函数 Cumulative distribution function</font>'''之间的距离,或者是两个样本分布的经验分布函数之间的距离。该统计量的'''<font color="#ff8000">零分布 Null distribution</font>'''是基于'''<font color="#ff8000">零假设Null hypothesis</font>'''(或称原始假设)下计算的,可以从参考分布中抽取样本(在单个样本的情况下),或者从相同分布中抽取样本组(在两个样本的情况下)。在单样本情况下,零假设(原假设)考虑的分布可能是连续的(请参阅第2节),纯离散的或混合的(请参阅第2.2节)。然而在考虑两个样本情况下(请参阅第3节),零假设下的分布仅能确定为连续分布,在其他方面并不受限制。
+
Kolmogorov-Smirnov统计定量描述了一个样本分布的'''<font color="#ff8000">经验分布函数 Empirical distribution function</font>'''与一个参考分布的'''<font color="#ff8000">累积分布函数 Cumulative distribution function</font>'''之间的距离,或者是两个样本分布的经验分布函数之间的距离。该统计量的'''<font color="#ff8000">零分布 Null distribution</font>'''是基于'''<font color="#ff8000">零假设 Null hypothesis</font>'''(或称原始假设)下计算的,可以从参考分布中抽取样本(在单个样本的情况下),或者从相同分布中抽取样本组(在两个样本的情况下)。在单样本情况下,零假设(原假设)考虑的分布可能是连续的(请参阅第2节),纯离散的或混合的(请参阅第2.2节)。然而在考虑两个样本情况下(请参阅第3节),零假设下的分布仅能确定为连续分布,在其他方面并不受限制。
      第164行: 第164行:     
这里要注意的是两个样本检验出来的数据样本是否来自同一分布。其并未指定该共同分布是什么(例如,它是正常还是不正常)。而且关键值表已经得出。Kolmogorov–Smirnov检验没有那么有效,因为它被设计为对两个分布函数之间所有可能的差异敏感。如刊登在Journal of Nonparametric Statistics2009年刊上Marozzi, Marco (2009)的文章《Some Notes on the Location-Scale Cucconi Test》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Some Notes on the Location-Scale Cucconi Test |journal=Journal of Nonparametric Statistics |date=2009 |volume=21 |issue=5 |page=629–647 |doi=10.1080/10485250902952435 }}</ref>和刊登在Communications in Statistics – Simulation and Computation2013年刊上同样Marozzi, Marco (2009)的文章《Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods |journal=Communications in Statistics – Simulation and Computation |date=2013 |volume=42 |issue=6 |page=1298–1317 |doi=10.1080/03610918.2012.665546 }}</ref>显示了证据,当比较两个分布函数时,最初建议同时比较位置和比例的Cucconi检验比Kolmogorov-Smirnov检验更有效。
 
这里要注意的是两个样本检验出来的数据样本是否来自同一分布。其并未指定该共同分布是什么(例如,它是正常还是不正常)。而且关键值表已经得出。Kolmogorov–Smirnov检验没有那么有效,因为它被设计为对两个分布函数之间所有可能的差异敏感。如刊登在Journal of Nonparametric Statistics2009年刊上Marozzi, Marco (2009)的文章《Some Notes on the Location-Scale Cucconi Test》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Some Notes on the Location-Scale Cucconi Test |journal=Journal of Nonparametric Statistics |date=2009 |volume=21 |issue=5 |page=629–647 |doi=10.1080/10485250902952435 }}</ref>和刊登在Communications in Statistics – Simulation and Computation2013年刊上同样Marozzi, Marco (2009)的文章《Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods |journal=Communications in Statistics – Simulation and Computation |date=2013 |volume=42 |issue=6 |page=1298–1317 |doi=10.1080/03610918.2012.665546 }}</ref>显示了证据,当比较两个分布函数时,最初建议同时比较位置和比例的Cucconi检验比Kolmogorov-Smirnov检验更有效。
 +
    
== 为分布函数的形状设置置信极限 ==
 
== 为分布函数的形状设置置信极限 ==
    
虽然通常使用Kolmogorov–Smirnov检验法来检验给定的''F''(''x'')是否为''F''<sub>''n''</sub>(''x'')的潜在概率分布,但可以将过程倒过来给出''F''(''x'')本身的置信极限。如果选择检验统计量''D''<sub>''α''</sub>的临界值,使得P(''D''<sub>''n''</sub>&nbsp;>&nbsp;''D''<sub>''α''</sub>) = ''α'',则在''F''<sub>''n''</sub>(''x'') 周围宽度±''D''<sub>''α''</sub>内将完全包含概率为1&nbsp;−&nbsp;''α''的''F''(''x'') 。
 
虽然通常使用Kolmogorov–Smirnov检验法来检验给定的''F''(''x'')是否为''F''<sub>''n''</sub>(''x'')的潜在概率分布,但可以将过程倒过来给出''F''(''x'')本身的置信极限。如果选择检验统计量''D''<sub>''α''</sub>的临界值,使得P(''D''<sub>''n''</sub>&nbsp;>&nbsp;''D''<sub>''α''</sub>) = ''α'',则在''F''<sub>''n''</sub>(''x'') 周围宽度±''D''<sub>''α''</sub>内将完全包含概率为1&nbsp;−&nbsp;''α''的''F''(''x'') 。
 +
    
== 多个维度的Kolmogorov–Smirnov统计 ==
 
== 多个维度的Kolmogorov–Smirnov统计 ==
第182行: 第184行:     
一维的Kolmogorov-Smirnov统计量与所谓的星差D相同,因此,另一个对更高维度的本地KS扩展是将D也用于更高维度。可惜的是,很难从高维度上计算出星差。
 
一维的Kolmogorov-Smirnov统计量与所谓的星差D相同,因此,另一个对更高维度的本地KS扩展是将D也用于更高维度。可惜的是,很难从高维度上计算出星差。
 +
    
==软件实现==
 
==软件实现==
第234行: 第237行:  
* Corder, G. W.; Foreman, D. I. (2014). 非参数统计:分步法. Wiley. ISBN 978-1118840313.
 
* Corder, G. W.; Foreman, D. I. (2014). 非参数统计:分步法. Wiley. ISBN 978-1118840313.
 
* Stephens, M. A. (1979). "基于经验分布函数的逻辑分布拟合检验". Biometrika. 66 (3): 591–595. doi:10.1093/biomet/66.3.591.
 
* Stephens, M. A. (1979). "基于经验分布函数的逻辑分布拟合检验". Biometrika. 66 (3): 591–595. doi:10.1093/biomet/66.3.591.
 +
    
== 编者推荐 ==
 
== 编者推荐 ==
7,129

个编辑

导航菜单