第5行: |
第5行: |
| [[文件:KS_Example.png|缩略图|右|Kolmogorov–Smirnov统计数据的图示。 红线是累积分布函数,蓝线是经验分布函数,黑色箭头是K–S统计量。]] | | [[文件:KS_Example.png|缩略图|右|Kolmogorov–Smirnov统计数据的图示。 红线是累积分布函数,蓝线是经验分布函数,黑色箭头是K–S统计量。]] |
| | | |
− | 在统计学中,'''<font color="#ff8000"> Kolmogorov–Smirnov检验</font>'''(亦称'''K-S检验'''或'''KS检验''')是一种连续(或不连续,请参见第2.2节)的一维概率分布均等性的非参数检验,可用于比较一个样本与一个参考概率分布(单一样本K-S检验),或比较两个样本(两个样本的K-S检验)。它是以安德雷·柯尔莫哥洛夫 Andrey Kolmogorov和尼古莱·斯米尔诺夫 Nikolai Smirnov的名字命名。 | + | 在统计学中,'''Kolmogorov–Smirnov检验'''(亦称'''K-S检验'''或'''KS检验''')是一种连续(或不连续,请参见第2.2节)的一维概率分布均等性的非参数检验,可用于比较一个样本与一个参考概率分布(单一样本K-S检验),或比较两个样本(两个样本的K-S检验)。它是以安德雷·柯尔莫哥洛夫 Andrey Kolmogorov和尼古莱·斯米尔诺夫 Nikolai Smirnov的名字命名。 |
| | | |
| | | |
− | Kolmogorov-Smirnov统计定量描述了一个样本分布的'''<font color="#ff8000">经验分布函数 Empirical distribution function</font>'''与一个参考分布的'''<font color="#ff8000">累积分布函数 Cumulative distribution function</font>'''之间的距离,或者是两个样本分布的经验分布函数之间的距离。该统计量的'''<font color="#ff8000">零分布 Null distribution</font>'''是基于'''<font color="#ff8000">零假设Null hypothesis</font>'''(或称原始假设)下计算的,可以从参考分布中抽取样本(在单个样本的情况下),或者从相同分布中抽取样本组(在两个样本的情况下)。在单样本情况下,零假设(原假设)考虑的分布可能是连续的(请参阅第2节),纯离散的或混合的(请参阅第2.2节)。然而在考虑两个样本情况下(请参阅第3节),零假设下的分布仅能确定为连续分布,在其他方面并不受限制。 | + | Kolmogorov-Smirnov统计定量描述了一个样本分布的'''<font color="#ff8000">经验分布函数 Empirical distribution function</font>'''与一个参考分布的'''<font color="#ff8000">累积分布函数 Cumulative distribution function</font>'''之间的距离,或者是两个样本分布的经验分布函数之间的距离。该统计量的'''<font color="#ff8000">零分布 Null distribution</font>'''是基于'''<font color="#ff8000">零假设 Null hypothesis</font>'''(或称原始假设)下计算的,可以从参考分布中抽取样本(在单个样本的情况下),或者从相同分布中抽取样本组(在两个样本的情况下)。在单样本情况下,零假设(原假设)考虑的分布可能是连续的(请参阅第2节),纯离散的或混合的(请参阅第2.2节)。然而在考虑两个样本情况下(请参阅第3节),零假设下的分布仅能确定为连续分布,在其他方面并不受限制。 |
| | | |
| | | |
第164行: |
第164行: |
| | | |
| 这里要注意的是两个样本检验出来的数据样本是否来自同一分布。其并未指定该共同分布是什么(例如,它是正常还是不正常)。而且关键值表已经得出。Kolmogorov–Smirnov检验没有那么有效,因为它被设计为对两个分布函数之间所有可能的差异敏感。如刊登在Journal of Nonparametric Statistics2009年刊上Marozzi, Marco (2009)的文章《Some Notes on the Location-Scale Cucconi Test》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Some Notes on the Location-Scale Cucconi Test |journal=Journal of Nonparametric Statistics |date=2009 |volume=21 |issue=5 |page=629–647 |doi=10.1080/10485250902952435 }}</ref>和刊登在Communications in Statistics – Simulation and Computation2013年刊上同样Marozzi, Marco (2009)的文章《Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods |journal=Communications in Statistics – Simulation and Computation |date=2013 |volume=42 |issue=6 |page=1298–1317 |doi=10.1080/03610918.2012.665546 }}</ref>显示了证据,当比较两个分布函数时,最初建议同时比较位置和比例的Cucconi检验比Kolmogorov-Smirnov检验更有效。 | | 这里要注意的是两个样本检验出来的数据样本是否来自同一分布。其并未指定该共同分布是什么(例如,它是正常还是不正常)。而且关键值表已经得出。Kolmogorov–Smirnov检验没有那么有效,因为它被设计为对两个分布函数之间所有可能的差异敏感。如刊登在Journal of Nonparametric Statistics2009年刊上Marozzi, Marco (2009)的文章《Some Notes on the Location-Scale Cucconi Test》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Some Notes on the Location-Scale Cucconi Test |journal=Journal of Nonparametric Statistics |date=2009 |volume=21 |issue=5 |page=629–647 |doi=10.1080/10485250902952435 }}</ref>和刊登在Communications in Statistics – Simulation and Computation2013年刊上同样Marozzi, Marco (2009)的文章《Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods》<ref>{{cite journal |last1=Marozzi |first1=Marco |title=Nonparametric Simultaneous Tests for Location and Scale Testing: a Comparison of Several Methods |journal=Communications in Statistics – Simulation and Computation |date=2013 |volume=42 |issue=6 |page=1298–1317 |doi=10.1080/03610918.2012.665546 }}</ref>显示了证据,当比较两个分布函数时,最初建议同时比较位置和比例的Cucconi检验比Kolmogorov-Smirnov检验更有效。 |
| + | |
| | | |
| == 为分布函数的形状设置置信极限 == | | == 为分布函数的形状设置置信极限 == |
| | | |
| 虽然通常使用Kolmogorov–Smirnov检验法来检验给定的''F''(''x'')是否为''F''<sub>''n''</sub>(''x'')的潜在概率分布,但可以将过程倒过来给出''F''(''x'')本身的置信极限。如果选择检验统计量''D''<sub>''α''</sub>的临界值,使得P(''D''<sub>''n''</sub> > ''D''<sub>''α''</sub>) = ''α'',则在''F''<sub>''n''</sub>(''x'') 周围宽度±''D''<sub>''α''</sub>内将完全包含概率为1 − ''α''的''F''(''x'') 。 | | 虽然通常使用Kolmogorov–Smirnov检验法来检验给定的''F''(''x'')是否为''F''<sub>''n''</sub>(''x'')的潜在概率分布,但可以将过程倒过来给出''F''(''x'')本身的置信极限。如果选择检验统计量''D''<sub>''α''</sub>的临界值,使得P(''D''<sub>''n''</sub> > ''D''<sub>''α''</sub>) = ''α'',则在''F''<sub>''n''</sub>(''x'') 周围宽度±''D''<sub>''α''</sub>内将完全包含概率为1 − ''α''的''F''(''x'') 。 |
| + | |
| | | |
| == 多个维度的Kolmogorov–Smirnov统计 == | | == 多个维度的Kolmogorov–Smirnov统计 == |
第182行: |
第184行: |
| | | |
| 一维的Kolmogorov-Smirnov统计量与所谓的星差D相同,因此,另一个对更高维度的本地KS扩展是将D也用于更高维度。可惜的是,很难从高维度上计算出星差。 | | 一维的Kolmogorov-Smirnov统计量与所谓的星差D相同,因此,另一个对更高维度的本地KS扩展是将D也用于更高维度。可惜的是,很难从高维度上计算出星差。 |
| + | |
| | | |
| ==软件实现== | | ==软件实现== |
第234行: |
第237行: |
| * Corder, G. W.; Foreman, D. I. (2014). 非参数统计:分步法. Wiley. ISBN 978-1118840313. | | * Corder, G. W.; Foreman, D. I. (2014). 非参数统计:分步法. Wiley. ISBN 978-1118840313. |
| * Stephens, M. A. (1979). "基于经验分布函数的逻辑分布拟合检验". Biometrika. 66 (3): 591–595. doi:10.1093/biomet/66.3.591. | | * Stephens, M. A. (1979). "基于经验分布函数的逻辑分布拟合检验". Biometrika. 66 (3): 591–595. doi:10.1093/biomet/66.3.591. |
| + | |
| | | |
| == 编者推荐 == | | == 编者推荐 == |