更改

齐普夫定律 (查看源代码)

2020年5月22日 (五) 13:59的版本

删除4字节、 2020年5月22日 (五) 13:59

第90行：第90行：

== 统计学解释 ==

−

尽管齐普夫定律适用于所有语言，即使是像世界语（插入相关连接说明）这样的非自然语言，<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>[[Léon Brillouin]], ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而，对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示，在一份文档中，每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的，不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短，出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。他取了一大类表现良好的统计分布(不仅仅是正态分布) ，并用把他们排列名次。然后他把每个表达式展开成一个泰勒级数。在每一种情况下，贝列维奇都得到了显著的成果，即级数的一阶截断导出了齐普夫定律。此外，对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>

+

尽管齐普夫定律适用于所有语言，即使是像世界语（插入相关连接说明）这样的非自然语言，<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>Léon Brillouin, ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而，对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示，在一份文档中，每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的，不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短，出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。他取了一大类表现良好的统计分布(不仅仅是正态分布) ，并用把他们排列名次。然后他把每个表达式展开成一个泰勒级数。在每一种情况下，贝列维奇都得到了显著的成果，即级数的一阶截断导出了齐普夫定律。此外，对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>

薄荷

7,129

个编辑

更改

齐普夫定律 (查看源代码)

2020年5月22日 (五) 13:59的版本

导航菜单

搜索