更改

跳到导航 跳到搜索
删除4字节 、 2020年5月22日 (五) 13:59
第90行: 第90行:  
== 统计学解释 ==
 
== 统计学解释 ==
   −
尽管齐普夫定律适用于所有语言,即使是像世界语(插入相关连接说明)这样的非自然语言,<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>[[Léon Brillouin]], ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而,对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示,在一份文档中,每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的,不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短,出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。 他取了一大类表现良好的统计分布(不仅仅是正态分布) ,并用把他们排列名次。 然后他把每个表达式展开成一个泰勒级数。 在每一种情况下,贝列维奇都得到了显著的成果,即级数的一阶截断导出了齐普夫定律。 此外,对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>  
+
尽管齐普夫定律适用于所有语言,即使是像世界语(插入相关连接说明)这样的非自然语言,<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>Léon Brillouin, ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而,对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示,在一份文档中,每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的,不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短,出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。 他取了一大类表现良好的统计分布(不仅仅是正态分布) ,并用把他们排列名次。 然后他把每个表达式展开成一个泰勒级数。 在每一种情况下,贝列维奇都得到了显著的成果,即级数的一阶截断导出了齐普夫定律。 此外,对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>  
     
7,129

个编辑

导航菜单