更改

跳到导航 跳到搜索
添加7字节 、 2020年5月22日 (五) 13:57
第91行: 第91行:     
尽管齐普夫定律适用于所有语言,即使是像世界语(插入相关连接说明)这样的非自然语言,<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>[[Léon Brillouin]], ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而,对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示,在一份文档中,每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的,不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短,出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。 他取了一大类表现良好的统计分布(不仅仅是正态分布) ,并用把他们排列名次。 然后他把每个表达式展开成一个泰勒级数。 在每一种情况下,贝列维奇都得到了显著的成果,即级数的一阶截断导出了齐普夫定律。 此外,对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>  
 
尽管齐普夫定律适用于所有语言,即使是像世界语(插入相关连接说明)这样的非自然语言,<ref name="sasasa">ZIPF'S LAW (PDF (2006) [https://pattern.swarma.org/paper?id=d9f0e49c-6f3a-11ea-926a-0242ac1a0005 INVESTIGATING ESPERANTO'S STATISTICAL PROPORTIONS RELATIVE TO OTHER LANGUAGES USING NEURAL NETWORKS, ), Archived (PDF) from the original on 5 March 2016].Bill Manaris; Luca Pellicoro; George Pothering; Harland Hodges (13 February, Artificial Intelligence and Applications.(102--108)</ref> 但其原理仍然没有得到很好的理解。 <ref>[[Léon Brillouin]], ''La science et la théorie de l'information'', 1959, réédité en 1988, traduction anglaise rééditée en 2004</ref>然而,对随机产生的文本进行统计分析可以在某些方面解释这一现象。 Wentian Li表示,在一份文档中,每个字符都是从所有字母(加上一个空格字符)的均匀分布中随机选取的,不同长度的“单词”遵循齐普夫定律的宏观趋势,即可能性越大的单词越短,出现概率越大。<ref name="sasas">Li, Wentian (1992) [https://pattern.swarma.org/paper?id=20504be4-6f3b-11ea-b744-0242ac1a0005 "Random Texts Exhibit Zipf's-Law-Like Word Frequency Distribution"].IEEE Transactions on Information Theory, CiteSeerX 10.1.1.164.8422. doi:10.1109/18.38.(1842--1845)</ref> 维托尔德 · 贝列维奇在《语言分布的统计规律》中给出了一个数学推导。 他取了一大类表现良好的统计分布(不仅仅是正态分布) ,并用把他们排列名次。 然后他把每个表达式展开成一个泰勒级数。 在每一种情况下,贝列维奇都得到了显著的成果,即级数的一阶截断导出了齐普夫定律。 此外,对泰勒级数的二阶截断导出了[[曼德布洛特定律]]。<ref>[[Peter G. Neumann|Neumann, Peter G.]] [http://www.csl.sri.com/users/neumann/#12a "Statistical metalinguistics and Zipf/Pareto/Mandelbrot"], ''SRI International Computer Science Laboratory'', accessed and [https://web.archive.org/web/20110605012951/http://www.csl.sri.com/users/neumann/ archived] 29 May 2011.</ref>  
 +
    
最小努力原则是另一种来解释齐普夫定律的途径: 齐普夫本人提出,使用特定语言的说话者和接收者都不想仅仅为了理解而付出超额努力,从而导致努力的程度大致平等分配的过程产生了我们所观察到的齐普夫分布。<ref name="sasq">Sole, Ramon Ferrer i Cancho (2003) [https://pattern.swarma.org/paper?id=7d736f4c-6f3e-11ea-a55c-0242ac1a0005 "Least effort and the origins of scaling in human language"].Proceedings of the National Academy of Sciences of the United States of America, PMC 298679. PMID 12540826. Archived from the original on 2011-12-01..100, 10.(788--791)</ref>  <ref name="sassasasaa">Lin, Bian, Chunhua (2014) [https://pattern.swarma.org/paper?id=9ef918ba-6f3e-11ea-9c6f-0242ac1a0005 "Scaling laws in human speech, decreasing emergence of new words and a generalized model"].arXiv:1412.4846 [cs.CL].
 
最小努力原则是另一种来解释齐普夫定律的途径: 齐普夫本人提出,使用特定语言的说话者和接收者都不想仅仅为了理解而付出超额努力,从而导致努力的程度大致平等分配的过程产生了我们所观察到的齐普夫分布。<ref name="sasq">Sole, Ramon Ferrer i Cancho (2003) [https://pattern.swarma.org/paper?id=7d736f4c-6f3e-11ea-a55c-0242ac1a0005 "Least effort and the origins of scaling in human language"].Proceedings of the National Academy of Sciences of the United States of America, PMC 298679. PMID 12540826. Archived from the original on 2011-12-01..100, 10.(788--791)</ref>  <ref name="sassasasaa">Lin, Bian, Chunhua (2014) [https://pattern.swarma.org/paper?id=9ef918ba-6f3e-11ea-9c6f-0242ac1a0005 "Scaling laws in human speech, decreasing emergence of new words and a generalized model"].arXiv:1412.4846 [cs.CL].
 +
    
类似地,偏好依附(直观的看到“富人越来越富”或“成功孕育成功”)产生了[[ Yule-Simon 分布]],这已被证明比齐普夫定律更适合语言中的词频与排名`人口与城市排名研究。</ref><ref name="qwqsa">Vitanov, Nikolay, K., Ausloos, Chunhua (2015) [https://pattern.swarma.org/paper?id=d87132d0-6f3e-11ea-93cb-0242ac1a0005 "Test of two hypotheses explaining the size of populations in a system of cities"].Journal of Applied Statistics.42, 1506, 10, 1047744.(2686--2693)</ref>
 
类似地,偏好依附(直观的看到“富人越来越富”或“成功孕育成功”)产生了[[ Yule-Simon 分布]],这已被证明比齐普夫定律更适合语言中的词频与排名`人口与城市排名研究。</ref><ref name="qwqsa">Vitanov, Nikolay, K., Ausloos, Chunhua (2015) [https://pattern.swarma.org/paper?id=d87132d0-6f3e-11ea-93cb-0242ac1a0005 "Test of two hypotheses explaining the size of populations in a system of cities"].Journal of Applied Statistics.42, 1506, 10, 1047744.(2686--2693)</ref>
 
它最初是由 Yule 用来阐明种群与等级的关系,并由 Simon 用来阐释城市的关系。
 
它最初是由 Yule 用来阐明种群与等级的关系,并由 Simon 用来阐释城市的关系。
    +
<br>
    
== 相关定律 ==
 
== 相关定律 ==
7,129

个编辑

导航菜单