更改

跳到导航 跳到搜索
删除1,007字节 、 2020年5月15日 (五) 12:59
第371行: 第371行:  
来源:https://blog.csdn.net/dev_csdn/article/details/79127658  翻译原文http://varianceexplained.org/r/ds-ml-ai/  原文作者:David Robinson
 
来源:https://blog.csdn.net/dev_csdn/article/details/79127658  翻译原文http://varianceexplained.org/r/ds-ml-ai/  原文作者:David Robinson
   −
==Relationship to statistics与统计学的关系==
+
==与统计学的关系==
 
   
飞速增长的职位空缺表明“数据科学”的概念在商业界和学术界可谓一夜蹿红。
 
飞速增长的职位空缺表明“数据科学”的概念在商业界和学术界可谓一夜蹿红。
 
<ref>
 
<ref>
第386行: 第385行:       −
Many statisticians, including [[Nate Silver]], have argued that data science is not a new field, but rather another name for statistics.<ref>{{Cite web|url=https://www.statisticsviews.com/details/feature/5133141/Nate-Silver-What-I-need-from-statisticians.html|title=Nate Silver: What I need from statisticians - Statistics Views|website=www.statisticsviews.com|access-date=2020-04-03}}</ref> Others argue that data science is distinct from statistics because it focuses on problems and techniques unique to digital data.<ref>{{Cite web|url=http://priceonomics.com/whats-the-difference-between-data-science-and/|title=What's the Difference Between Data Science and Statistics?|website=Priceonomics|language=en|access-date=2020-04-03}}</ref> [[Vasant Dhar]] writes that statistics emphasizes quantitative data and description. In contrast, data science deals with quantitative and qualitative data (e.g. images) and emphasizes prediction and action.<ref>{{Cite journal|last=DharVasant|date=2013-12-01|title=Data science and prediction|journal=Communications of the ACM|volume=56|issue=12|pages=64–73|language=EN|doi=10.1145/2500499}}</ref> [[Andrew Gelman]] of Columbia University and data scientist Vincent Granville have described statistics as a nonessential part of data science.<ref>{{Cite web|url=https://statmodeling.stat.columbia.edu/2013/11/14/statistics-least-important-part-data-science/|title=Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science|website=statmodeling.stat.columbia.edu|access-date=2020-04-03}}</ref><ref>{{Cite web|url=https://www.datasciencecentral.com/profiles/blogs/data-science-without-statistics-is-possible-even-desirable|title=Data science without statistics is possible, even desirable|last=Posted by Vincent Granville on December 8|first=2014 at 5:00pm|last2=Blog|first2=View|website=www.datasciencecentral.com|language=en|access-date=2020-04-03}}</ref>
+
包括'''纳特•西尔弗(Nate Silver)''' 在内的许多统计学家都认为,数据科学不是一个新领域,而是统计学的另一个名称。<ref>{{Cite web|url=https://www.statisticsviews.com/details/feature/5133141/Nate-Silver-What-I-need-from-statisticians.html|title=Nate Silver: What I need from statisticians - Statistics Views|website=www.statisticsviews.com|access-date=2020-04-03}}</ref> 其他人则认为,数据科学与统计学不同,因为它关注的是数字化数据特有的问题和技术。<ref>{{Cite web|url=http://priceonomics.com/whats-the-difference-between-data-science-and/|title=What's the Difference Between Data Science and Statistics?|website=Priceonomics|language=en|access-date=2020-04-03}}</ref> '''瓦桑特·达尔(Vasant Dhar)'''写道,统计学强调定量的数据和描述。相比之下,数据科学处理定量和定性的数据(例如,图像),并强调预测和行动。<ref>{{Cite journal|last=DharVasant|date=2013-12-01|title=Data science and prediction|journal=Communications of the ACM|volume=56|issue=12|pages=64–73|language=EN|doi=10.1145/2500499}}</ref>哥伦比亚大学的'''安德鲁·格尔曼(Andrew Gelman)''' 和数据科学家'''文森特·格兰维尔(Vincent Granville)'''将统计学描述为数据科学中一个不重要的部分。<ref>{{Cite web|url=https://statmodeling.stat.columbia.edu/2013/11/14/statistics-least-important-part-data-science/|title=Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science|website=statmodeling.stat.columbia.edu|access-date=2020-04-03}}</ref><ref>{{Cite web|url=https://www.datasciencecentral.com/profiles/blogs/data-science-without-statistics-is-possible-even-desirable|title=Data science without statistics is possible, even desirable|last=Posted by Vincent Granville on December 8|first=2014 at 5:00pm|last2=Blog|first2=View|website=www.datasciencecentral.com|language=en|access-date=2020-04-03}}</ref>
   −
包括'''纳特•西尔弗(Nate Silver)''' 在内的许多统计学家都认为,数据科学不是一个新领域,而是统计学的另一个名称。其他人则认为,数据科学与统计学不同,因为它关注的是数字化数据特有的问题和技术。'''瓦桑特·达尔(Vasant Dhar)'''写道,统计学强调定量的数据和描述。相比之下,数据科学处理定量和定性的数据(例如,图像),并强调预测和行动。哥伦比亚大学的'''安德鲁·格尔曼(Andrew Gelman)''' 和数据科学家'''文森特·格兰维尔(Vincent Granville)'''将统计学描述为数据科学中一个不重要的部分。
     −
 
+
斯坦福大学教授 '''大卫·多诺霍(David Donoho)''' 写道,数据科学与统计学的区别不在于数据集的大小或计算的使用,许多研究生课程误导性地将他们的分析与统计培训宣传为数据科学课程的核心。他把数据科学描述为从传统统计学中发展出来的一个应用领域。<ref name=":7" />  
Stanford professor [[David Donoho]] writes that data science is not distinguished from statistics by the size of datasets or use of computing, and that many graduate programs misleadingly advertise their analytics and statistics training as the essence of a data science program. He describes data science as an applied field growing out of traditional statistics.<ref name=":7" />  
  −
 
  −
斯坦福大学教授 '''大卫·多诺霍(David Donoho)''' 写道,数据科学与统计学的区别不在于数据集的大小或计算的使用,许多研究生课程误导性地将他们的分析与统计培训宣传为数据科学课程的核心。他把数据科学描述为从传统统计学中发展出来的一个应用领域。
        第432行: 第427行:  
|doi:10.1016/j.ipm.2017.05.004
 
|doi:10.1016/j.ipm.2017.05.004
 
}}</ref>
 
}}</ref>
 +
    
另一方面,也有无数对批评的回应。在2014年一篇[https://en.wikipedia.org/wiki/The_Wall_Street_Journal 《华尔街日报》]的文章中,欧文·沃拉达斯凯-伯杰(Irving Wladawsky-Berger)比较了数据科学的狂热与[https://en.wikipedia.org/wiki/Computer_science 计算机科学]的黎明。他坚称,就像其他[https://en.wikipedia.org/wiki/Interdisciplinarity 交叉学科]领域一样,数据科学利用来自[https://en.wikipedia.org/wiki/Academy 学术界]和[https://en.wikipedia.org/wiki/Industry 工业界]的[https://en.wikipedia.org/wiki/Methodology 方法论]和实践,但之后会将它们变成一个新[https://en.wikipedia.org/wiki/Discipline_(academia) 学科]。他特别强调了现在一个广受认可的学术科目计算机科学曾面临的尖锐批评。
 
另一方面,也有无数对批评的回应。在2014年一篇[https://en.wikipedia.org/wiki/The_Wall_Street_Journal 《华尔街日报》]的文章中,欧文·沃拉达斯凯-伯杰(Irving Wladawsky-Berger)比较了数据科学的狂热与[https://en.wikipedia.org/wiki/Computer_science 计算机科学]的黎明。他坚称,就像其他[https://en.wikipedia.org/wiki/Interdisciplinarity 交叉学科]领域一样,数据科学利用来自[https://en.wikipedia.org/wiki/Academy 学术界]和[https://en.wikipedia.org/wiki/Industry 工业界]的[https://en.wikipedia.org/wiki/Methodology 方法论]和实践,但之后会将它们变成一个新[https://en.wikipedia.org/wiki/Discipline_(academia) 学科]。他特别强调了现在一个广受认可的学术科目计算机科学曾面临的尖锐批评。
第445行: 第441行:  
这项实际的工程目标采用了超越了传统[https://en.wikipedia.org/wiki/Analytics 数据分析]的数据科学。如今这些学科和[https://en.wikipedia.org/wiki/Applied_science 应用领域]的数据缺乏可靠[https://en.wikipedia.org/wiki/Theory 理论]以供形成有力的预测模型,就像[https://en.wikipedia.org/wiki/Health_science 健康科学]和[https://en.wikipedia.org/wiki/Social_science 社会科学]那样。
 
这项实际的工程目标采用了超越了传统[https://en.wikipedia.org/wiki/Analytics 数据分析]的数据科学。如今这些学科和[https://en.wikipedia.org/wiki/Applied_science 应用领域]的数据缺乏可靠[https://en.wikipedia.org/wiki/Theory 理论]以供形成有力的预测模型,就像[https://en.wikipedia.org/wiki/Health_science 健康科学]和[https://en.wikipedia.org/wiki/Social_science 社会科学]那样。
 
<ref name=":0" />
 
<ref name=":0" />
 +
    
斯坦福大学教授[https://en.wikipedia.org/wiki/David_Donoho 大卫·多诺霍](David Donoho)于2015年9月在一次与达尔类似的尝试中,通过抵制批评界对数据科学的三种过分简单化和误导性的定义,提出了更长远的主张。
 
斯坦福大学教授[https://en.wikipedia.org/wiki/David_Donoho 大卫·多诺霍](David Donoho)于2015年9月在一次与达尔类似的尝试中,通过抵制批评界对数据科学的三种过分简单化和误导性的定义,提出了更长远的主张。
第497行: 第494行:  
<ref name="cleveland01" />
 
<ref name="cleveland01" />
 
这些[https://en.wikipedia.org/wiki/Statistician 统计学家]们共同展望着一个日益包容、从传统的[https://en.wikipedia.org/wiki/Statistics 统计学]中生长出来并青出于蓝而胜于蓝的应用领域。
 
这些[https://en.wikipedia.org/wiki/Statistician 统计学家]们共同展望着一个日益包容、从传统的[https://en.wikipedia.org/wiki/Statistics 统计学]中生长出来并青出于蓝而胜于蓝的应用领域。
 +
    
为了数据科学的未来,多诺霍为[https://en.wikipedia.org/wiki/Open_science 开放性科学]规划了一个不断成长的环境,使所有研究者都可以访问用于[https://en.wikipedia.org/wiki/Academic_publishing 学术出版物]的数据集。
 
为了数据科学的未来,多诺霍为[https://en.wikipedia.org/wiki/Open_science 开放性科学]规划了一个不断成长的环境,使所有研究者都可以访问用于[https://en.wikipedia.org/wiki/Academic_publishing 学术出版物]的数据集。
第550行: 第548行:  
|issn:1465-4644
 
|issn:1465-4644
 
}}</ref>
 
}}</ref>
这样,数据科学的未来不仅在规模和方法论上超越了[https://en.wikipedia.org/wiki/Statistical_theory 统计学理论]的界线,它还会彻底革新现在的学术和[https://en.wikipedia.org/wiki/Paradigm 研究范式]。
+
这样,数据科学的未来不仅在规模和方法论上超越了[https://en.wikipedia.org/wiki/Statistical_theory 统计学理论]的界线,它还会彻底革新现在的学术和[https://en.wikipedia.org/wiki/Paradigm 研究范式]。<ref name=":2" />
<ref name=":2" />
+
 
诚如多诺霍所言蔽之:“数据科学的范围和影响在今后数十年会继续扩充,科研数据和有关科学本身的数据将无处不在、俯拾即是。”
+
 
<ref name=":2" />
+
诚如多诺霍所言蔽之:“数据科学的范围和影响在今后数十年会继续扩充,科研数据和有关科学本身的数据将无处不在、俯拾即是。”<ref name=":2" />
    
==References==
 
==References==
763

个编辑

导航菜单