第101行: |
第101行: |
| == 术语词义衍变== | | == 术语词义衍变== |
| === 早期使用 === | | === 早期使用 === |
− | “数据科学”这一术语在过去的三十年里已经出现在各种语境中,但直到最近才成为一个确定的术语。在早期,1960年它被[https://en.wikipedia.org/wiki/Peter_Naur 彼得·诺尔](Peter Naur)用作[https://en.wikipedia.org/wiki/Computer_science 计算机科学]的代名词。诺尔后来引入了[https://en.wikipedia.org/wiki/Datalogy “数据学”](datalogy)这一术语。 | + | “数据科学”这一术语在过去的三十年里已经出现在各种语境中,但直到最近才成为一个确定的术语。在早期,1960年它被[https://en.wikipedia.org/wiki/Peter_Naur 彼得·诺尔] Peter Naur用作[https://en.wikipedia.org/wiki/Computer_science 计算机科学]的代名词。诺尔后来引入了[https://en.wikipedia.org/wiki/Datalogy “数据学”](datalogy)这一术语。 |
| <ref> | | <ref> |
| {{cite journal | | {{cite journal |
第116行: |
第116行: |
| | | |
| | | |
− | 1962年,约翰•图基(John Tukey)描述了一个他称之为“数据分析”的领域,这个领域类似于现代的数据科学。<ref name=":7">
| + | 1962年,约翰•图基 John Tukey描述了一个他称之为“数据分析”的领域,这个领域类似于现代的数据科学。<ref name=":7"> |
| {{Cite web|url=http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf|title=50 years of Data Science|last=Donoho|first=David|date=September 18, 2015|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} | | {{Cite web|url=http://courses.csail.mit.edu/18.337/2015/docs/50YearsDataScience.pdf|title=50 years of Data Science|last=Donoho|first=David|date=September 18, 2015|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} |
| </ref> 之后,1992年,在蒙彼利埃第二大学举办的统计研讨会上,与会者们承认了一个新的学科的出现,这个学科专注于各种来源和形式的数据,将统计和数据分析的既定概念和原则与计算结合起来。<ref>{{Cite book|title=Data science and its applications = La @science des données et ses applications|date=1995|publisher=Academic Press/Harcourt Brace|others=Escoufier, Yves., Hayashi, Chikio (1918-....)., Fichet, Bernard.|year=1995|isbn=0-12-241770-4|location=Tokyo|pages=|oclc=489990740}}</ref><ref>{{Cite journal|last=Murtagh|first=Fionn|last2=Devlin|first2=Keith|date=2018|title=The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development|url=https://www.mdpi.com/2504-2289/2/2/14|journal=Big Data and Cognitive Computing|language=en|volume=2|issue=2|pages=14|doi=10.3390/bdcc2020014|via=|doi-access=free}}</ref> | | </ref> 之后,1992年,在蒙彼利埃第二大学举办的统计研讨会上,与会者们承认了一个新的学科的出现,这个学科专注于各种来源和形式的数据,将统计和数据分析的既定概念和原则与计算结合起来。<ref>{{Cite book|title=Data science and its applications = La @science des données et ses applications|date=1995|publisher=Academic Press/Harcourt Brace|others=Escoufier, Yves., Hayashi, Chikio (1918-....)., Fichet, Bernard.|year=1995|isbn=0-12-241770-4|location=Tokyo|pages=|oclc=489990740}}</ref><ref>{{Cite journal|last=Murtagh|first=Fionn|last2=Devlin|first2=Keith|date=2018|title=The Development of Data Science: Implications for Education, Employment, Research, and the Data Revolution for Sustainable Development|url=https://www.mdpi.com/2504-2289/2/2/14|journal=Big Data and Cognitive Computing|language=en|volume=2|issue=2|pages=14|doi=10.3390/bdcc2020014|via=|doi-access=free}}</ref> |
| | | |
| | | |
− | “数据科学”这一术语可以追溯到1974年,当时彼得·诺尔(Peter Naur)将其作为计算机科学的替代名称提出。<ref name=":0">
| + | “数据科学”这一术语可以追溯到1974年,当时Peter Naur将其作为计算机科学的替代名称提出。<ref name=":0"> |
| {{Cite journal|last=CaoLongbing|date=2017-06-29|title=Data Science|journal=ACM Computing Surveys (CSUR)|volume=50|issue=3|pages=1–42|language=EN|doi=10.1145/3076253|doi-access=free}} | | {{Cite journal|last=CaoLongbing|date=2017-06-29|title=Data Science|journal=ACM Computing Surveys (CSUR)|volume=50|issue=3|pages=1–42|language=EN|doi=10.1145/3076253|doi-access=free}} |
| </ref> 1996年,国际分级社团联盟(International Federation of Classification Societies)成为第一个以数据科学为专题的会议。<ref> | | </ref> 1996年,国际分级社团联盟(International Federation of Classification Societies)成为第一个以数据科学为专题的会议。<ref> |
| {{Cite web|url=http://www2.isye.gatech.edu/~jeffwu/presentations/datascience.pdf|title=Statistics=Data Science?|last=Wu|first=C.F. Jeff|date=|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} | | {{Cite web|url=http://www2.isye.gatech.edu/~jeffwu/presentations/datascience.pdf|title=Statistics=Data Science?|last=Wu|first=C.F. Jeff|date=|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} |
− | </ref> 不过,关于数据科学的定义仍在不断变化。1997年,吴建福(C.F.Jeff Wu)建议将统计学重新命名为数据科学。他认为,新的名称将有助于统计学摆脱不准确的刻板印象,例如被认为是会计的同义词,或仅限于描述数据。1998年,林知己夫(Chikio Hayashi)主张将数据科学作为一个新的跨学科概念,包括三个方面:数据设计、收集和分析。 | + | </ref> 不过,关于数据科学的定义仍在不断变化。1997年,吴建福(C.F.Jeff Wu)建议将统计学重新命名为数据科学。他认为,新的名称将有助于统计学摆脱不准确的刻板印象,例如被认为是会计的同义词,或仅限于描述数据。1998年,林知己夫 Chikio Hayashi主张将数据科学作为一个新的跨学科概念,包括三个方面:数据设计、收集和分析。 |
| | | |
| | | |
第133行: |
第133行: |
| | | |
| === 现代用法 === | | === 现代用法 === |
− | 数据科学作为一门独立学科的现代概念,一定程度上归功于威廉 · s · 克利夫兰(William S. Cleveland)。<ref> | + | 数据科学作为一门独立学科的现代概念,一定程度上归功于威廉 · s · 克利夫兰 William S. Cleveland。<ref> |
| {{Cite web|url=https://www.stat.purdue.edu/~wsc/|title=William S Cleveland|last=Gupta|first=Shanti|date=December 11, 2015|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} | | {{Cite web|url=https://www.stat.purdue.edu/~wsc/|title=William S Cleveland|last=Gupta|first=Shanti|date=December 11, 2015|website=|url-status=live|archive-url=|archive-date=|access-date=April 2, 2020}} |
| </ref> 在2001年的一篇论文中,他主张将统计学从理论扩展到技术领域;由于这将大大改变这个领域,因此它需要一个新的名称。在接下来的几年里,“数据科学”的应用更加广泛:2002年,数据科学与技术分会(CODATA) | | </ref> 在2001年的一篇论文中,他主张将统计学从理论扩展到技术领域;由于这将大大改变这个领域,因此它需要一个新的名称。在接下来的几年里,“数据科学”的应用更加广泛:2002年,数据科学与技术分会(CODATA) |
第148行: |
第148行: |
| | | |
| | | |
− | 2008年,帕蒂尔(DJ Patil)和杰弗·哈梅巴赫(Jeff Hammerbacher)共同提出了“数据科学家”这一职称名词。<ref>
| + | 2008年,帕蒂尔 DJ Patil和杰弗·哈梅巴赫 Jeff Hammerbacher共同提出了“数据科学家”这一职称名词。<ref> |
| {{Cite news|last=Davenport|first=Thomas H.|url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century|title=Data Scientist: The Sexiest Job of the 21st Century|date=2012-10-01|work=Harvard Business Review|access-date=2020-04-03|last2=Patil|first2=D. J.|issue=October 2012|issn=0017-8012}} | | {{Cite news|last=Davenport|first=Thomas H.|url=https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century|title=Data Scientist: The Sexiest Job of the 21st Century|date=2012-10-01|work=Harvard Business Review|access-date=2020-04-03|last2=Patil|first2=D. J.|issue=October 2012|issn=0017-8012}} |
− | </ref>尽管美国国家科学委员会(National Science Board)在其2005年的报告《长期数字数据收集: 促进21世纪的研究和教育》(Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century)中使用了这个词,但它泛指在数字化数据收集管理中起关键性作用的人。<ref>{{Cite web|url=https://www.nsf.gov/pubs/2005/nsb0540/|title=US NSF - NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century|website=www.nsf.gov|access-date=2020-04-03}}</ref> | + | </ref>尽管美国国家科学委员会 National Science Board在其2005年的报告《长期数字数据收集: 促进21世纪的研究和教育》 Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century中使用了这个词,但它泛指在数字化数据收集管理中起关键性作用的人。<ref>{{Cite web|url=https://www.nsf.gov/pubs/2005/nsb0540/|title=US NSF - NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century|website=www.nsf.gov|access-date=2020-04-03}}</ref> |
| | | |
| | | |
| 目前,对于数据科学的定义依旧没有达成共识,有些人认为这是一个流行词。<ref>{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/|title=Data Science: What's The Half-Life Of A Buzzword?|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref> | | 目前,对于数据科学的定义依旧没有达成共识,有些人认为这是一个流行词。<ref>{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/|title=Data Science: What's The Half-Life Of A Buzzword?|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref> |
− |
| |
| | | |
| ==研究内容== | | ==研究内容== |