第90行: |
第90行: |
| [https://www.kdnuggets.com/2018/05/data-science-4-reasons-failing-deliver.html "Data Science: 4 Reasons Why Most Are Failing to Deliver"]. ''www.kdnuggets.com''. Retrieved 2018-05-26. | | [https://www.kdnuggets.com/2018/05/data-science-4-reasons-failing-deliver.html "Data Science: 4 Reasons Why Most Are Failing to Deliver"]. ''www.kdnuggets.com''. Retrieved 2018-05-26. |
| </ref> | | </ref> |
− |
| |
| | | |
| == 背景 == | | == 背景 == |
第99行: |
第98行: |
| {{Cite web|url=https://flowingdata.com/2009/06/04/rise-of-the-data-scientist/|title=Rise of the Data Scientist|last=Yau|first=Nathan|date=2009-06-04|website=FlowingData|language=en|access-date=2020-04-03}}</ref><ref>{{Cite web|url=https://benfry.com/phd/dissertation/2.html|title=Basic Example|last=|first=|date=|website=benfry.com|url-status=live|archive-url=|archive-date=|access-date=2020-04-03}} | | {{Cite web|url=https://flowingdata.com/2009/06/04/rise-of-the-data-scientist/|title=Rise of the Data Scientist|last=Yau|first=Nathan|date=2009-06-04|website=FlowingData|language=en|access-date=2020-04-03}}</ref><ref>{{Cite web|url=https://benfry.com/phd/dissertation/2.html|title=Basic Example|last=|first=|date=|website=benfry.com|url-status=live|archive-url=|archive-date=|access-date=2020-04-03}} |
| </ref> 2015年,美国统计协会 American Statistical Association将数据库管理、统计和机器学习,以及分布式和并行系统确定为三个新兴的基础专业领域。<ref>{{Cite web|url=https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/|title=ASA Statement on the Role of Statistics in Data Science|date=2015-10-01|website=AMSTATNEWS|publisher=American Statistical Association|access-date=2019-05-29|archive-url=https://web.archive.org/web/20190620184935/https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/|archive-date=20 June 2019|url-status=live}}</ref> | | </ref> 2015年,美国统计协会 American Statistical Association将数据库管理、统计和机器学习,以及分布式和并行系统确定为三个新兴的基础专业领域。<ref>{{Cite web|url=https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/|title=ASA Statement on the Role of Statistics in Data Science|date=2015-10-01|website=AMSTATNEWS|publisher=American Statistical Association|access-date=2019-05-29|archive-url=https://web.archive.org/web/20190620184935/https://magazine.amstat.org/blog/2015/10/01/asa-statement-on-the-role-of-statistics-in-data-science/|archive-date=20 June 2019|url-status=live}}</ref> |
− |
| |
| | | |
| == 术语词义衍变== | | == 术语词义衍变== |
第131行: |
第129行: |
| | | |
| 在20世纪90年代,描述在越来越大的数据集中寻找模式的流行术语包括“知识发现”和“数据挖掘”<ref name=":01">{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/|title=A Very Short History Of Data Science|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref><ref name=":00" /> | | 在20世纪90年代,描述在越来越大的数据集中寻找模式的流行术语包括“知识发现”和“数据挖掘”<ref name=":01">{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/|title=A Very Short History Of Data Science|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref><ref name=":00" /> |
− |
| |
| | | |
| === 现代用法 === | | === 现代用法 === |
第155行: |
第152行: |
| | | |
| 目前,对于数据科学的定义依旧没有达成共识,有些人认为这是一个流行词。<ref>{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/|title=Data Science: What's The Half-Life Of A Buzzword?|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref> | | 目前,对于数据科学的定义依旧没有达成共识,有些人认为这是一个流行词。<ref>{{Cite web|url=https://www.forbes.com/sites/gilpress/2013/08/19/data-science-whats-the-half-life-of-a-buzzword/|title=Data Science: What's The Half-Life Of A Buzzword?|last=Press|first=Gil|website=Forbes|language=en|access-date=2020-04-03}}</ref> |
− |
| |
| | | |
| ==研究内容== | | ==研究内容== |
第173行: |
第169行: |
| ===数据管理=== | | ===数据管理=== |
| 在完成"数据预处理"(或"数据计算")之后,我们需要对数据进行管理,以便进行(再次进行)"数据处理"以及数据的再利用和长久保管。在数据科学中,数据管理方法与技术发生了根本性的改变--不仅包括传统关系型数据库,而且还出现了一些新兴数据管理技术,例如NoSQL、NewSQL技术和关系云等。 | | 在完成"数据预处理"(或"数据计算")之后,我们需要对数据进行管理,以便进行(再次进行)"数据处理"以及数据的再利用和长久保管。在数据科学中,数据管理方法与技术发生了根本性的改变--不仅包括传统关系型数据库,而且还出现了一些新兴数据管理技术,例如NoSQL、NewSQL技术和关系云等。 |
− |
| |
| | | |
| ==数据科学的相关职业== | | ==数据科学的相关职业== |
第193行: |
第188行: |
| | | |
| * 应用程序架构师: 应用程序架构师跟踪应用程序在整个业务中的使用情况,以及其与用户和其他应用程序的交互情况.<ref name=":4" /> | | * 应用程序架构师: 应用程序架构师跟踪应用程序在整个业务中的使用情况,以及其与用户和其他应用程序的交互情况.<ref name=":4" /> |
− |
| |
| | | |
| ==数据科学的影响 == | | ==数据科学的影响 == |
第214行: |
第208行: |
| | | |
| 这种冲击至少表现在两个方面。一是关于数据的模型将会跳出传统的统计模型的框架。更一般的数学概念,如拓扑、几何和随机场的概念将会在数据分析中扮演重要的角色。二是算法和分布式计算将成为研究的中心课题之一。 | | 这种冲击至少表现在两个方面。一是关于数据的模型将会跳出传统的统计模型的框架。更一般的数学概念,如拓扑、几何和随机场的概念将会在数据分析中扮演重要的角色。二是算法和分布式计算将成为研究的中心课题之一。 |
− |
| |
| | | |
| == 所涉及的科技和技术== | | == 所涉及的科技和技术== |
| 根据应用的不同,数据科学采用了多种不同的科技和技术。 | | 根据应用的不同,数据科学采用了多种不同的科技和技术。 |
− |
| |
| | | |
| === 技术 === | | === 技术 === |
第391行: |
第383行: |
| | | |
| 来源:https://blog.csdn.net/dev_csdn/article/details/79127658 翻译原文http://varianceexplained.org/r/ds-ml-ai/ 原文作者:David Robinson | | 来源:https://blog.csdn.net/dev_csdn/article/details/79127658 翻译原文http://varianceexplained.org/r/ds-ml-ai/ 原文作者:David Robinson |
− |
| |
| | | |
| ==与统计学的关系== | | ==与统计学的关系== |
第576行: |
第567行: |
| | | |
| {{Reflist|35em}} | | {{Reflist|35em}} |
− |
| |
| | | |
| ==编者推荐== | | ==编者推荐== |