第287行: |
第287行: |
| Big data is very quickly becoming a vital tool for businesses and companies of all sizes.<ref name=":5">{{Cite web|url=https://www.forbes.com/sites/peterpham/2015/08/28/the-impacts-of-big-data-that-you-may-not-have-heard-of/|title=The Impacts Of Big Data That You May Not Have Heard Of|last=Pham|first=Peter|website=Forbes|language=en|access-date=2020-04-03}}</ref> The availability and interpretation of big data has altered the business models of old industries and enabled the creation of new ones.<ref name=":5" /> Data-driven businesses are worth $1.2 trillion collectively in 2020, an increase from $333 billion in the year 2015.<ref name=":6">{{Cite web|url=https://towardsdatascience.com/how-data-science-will-impact-future-of-businesses-7f11f5699c4d|title=How Data Science will Impact Future of Businesses?|last=Martin|first=Sophia|date=2019-09-20|website=Medium|language=en|access-date=2020-04-03}}</ref> Data scientists are responsible for breaking down big data into usable information and creating software and algorithms that help companies and organizations determine optimal operations.<ref name=":6" /> As big data continues to have a major impact on the world, data science does as well due to the close relationship between the two.<ref name=":6" /> | | Big data is very quickly becoming a vital tool for businesses and companies of all sizes.<ref name=":5">{{Cite web|url=https://www.forbes.com/sites/peterpham/2015/08/28/the-impacts-of-big-data-that-you-may-not-have-heard-of/|title=The Impacts Of Big Data That You May Not Have Heard Of|last=Pham|first=Peter|website=Forbes|language=en|access-date=2020-04-03}}</ref> The availability and interpretation of big data has altered the business models of old industries and enabled the creation of new ones.<ref name=":5" /> Data-driven businesses are worth $1.2 trillion collectively in 2020, an increase from $333 billion in the year 2015.<ref name=":6">{{Cite web|url=https://towardsdatascience.com/how-data-science-will-impact-future-of-businesses-7f11f5699c4d|title=How Data Science will Impact Future of Businesses?|last=Martin|first=Sophia|date=2019-09-20|website=Medium|language=en|access-date=2020-04-03}}</ref> Data scientists are responsible for breaking down big data into usable information and creating software and algorithms that help companies and organizations determine optimal operations.<ref name=":6" /> As big data continues to have a major impact on the world, data science does as well due to the close relationship between the two.<ref name=":6" /> |
| | | |
| + | 大数据正在迅速成为不同规模的企业和公司的重要工具。大数据的可用性和对其的解释说明改变了旧行业的商业模式,并促进了新行业的产生。2015年,数据驱动型企业的总价值为3330亿,到2020年,这一数值已经增长到1.2万亿。数据科学家负责将大数据分解为可用信息,并创建软件和算法,来帮助公司和组织确定最佳操作。大数据持续对世界产生重大影响,由于两者之间的密切关系,数据科学也产生了同样重大的影响。 |
| | | |
| | | |
第293行: |
第294行: |
| | | |
| | | |
− | 大数据正迅速成为各种规模的企业和公司的重要工具。大数据的可用性和解释改变了旧行业的商业模式,并促成了新行业的创建。数据科学家负责将大数据分解成可用的信息,并创建软件和算法,帮助企业和组织确定最佳操作。随着大数据继续对世界产生重大影响,数据科学也由于两者之间的密切关系而产生重大影响。
| |
| | | |
− | 大数据还引起了科技界对科学研究方法论的重新审视,正在引发科学研究思维与方法的一场革命。最早的科学研究只有实验科学,随后出现了以研究各种定律和定理为特征的理论科学。由于理论分析方法在许多问题上过于复杂,难以解决实际问题,人们开始寻求模拟的方法,导致计算科学的兴起。海量数据的出现催生了一种新的科研模式,即面对海量数据,科研人员只需从数据中直接查找或挖掘所需要的信息、知识和智慧,甚至无需直接接触需研究的对象。2007年,已故的图灵奖得主吉姆·格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科学研究的“第四范式”(TheFourth Paradigm)[5],把数据密集型科学从计算科学中单独区分开来。格雷认为,要解决我们面临的某些最棘手的全球性挑战,“第四范式”可能是唯一具有系统性的方法。其实,“第四范式”不仅是 | + | 大数据还引起了科技界对科学研究方法论的重新审视,正在引发科学研究思维与方法的一场革命。最早的科学研究只有实验科学,随后出现了以研究各种定律和定理为特征的理论科学。由于理论分析方法在许多问题上过于复杂,难以解决实际问题,人们开始寻求模拟的方法,导致计算科学的兴起。海量数据的出现催生了一种新的科研模式,即面对海量数据,科研人员只需从数据中直接查找或挖掘所需要的信息、知识和智慧,甚至无需直接接触需研究的对象。2007年,已故的图灵奖得主吉姆·格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科学研究的“第四范式”(TheFourth Paradigm)[5],把数据密集型科学从计算科学中单独区分开来。格雷认为,要解决我们面临的某些最棘手的全球性挑战,“第四范式”可能是唯一具有系统性的方法。其实,“第四范式”不仅是科研方式的转变,也是人们思维方式的大变化。 |
− | 科研方式的转变,也是人们思维方式的大变化。
| |
| | | |
− | 不仅如此,数据分析几乎涉及到了现代数学的所有分支。甚至于像表示论这样的极其抽象的分支,在数据科学领域也有其发挥作用的余地。所以数据科学对数学的要求和推动是全面的,而不是仅仅局限在几个领域。数据应该成为数、图形和方程之外数学研究的基本对象之一。
| + | 不仅如此,数据分析几乎涉及到了现代数学的所有分支。甚至于像表示论这样的极其抽象的分支,在数据科学领域也有其发挥作用的余地。所以数据科学对数学的要求和推动是全面的,而不是仅仅局限在几个领域。数据应该成为数、图形和方程之外数学研究的基本对象之一。 |
| | | |
− | 对计算机学科的影响
| + | '''对计算机学科的影响''' |
| | | |
− | 数据科学对计算机科学的发展也会带来很大的影响。图灵奖得主John Hopcroft曾经指出,在过去的几十年里,计算机科学的研究对象主要是计算机本身,包括硬件和软件。以后计算机科学的发展将主要围绕应用展开。而从计算机科学自身来看,这些应用领域提供的主要研究对象就是数据。虽然计算机科学一贯重视数据的研究,但数据在其中的地位将会得到更进一步的加强。
| + | 数据科学对计算机科学的发展也会带来很大的影响。图灵奖得主John Hopcroft曾经指出,在过去的几十年里,计算机科学的研究对象主要是计算机本身,包括硬件和软件。以后计算机科学的发展将主要围绕应用展开。而从计算机科学自身来看,这些应用领域提供的主要研究对象就是数据。虽然计算机科学一贯重视数据的研究,但数据在其中的地位将会得到更进一步的加强。 |
| | | |
− | 对统计学的影响
| + | '''对统计学的影响''' |
| | | |
− | 再看统计学。统计学一直就是一门研究数据的学科。所以它也是数据科学最核心的部分之一。但在数据科学的框架之下,统计学的发展也会受到很大的冲击。
| + | 再看统计学。统计学一直就是一门研究数据的学科。所以它也是数据科学最核心的部分之一。但在数据科学的框架之下,统计学的发展也会受到很大的冲击。 |
| | | |
− | 这种冲击至少表现在两个方面。一是关于数据的模型将会跳出传统的统计模型的框架。更一般的数学概念,如拓扑、几何和随机场的概念将会在数据分析中扮演重要的角色。二是算法和分布式计算将成为研究的中心课题之一。
| + | 这种冲击至少表现在两个方面。一是关于数据的模型将会跳出传统的统计模型的框架。更一般的数学概念,如拓扑、几何和随机场的概念将会在数据分析中扮演重要的角色。二是算法和分布式计算将成为研究的中心课题之一。 |
| | | |
| == Technologies and techniques 所涉及的技术和应用软件== | | == Technologies and techniques 所涉及的技术和应用软件== |