更改

添加1,451字节 、 2020年5月10日 (日) 21:17
第521行: 第521行:  
大数据还引起了科技界对科学研究方法论的重新审视,正在引发科学研究思维与方法的一场革命。最早的科学研究只有实验科学,随后出现了以研究各种定律和定理为特征的理论科学。由于理论分析方法在许多问题上过于复杂,难以解决实际问题,人们开始寻求模拟的方法,导致计算科学的兴起。海量数据的出现催生了一种新的科研模式,即面对海量数据,科研人员只需从数据中直接查找或挖掘所需要的信息、知识和智慧,甚至无需直接接触需研究的对象。2007年,已故的图灵奖得主吉姆·格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科学研究的“第四范式”(TheFourth Paradigm)[5],把数据密集型科学从计算科学中单独区分开来。格雷认为,要解决我们面临的某些最棘手的全球性挑战,“第四范式”可能是唯一具有系统性的方法。其实,“第四范式”不仅是
 
大数据还引起了科技界对科学研究方法论的重新审视,正在引发科学研究思维与方法的一场革命。最早的科学研究只有实验科学,随后出现了以研究各种定律和定理为特征的理论科学。由于理论分析方法在许多问题上过于复杂,难以解决实际问题,人们开始寻求模拟的方法,导致计算科学的兴起。海量数据的出现催生了一种新的科研模式,即面对海量数据,科研人员只需从数据中直接查找或挖掘所需要的信息、知识和智慧,甚至无需直接接触需研究的对象。2007年,已故的图灵奖得主吉姆·格雷(Jim Gray)在他最后一次演讲中描绘了数据密集型科学研究的“第四范式”(TheFourth Paradigm)[5],把数据密集型科学从计算科学中单独区分开来。格雷认为,要解决我们面临的某些最棘手的全球性挑战,“第四范式”可能是唯一具有系统性的方法。其实,“第四范式”不仅是
 
科研方式的转变,也是人们思维方式的大变化。
 
科研方式的转变,也是人们思维方式的大变化。
 +
 +
 +
 不仅如此,数据分析几乎涉及到了现代数学的所有分支。甚至于像表示论这样的极其抽象的分支,在数据科学领域也有其发挥作用的余地。所以数据科学对数学的要求和推动是全面的,而不是仅仅局限在几个领域。数据应该成为数、图形和方程之外数学研究的基本对象之一。
 +
 +
  对计算机学科的影响
 +
 +
  数据科学对计算机科学的发展也会带来很大的影响。图灵奖得主John Hopcroft曾经指出,在过去的几十年里,计算机科学的研究对象主要是计算机本身,包括硬件和软件。以后计算机科学的发展将主要围绕应用展开。而从计算机科学自身来看,这些应用领域提供的主要研究对象就是数据。虽然计算机科学一贯重视数据的研究,但数据在其中的地位将会得到更进一步的加强。
 +
 +
  对统计学的影响
 +
 +
  再看统计学。统计学一直就是一门研究数据的学科。所以它也是数据科学最核心的部分之一。但在数据科学的框架之下,统计学的发展也会受到很大的冲击。
 +
 +
  这种冲击至少表现在两个方面。一是关于数据的模型将会跳出传统的统计模型的框架。更一般的数学概念,如拓扑、几何和随机场的概念将会在数据分析中扮演重要的角色。二是算法和分布式计算将成为研究的中心课题之一。
    
== Technologies and techniques 所涉及的技术和应用软件==
 
== Technologies and techniques 所涉及的技术和应用软件==
377

个编辑