更改

添加176字节 、 2020年10月28日 (三) 17:41
无编辑摘要
第6行: 第6行:       −
'''数据挖掘 Data mining'''是一种特殊的数据分析技术,侧重于统计建模和探索未来知识前景(而不仅仅是的描述行为目的)。同时,现代智能商业严重依赖于聚合的数据分析,尤其是在商业信息方面。在统计应用中,数据分析可以分为'''描述性统计学descriptive statistics'''、'''探索性数据分析exploratory data analysis (EDA)'''和'''实证性数据分析 confirmatory data analysis (CDA)'''。EDA 侧重于发现数据中的新特征,而 CDA 侧重于确认或证伪现有的假设。'''预测分析Predictive analytics'''的重点是应用统计模型进行预测或分类,而'''文本分析text analytics'''则应用统计学、语言学和结构化技术从文本源中提取和分类信息(文本是一种'''非结构化数据''')。以上就是各种各样的数据分析。
+
'''数据挖掘 Data mining'''是一种特殊的数据分析技术,侧重于统计建模和探索未来知识前景(而不仅仅是的描述行为目的)。同时,现代智能商业严重依赖于聚合的数据分析,尤其是在商业信息方面。<ref>[https://web.archive.org/web/20171018181046/https://spotlessdata.com/blog/exploring-data-analysis Exploring Data Analysis]</ref> 在统计应用中,数据分析可以分为'''描述性统计学descriptive statistics'''、'''探索性数据分析exploratory data analysis (EDA)'''和'''实证性数据分析 confirmatory data analysis (CDA)'''。EDA 侧重于发现数据中的新特征,而 CDA 侧重于确认或证伪现有的假设。'''预测分析Predictive analytics'''的重点是应用统计模型进行预测或分类,而'''文本分析text analytics'''则应用统计学、语言学和结构化技术从文本源中提取和分类信息(文本是一种'''非结构化数据''')。以上就是各种各样的数据分析。
      −
'''数据整合 Data integration'''是数据分析的先驱,数据分析与'''数据可视化'''同'''数据传播data dissemination'''密切相关。
+
'''数据整合 Data integration'''是数据分析的先驱,数据分析与'''数据可视化'''同'''数据传播data dissemination'''密切相关。<ref>{{Cite book|last=Sherman, Rick,|url=https://www.worldcat.org/oclc/894555128|title=Business intelligence guidebook : from data integration to analytics|isbn=978-0-12-411528-6|location=Amsterdam|oclc=894555128}}</ref>
      第15行: 第15行:  
==数据分析的流程==
 
==数据分析的流程==
   −
[[File:Data visualization process v1.png|right|350px|thumb|Data science process flowchart from ''Doing Data Science'', by Schutt&nbsp;& O'Neil (2013)]]
+
[[File:Data visualization process v1.png|right|350px|thumb|数据科学处理流程图,来自《'''数据科学实战 Doing Data Science'''》 ,Schutt & o’ neil (2013)]]
   −
Data science process flowchart from Doing Data Science, by Schutt&nbsp;& O'Neil (2013)
     −
数据科学处理流程图,来自《'''数据科学实战 Doing Data Science'''》 ,Schutt & o’ neil (2013)