第6行: |
第6行: |
| | | |
| | | |
− | '''数据挖掘 Data mining'''是一种特殊的数据分析技术,侧重于统计建模和探索未来知识前景(而不仅仅是的描述行为目的)。同时,现代智能商业严重依赖于聚合的数据分析,尤其是在商业信息方面。在统计应用中,数据分析可以分为'''描述性统计学descriptive statistics'''、'''探索性数据分析exploratory data analysis (EDA)'''和'''实证性数据分析 confirmatory data analysis (CDA)'''。EDA 侧重于发现数据中的新特征,而 CDA 侧重于确认或证伪现有的假设。'''预测分析Predictive analytics'''的重点是应用统计模型进行预测或分类,而'''文本分析text analytics'''则应用统计学、语言学和结构化技术从文本源中提取和分类信息(文本是一种'''非结构化数据''')。以上就是各种各样的数据分析。 | + | '''数据挖掘 Data mining'''是一种特殊的数据分析技术,侧重于统计建模和探索未来知识前景(而不仅仅是的描述行为目的)。同时,现代智能商业严重依赖于聚合的数据分析,尤其是在商业信息方面。<ref>[https://web.archive.org/web/20171018181046/https://spotlessdata.com/blog/exploring-data-analysis Exploring Data Analysis]</ref> 在统计应用中,数据分析可以分为'''描述性统计学descriptive statistics'''、'''探索性数据分析exploratory data analysis (EDA)'''和'''实证性数据分析 confirmatory data analysis (CDA)'''。EDA 侧重于发现数据中的新特征,而 CDA 侧重于确认或证伪现有的假设。'''预测分析Predictive analytics'''的重点是应用统计模型进行预测或分类,而'''文本分析text analytics'''则应用统计学、语言学和结构化技术从文本源中提取和分类信息(文本是一种'''非结构化数据''')。以上就是各种各样的数据分析。 |
| | | |
| | | |
− | '''数据整合 Data integration'''是数据分析的先驱,数据分析与'''数据可视化'''同'''数据传播data dissemination'''密切相关。 | + | '''数据整合 Data integration'''是数据分析的先驱,数据分析与'''数据可视化'''同'''数据传播data dissemination'''密切相关。<ref>{{Cite book|last=Sherman, Rick,|url=https://www.worldcat.org/oclc/894555128|title=Business intelligence guidebook : from data integration to analytics|isbn=978-0-12-411528-6|location=Amsterdam|oclc=894555128}}</ref> |
| | | |
| | | |
第15行: |
第15行: |
| ==数据分析的流程== | | ==数据分析的流程== |
| | | |
− | [[File:Data visualization process v1.png|right|350px|thumb|Data science process flowchart from ''Doing Data Science'', by Schutt & O'Neil (2013)]] | + | [[File:Data visualization process v1.png|right|350px|thumb|数据科学处理流程图,来自《'''数据科学实战 Doing Data Science'''》 ,Schutt & o’ neil (2013)]] |
| | | |
− | Data science process flowchart from Doing Data Science, by Schutt & O'Neil (2013)
| |
| | | |
− | 数据科学处理流程图,来自《'''数据科学实战 Doing Data Science'''》 ,Schutt & o’ neil (2013)
| |
| | | |
| | | |