更改

跳到导航 跳到搜索
删除21字节 、 2022年3月6日 (日) 23:41
无编辑摘要
第3行: 第3行:  
|description=一词的当前用法倾向于指预测分析、用户行为分析或其他从大数据中提取价值的高级数据分析方法
 
|description=一词的当前用法倾向于指预测分析、用户行为分析或其他从大数据中提取价值的高级数据分析方法
 
}}
 
}}
   
[[File:Hilbert InfoGrowth.png|thumb|right|400px|全球数字信息存储容量的非线性增长和模拟存储的减少。<ref>{{cite journal|url= http://www.martinhilbert.net/WorldInfoCapacity.html|title= The World's Technological Capacity to Store, Communicate, and Compute Information|volume= 332|issue= 6025|pages= 60–65|journal=Science|access-date= 13 April 2016|bibcode= 2011Sci...332...60H|last1= Hilbert|first1= Martin|last2= López|first2= Priscila|year= 2011|doi= 10.1126/science.1200970|pmid= 21310967}}</ref>]]
 
[[File:Hilbert InfoGrowth.png|thumb|right|400px|全球数字信息存储容量的非线性增长和模拟存储的减少。<ref>{{cite journal|url= http://www.martinhilbert.net/WorldInfoCapacity.html|title= The World's Technological Capacity to Store, Communicate, and Compute Information|volume= 332|issue= 6025|pages= 60–65|journal=Science|access-date= 13 April 2016|bibcode= 2011Sci...332...60H|last1= Hilbert|first1= Martin|last2= López|first2= Priscila|year= 2011|doi= 10.1126/science.1200970|pmid= 21310967}}</ref>]]
  −
   
'''大数据 Big data'''领域研究如何系统地从传统数据处理应用软件无法处理的太大或太复杂的数据集中提取、分析并处理信息。由于具有多个字段(列)的数据提供了更大的统计能力,同样,具有更高复杂性(更多属性或列)的数据也可能会导致更高的错误率。<ref>{{Cite journal|last=Breur|first=Tom|date=July 2016|title=Statistical Power Analysis and the contemporary "crisis" in social sciences|journal=Journal of Marketing Analytics |publisher=[[Palgrave Macmillan]]|location=London, England|volume=4 |issue=2–3 |pages=61–65 |doi=10.1057/s41270-016-0001-3 |issn=2050-3318|doi-access=free}}</ref>大数据分析挑战包括捕获数据、[[数据存储]]、[[数据分析]]、数据搜索、[[数据共享]]、[[数据传输]]、[[数据可视化]]、数据查询、数据更新、信息隐私和数据源。大数据最初与三个关键概念有关:大数据量、多样性和高速度。<ref name=":0" />大数据分析意味着抽样存在挑战,因此旧技术只能进行观察和抽样。而大数据分析通常包括超过传统软件在有限时间及性能内能处理的数据量。
 
'''大数据 Big data'''领域研究如何系统地从传统数据处理应用软件无法处理的太大或太复杂的数据集中提取、分析并处理信息。由于具有多个字段(列)的数据提供了更大的统计能力,同样,具有更高复杂性(更多属性或列)的数据也可能会导致更高的错误率。<ref>{{Cite journal|last=Breur|first=Tom|date=July 2016|title=Statistical Power Analysis and the contemporary "crisis" in social sciences|journal=Journal of Marketing Analytics |publisher=[[Palgrave Macmillan]]|location=London, England|volume=4 |issue=2–3 |pages=61–65 |doi=10.1057/s41270-016-0001-3 |issn=2050-3318|doi-access=free}}</ref>大数据分析挑战包括捕获数据、[[数据存储]]、[[数据分析]]、数据搜索、[[数据共享]]、[[数据传输]]、[[数据可视化]]、数据查询、数据更新、信息隐私和数据源。大数据最初与三个关键概念有关:大数据量、多样性和高速度。<ref name=":0" />大数据分析意味着抽样存在挑战,因此旧技术只能进行观察和抽样。而大数据分析通常包括超过传统软件在有限时间及性能内能处理的数据量。
   第29行: 第26行:       −
在一项大数据集的对比研究中,Kitchin和McArdle发现,在所有分析案例中,大数据的常见特征并不都一致。<ref>{{cite journal | last1 = Kitchin | first1 = Rob | last2 = McArdle | first2 = Gavin | year = 2016 | title = What makes Big Data, Big Data? Exploring the ontological characteristics of 26 datasets | journal = Big Data & Society | volume = 3 | pages = 1–10 | doi = 10.1177/2053951716631130}}</ref>因此,其他研究将知识发现中权力动力学的重新定义确定为知识发现的定义特征。<ref>{{cite journal | last1 = Balazka | first1 = Dominik | last2 = Rodighiero | first2 = Dario | year = 2020 | title = Big Data and the Little Big Bang: An Epistemological (R)evolution | journal = Frontiers in Big Data | volume = 3 | page = 31 | doi = 10.3389/fdata.2020.00031 | pmid = 33693404 | pmc = 7931920 | hdl = 1721.1/128865 | hdl-access = free | doi-access = free }}</ref>这种另类视角没有关注大数据的内在特征,而是推动了对对象的关系理解,声称重要的是数据的收集、存储、可用和分析方式。
+
在一项大数据集的对比研究中,Kitchin和McArdle发现,在所有分析案例中,大数据的常见特征并不都一致。<ref>{{cite journal | last1 = Kitchin | first1 = Rob | last2 = McArdle | first2 = Gavin | year = 2016 | title = What makes Big Data, Big Data? Exploring the ontological characteristics of 26 datasets | journal = Big Data & Society | volume = 3 | pages = 1–10 | doi = 10.1177/2053951716631130}}</ref>因此,其他研究将知识发现中权力动力学的重新定义确定为知识发现的定义特征。<ref>{{cite journal | last1 = Balazka | first1 = Dominik | last2 = Rodighiero | first2 = Dario | year = 2020 | title = Big Data and the Little Big Bang: An Epistemological (R)evolution | journal = Frontiers in Big Data | volume = 3 | page = 31 | doi = 10.3389/fdata.2020.00031 | pmc = 7931920 | hdl = 1721.1/128865 | hdl-access = free | doi-access = free }}</ref>这种另类视角没有关注大数据的内在特征,而是推动了对对象的关系理解,声称重要的是数据的收集、存储、可用和分析方式。
     
7,129

个编辑

导航菜单