更改

链路分析 (查看源代码)

2021年7月13日 (二) 00:13的版本

删除20字节、 2021年7月13日 (二) 00:13

无编辑摘要

第15行：第15行：

#数据可视化

−

数据的收集和处理需要访问数据，但此过程存在一些固有的问题，包括'''[[信息超载]] Information Overload'''和数据错误等。在数据被收集后，它将转换成一种人和计算机分析程序都能有效使用的格式。之后基于数据，可使用计算机生成的或人工操作的可视化工具进行作图（如网络图）。目前有几种算法可以帮助人类进行数据分析-'''迪杰斯特算法 Dijkstra’s algorithm'''，'''广度优先搜索 Breadth-First Search'''和''' 深度优先搜索 Depth-First Search'''。

+

数据的收集和处理需要访问数据，但此过程存在一些固有的问题，包括'''信息超载 Information Overload'''和数据错误等。在数据被收集后，它将转换成一种人和计算机分析程序都能有效使用的格式。之后基于数据，可使用计算机生成的或人工操作的可视化工具进行作图（如网络图）。目前有几种算法可以帮助人类进行数据分析-'''迪杰斯特算法 Dijkstra’s algorithm'''，'''广度优先搜索 Breadth-First Search'''和''' 深度优先搜索 Depth-First Search'''。

链路分析主要通过可视化方法(网络图、关联矩阵)分析节点之间的关系。这里有一个基于犯罪侦查绘制网图的例子:<ref name=Krebs>Krebs, V. E. 2001, [http://vlado.fmf.uni-lj.si/pub/networks/doc/Seminar/Krebs.pdf Mapping networks of terrorist cells], Connections 24, 43–52.</ref>

第69行：第69行：

博尔顿 Bolton &汉德 Hand 将统计数据分析定义为有监督或无监督的方法。<ref>Bolton, R. J. & Hand, D. J., Statistical Fraud Detection: A Review, Statistical Science, 2002, 17(3), pp. 235-255.</ref>'''监督式学习方法 Supervised Learning Methods'''要求在系统中有明确的规则来指出什么是预期行为，什么是意外行为。'''非监督式学习方法 Unsupervised Learning Methods'''在审视数据时，通过将数据与正常值的比较，来发现统计异常值。监督式学习方法能处理的场景是有限的，因为这种方法需要基于以前的模式建立训练规则。非监督式学习方法可以检测更广泛的问题。但是，如果数据的行为规范没有很好的建立或被机器理解，可能会导致较高的误报率。

−

数据本身存在固有的问题，包括完整性(或缺失性)和持续的改变。数据可能包含'''“由于收集或处理不当，以及试图欺骗或隐瞒其行为而造成的遗漏和委托错误”。''' <ref name="Link Analysis Workbench"/> Sparrow~~<ref>“Sparrow~~<ref>Sparrow M.K. 1991. Network Vulnerabilities and Strategic Intelligence in Law Enforcement’, [[International Journal of Intelligence and Counterintelligence]] Vol. 5 #3.</ref> 强调了数据分析中三个主要的问题，不完整性(数据或链路缺失的必然性)、模糊边界(边界确定的主观性)和动态变化(数据的持续变化性)。<ref name=Krebs/>

+

数据本身存在固有的问题，包括完整性(或缺失性)和持续的改变。数据可能包含'''“由于收集或处理不当，以及试图欺骗或隐瞒其行为而造成的遗漏和委托错误”。''' <ref name="Link Analysis Workbench"/> Sparrow<ref>Sparrow M.K. 1991. Network Vulnerabilities and Strategic Intelligence in Law Enforcement’, [[International Journal of Intelligence and Counterintelligence]] Vol. 5 #3.</ref>强调了数据分析中三个主要的问题，不完整性(数据或链路缺失的必然性)、模糊边界(边界确定的主观性)和动态变化(数据的持续变化性)。<ref name=Krebs/>

一旦数据转换成可用的格式，就会出现开放结构和交叉引用问题。魏斯曼 Waismann将''' 开放结构 Open Texture'''定义为在不同语境中使用经验词汇时不可避免的语义不确定性。<ref>Friedrich Waismann, Verifiability (1945), p.2.</ref>当试图从多个数据源搜索和交叉引用数据时，术语含义的不确定性带来了问题。<ref>Lyons, D., [http://ssrn.com/abstract=212328 Open Texture and the Possibility of Legal Interpretation (2000)].</ref>

唐糖糖

1,068

个编辑

更改

链路分析 (查看源代码)

2021年7月13日 (二) 00:13的版本

导航菜单

搜索