第3行: |
第3行: |
| * |description=人工智能,数据挖掘,模型评估 | | * |description=人工智能,数据挖掘,模型评估 |
| * }} | | * }} |
− | '''机器学习 Machine Learning,ML'''是计算机科学的分支——[[人工智能]]的一个子集,它通常使用统计学方法,借助数据,赋予计算机“学习”的能力(例如,逐渐提高在特定任务上的表现)而不需要明确编写学习过程<ref name =" 2w">The "without being explicitly programmed" definition is often attributed to Arthur Samuel, who coined the term "machine learning" in 1959. But the phrase is not found literally in this publication, and may be a paraphrase that appeared later. Confer "Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" in Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). [https://link.springer.com/chapter/10.1007/978-94-009-0279-4_9 Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming]. Artificial Intelligence in Design '96. Springer, Dordrecht. pp. 151–170. [https://doi.org/10.1007/978-94-009-0279-4_9 doi:10.1007/978-94-009-0279-4_9] </ref>。 | + | '''机器学习 Machine Learning(ML)'''是计算机科学的分支——[[人工智能]]的一个子集,它通常使用统计学方法,借助数据,赋予计算机“学习”的能力(例如,逐渐提高在特定任务上的表现)而不需要明确编写学习过程<ref name =" 2w">The "without being explicitly programmed" definition is often attributed to Arthur Samuel, who coined the term "machine learning" in 1959. But the phrase is not found literally in this publication, and may be a paraphrase that appeared later. Confer "Paraphrasing Arthur Samuel (1959), the question is: How can computers learn to solve problems without being explicitly programmed?" in Koza, John R.; Bennett, Forrest H.; Andre, David; Keane, Martin A. (1996). [https://link.springer.com/chapter/10.1007/978-94-009-0279-4_9 Automated Design of Both the Topology and Sizing of Analog Electrical Circuits Using Genetic Programming]. Artificial Intelligence in Design '96. Springer, Dordrecht. pp. 151–170. [https://doi.org/10.1007/978-94-009-0279-4_9 doi:10.1007/978-94-009-0279-4_9] </ref>。 |
| | | |
| <br>''机器学习''的名字是Arthur Samuel<ref name="Samuel">{{Cite journal|last=Samuel|first=Arthur|date=1959|title=[http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.368.2254 Some Studies in Machine Learning Using the Game of Checkers] |journal=IBM Journal of Research and Development|volume=3|issue=3|pages=210–229}}</ref> | | <br>''机器学习''的名字是Arthur Samuel<ref name="Samuel">{{Cite journal|last=Samuel|first=Arthur|date=1959|title=[http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.368.2254 Some Studies in Machine Learning Using the Game of Checkers] |journal=IBM Journal of Research and Development|volume=3|issue=3|pages=210–229}}</ref> |
第13行: |
第13行: |
| 避免了一系列严格的静态程序指令。机器学习被应用于那些设计运转良好、 清晰明确的算法十分困难或根本不可行的计算任务中 ;其应用范围包括电子邮件过滤、网络入侵者与针对数据泄露的恶意内部人员的探查、光学字符识别、学习排序、计算机视觉。 | | 避免了一系列严格的静态程序指令。机器学习被应用于那些设计运转良好、 清晰明确的算法十分困难或根本不可行的计算任务中 ;其应用范围包括电子邮件过滤、网络入侵者与针对数据泄露的恶意内部人员的探查、光学字符识别、学习排序、计算机视觉。 |
| | | |
− | <br>机器学习与计算统计学密切相关(而且常常与之重叠),计算统计学也专注于通过使用计算机进行预测。它与数学优化]有着很强的联系,后者为之提供了方法、理论和应用领域。机器学习有时与[[数据挖掘]]<ref>Mannila Heikki(1996). ''Data mining: machine learning, statistics, and databases.''Int'l Conf. Scientific and Statistical Database Management.IEEE Computer Society.</ref> 混为一谈,后者更侧重于探索性数据分析,被称为[[无监督学习]]<ref name="bishop2006" /><ref>{{cite journal |last=Friedman |first=Jerome H. | + | <br>机器学习与计算统计学密切相关(而且常常与之重叠),计算统计学也专注于通过使用计算机进行预测。它与数学优化]有着很强的联系,后者为之提供了方法、理论和应用领域。机器学习有时与[[数据挖掘]]<ref>Mannila Heikki(1996). ''Data mining: machine learning, statistics, and databases.''Int'l Conf. Scientific and Statistical Database Management.IEEE Computer Society.</ref> 混为一谈,后者更侧重于探索性数据分析,被称为[[无监督学习]]<ref name="bishop2006" /><ref>{{cite journal |last=Friedman |first=Jerome H. |
| |title=Data Mining and Statistics: What's the connection? |journal=Computing Science and Statistics |volume=29 |issue=1 |year=1998 |pages=3–9}}</ref>。机器学习也可以是无监督的,并可用于为各种实体,学习和建立基线行为轮廓,然后用于寻找有意义的异常。 | | |title=Data Mining and Statistics: What's the connection? |journal=Computing Science and Statistics |volume=29 |issue=1 |year=1998 |pages=3–9}}</ref>。机器学习也可以是无监督的,并可用于为各种实体,学习和建立基线行为轮廓,然后用于寻找有意义的异常。 |
| | | |
第21行: |
第21行: |
| | | |
| ==概述== | | ==概述== |
− | Tom M.Mitchell对机器学习领域中研究的算法提供了一个被广泛引用的、更正式的定义:“计算机程序被描述为从经验E中学习某些类型的任务T和性能度量P,如果它在T中的性能(用P来衡量)随着经验E而提高。” | + | Tom M.Mitchell对机器学习领域中研究的算法提供了一个被广泛引用的、更正式的定义:“计算机程序被描述为从经验E中学习某些类型的任务T和性能度量P,如果它在T中的性能(用P来衡量)随着经验E而提高。” |
− | <ref>{{cite book|author=Mitchell, T.|title=Machine Learning|publisher=McGraw Hill|isbn:978-0-07-042807-2|pages=2|year=1997}}</ref> 这一将机器学习与任务进行关联的定义提供了一个基本的[https://en.wikipedia.org/wiki/Operational_definition 可执行定义],而不是认知术语形式的定义。这与[[艾伦·图灵]]在他的论文“计算机器和智能”中的提议一脉相承,其中“机器能思考吗?”被替换为“机器能做我们(作为思维实体)能做的事情吗?” | + | <ref>{{cite book|author=Mitchell, T.|title=Machine Learning|publisher=McGraw Hill|isbn:978-0-07-042807-2|pages=2|year=1997}}</ref> 这一将机器学习与任务进行关联的定义提供了一个基本的[https://en.wikipedia.org/wiki/Operational_definition 可执行定义],而不是认知术语形式的定义。这与[[艾伦·图灵]]在他的论文“计算机器和智能”中的提议一脉相承,其中“机器能思考吗?”被替换为“机器能做我们(作为思维实体)能做的事情吗?” |
| <ref>Harnad, Stevan(2008), [http://eprints.ecs.soton.ac.uk/12954/ "The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence"], in Epstein, Robert; Peters, Grace, ''The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer '',Kluwer </ref> 。图灵的建议揭露了''思维机器''可能具有的各种特性以及构建机器时的诸多暗含之意 。 | | <ref>Harnad, Stevan(2008), [http://eprints.ecs.soton.ac.uk/12954/ "The Annotation Game: On Turing (1950) on Computing, Machinery, and Intelligence"], in Epstein, Robert; Peters, Grace, ''The Turing Test Sourcebook: Philosophical and Methodological Issues in the Quest for the Thinking Computer '',Kluwer </ref> 。图灵的建议揭露了''思维机器''可能具有的各种特性以及构建机器时的诸多暗含之意 。 |
| | | |
第30行: |
第30行: |
| * '''监督学习''':向计算机展示由“教师”提供的示例输入及其期望的输出,目标是学习将输入[https://en.wikipedia.org/wiki/Map_(mathematics) 映射]到输出的一般规则。作为特例,输入信号只能被部分提供,或仅限于特定反馈: | | * '''监督学习''':向计算机展示由“教师”提供的示例输入及其期望的输出,目标是学习将输入[https://en.wikipedia.org/wiki/Map_(mathematics) 映射]到输出的一般规则。作为特例,输入信号只能被部分提供,或仅限于特定反馈: |
| ** '''半监督学习''':只提供给计算机一个不完整的训练信号:一个训练集,其中有一些(通常很多)的目标输出丢失。 | | ** '''半监督学习''':只提供给计算机一个不完整的训练信号:一个训练集,其中有一些(通常很多)的目标输出丢失。 |
− | ** '''主动学习''':计算机只能获得有限的实例集(基于预算)的训练标签,还必须优化对象的选择以获取标签。当交互使用时,可以向用户展示这些对象以供标签。 | + | ** '''主动学习''':计算机只能获得有限的实例集(基于预算)的训练标签,还必须优化对象的选择以获取标签。当交互使用时,可以向用户展示这些对象以供标签。 |
− | ** '''强化学习''':训练数据(以奖励和惩罚的形式)只作为对程序在动态环境中的行为的反馈,例如[https://en.wikipedia.org/wiki/Autonomous_car 自动驾驶]或与对手玩游戏<ref name="bishop2006" />。 | + | ** '''强化学习''':训练数据(以奖励和惩罚的形式)只作为对程序在动态环境中的行为的反馈,例如自动驾驶或与对手玩游戏<ref name="bishop2006" />。 |
| * '''无监督学习''':没有标签给学习算法,留下它自己在其输入中找到结构。无监督学习本身可以是一个目标(发现数据中隐藏的模式),或者是一种达到目的的手段(特征学习)。 | | * '''无监督学习''':没有标签给学习算法,留下它自己在其输入中找到结构。无监督学习本身可以是一个目标(发现数据中隐藏的模式),或者是一种达到目的的手段(特征学习)。 |
| | | |
| | | |
| ===机器学习的应用=== | | ===机器学习的应用=== |
− | 当考虑机器学习系统的期望输出时,机器学习任务的另一种分类出现了。<ref name="bishop2006" />* 在分类中,输入被分成两个或多个类,学习者必须生成一个模型,将未被分类的输入分配给这些类的一个或多个(多标签分类)。这通常是以监督的方式处理的。垃圾邮件过滤是分类的一个例子,其中输入是电子邮件(或其他)消息,类是“垃圾邮件”和“非垃圾邮件”。 | + | 当考虑机器学习系统的期望输出时,机器学习任务的另一种分类出现了。<ref name="bishop2006" />* 在分类中,输入被分成两个或多个类,学习者必须生成一个模型,将未被分类的输入分配给这些类的一个或多个(多标签分类)。这通常是以监督的方式处理的。垃圾邮件过滤是分类的一个例子,其中输入是电子邮件(或其他)消息,类是“垃圾邮件”和“非垃圾邮件”。 |
| * 在回归中,也是一个有监督学习问题,输出是连续的而不是离散的。 | | * 在回归中,也是一个有监督学习问题,输出是连续的而不是离散的。 |
| * 在聚类中,一组输入被分为不同组。与分类不同的是,这些组事先是未知的,因此这通常是无监督学习的任务。 | | * 在聚类中,一组输入被分为不同组。与分类不同的是,这些组事先是未知的,因此这通常是无监督学习的任务。 |
| * 密度估计挖掘输入在某一空间的分布。 | | * 密度估计挖掘输入在某一空间的分布。 |
| * 维数约简通过将输入映射到低维空间来简化输入。主题建模是一个相关的问题,在这个问题中,程序会得到一个人类语言文档的列表,并负责找出哪些文档涵盖了类似的主题。 | | * 维数约简通过将输入映射到低维空间来简化输入。主题建模是一个相关的问题,在这个问题中,程序会得到一个人类语言文档的列表,并负责找出哪些文档涵盖了类似的主题。 |
− | 在其他类型的机器学习问题中, 元学习在以往经验的基础上学会了自己的归纳偏好。发育学习是为机器学习而发展起来的,它通过自主的自我探索和与人类教师的社会互动,利用主动学习、成熟、运动协同和模仿等引导机制,产生自己的学习情境序列(也称为课程),累积获得一系列新技能。 | + | 在其他类型的机器学习问题中, 元学习在以往经验的基础上学会了自己的归纳偏好。发育学习是为机器学习而发展起来的,它通过自主的自我探索和与人类教师的社会互动,利用主动学习、成熟、运动协同和模仿等引导机制,产生自己的学习情境序列(也称为课程),累积获得一系列新技能。 |
| | | |
| | | |
第58行: |
第58行: |
| | | |
| | | |
− | 机器学习和[[数据挖掘]]通常采用相同的方法,重叠程度很大。但是机器学习侧重于预测——基于从训练数据中学习到的''已知''属性,而数据挖掘则侧重于在数据中发现(以前的)''未知''属性(这是数据库中[https://en.wikipedia.org/wiki/Knowledge_discovery 知识发现]的分析步骤)。数据挖掘采用多种机器学习方法而目标不同;另一方面,机器学习也采用数据挖掘的方法作为“无监督学习”或作为预处理步骤来提高学习精度。这两个研究对象之间的许多混淆(它们通常有单独的会议和单独的期刊,ECML PKDD是一个主要的例外)来自于它们所使用的基本假设:在机器学习中,性能通常是根据''重复生产已知知识''的能力来评估的,而在知识发现和数据挖掘(KDD)中,关键任务是发现以前''未知''的知识。在对学习已知知识进行评估时,其他监督学习方法很容易优于无监督学习方法,而在典型的KDD任务中,由于训练数据的不可得性,则无法使用监督学习的方法。 | + | 机器学习和[[数据挖掘]]通常采用相同的方法,重叠程度很大。但是机器学习侧重于预测——基于从训练数据中学习到的''已知''属性,而数据挖掘则侧重于在数据中发现(以前的)''未知''属性(这是数据库中[[知识发现]]的分析步骤)。数据挖掘采用多种机器学习方法而目标不同;另一方面,机器学习也采用数据挖掘的方法作为“无监督学习”或作为预处理步骤来提高学习精度。这两个研究对象之间的许多混淆(它们通常有单独的会议和单独的期刊,ECML PKDD是一个主要的例外)来自于它们所使用的基本假设:在机器学习中,性能通常是根据''重复生产已知知识''的能力来评估的,而在知识发现和数据挖掘中,关键任务是发现以前''未知''的知识。在对学习已知知识进行评估时,其他监督学习方法很容易优于无监督学习方法,而在典型的KDD任务中,由于训练数据的不可得性,则无法使用监督学习的方法。 |
| | | |
| | | |
第134行: |
第134行: |
| | | |
| =====聚类===== | | =====聚类===== |
− | 聚类分析是将一组观测数据分配到子集(称为聚类)中,使同一簇内的观测按照某些预先指定的准则相似,而从不同的簇中提取的观测值则不同。不同的聚类技术对数据的结构提出了不同的假设,通常用某种相似性度量来定义,并通过内部紧密性(同一聚类成员之间的相似性)和不同聚类之间的分离性来评估。其他方法基于估计的密度和图的连通性。聚类是一种[[无监督学习]]方法,是一种常用的统计[[数据分析]]技术。
| + | 聚类分析是将一组观测数据分配到子集(称为聚类)中,使同一簇内的观测按照某些预先指定的准则相似,而从不同的簇中提取的观测值则不同。不同的聚类技术对数据的结构提出了不同的假设,通常用某种相似性度量来定义,并通过内部紧密性(同一聚类成员之间的相似性)和不同聚类之间的分离性来评估。其他方法基于估计的密度和图的连通性。聚类是一种[[无监督学习]]方法,是一种常用的统计[[数据分析]]技术。 |
| | | |
| | | |
第148行: |
第148行: |
| | | |
| | | |
− | 强化学习是机器学习的一个分支,它研究软件组件应该如何在某个环境中进行行动决策,以便最大化某种累积收益的概念。由于其存在的普遍性,该领域的研究在许多其他学科,如[[博弈论]],[[控制理论]],[[运筹学]],[[信息论]],'''基于仿真的优化 Simulation-based Optimization''',[[多主体系统]],'''群体智能 Swarm Intelligence''',统计学和[[遗传算法]]。在机器学习中,环境通常被表示为'''马可夫决策过程 Markov Decision Process(MDP)'''。许多强化学习算法使用动态编程技术。<ref>{{Cite book|title=Reinforcement learning and markov decision processes|author1=van Otterlo, M.|author2=Wiering, M.|journal=Reinforcement Learning |volume=12|pages=3–42 |year=2012 |doi=10.1007/978-3-642-27645-3_1|series=Adaptation, Learning, and Optimization|isbn=978-3-642-27644-6}}</ref> 强化学习算法不需要知道 MDP 的精确数学模型,而是在精确模型不可行的情况下使用。强化学习算法常用于车辆自动驾驶问题或人机游戏场景。 | + | 强化学习是机器学习的一个分支,它研究软件组件应该如何在某个环境中进行行动决策,以便最大化某种累积收益的概念。由于其存在的普遍性,该领域的研究在许多其他学科,如[[博弈论]],[[控制理论]],[[运筹学]],[[信息论]],'''基于仿真的优化 Simulation-based Optimization''',[[多主体系统]],'''群体智能 Swarm Intelligence''',统计学和[[遗传算法]]。在机器学习中,环境通常被表示为'''马可夫决策过程 Markov Decision Process(MDP)'''。许多强化学习算法使用动态编程技术。<ref>{{Cite book|title=Reinforcement learning and markov decision processes|author1=van Otterlo, M.|author2=Wiering, M.|journal=Reinforcement Learning |volume=12|pages=3–42 |year=2012 |doi=10.1007/978-3-642-27645-3_1|series=Adaptation, Learning, and Optimization|isbn=978-3-642-27644-6}}</ref> 强化学习算法不需要知道 MDP 的精确数学模型,而是在精确模型不可行的情况下使用。强化学习算法常用于车辆自动驾驶问题或人机游戏场景。 |
| | | |
| | | |
第170行: |
第170行: |
| | | |
| | | |
− | 它是一个只有一个输入、情景和一个输出、动作(或行为)的系统。既没有单独的强化输入,也没有来自环境的通知输入。反向传播价值(二次强化)是对结果情境的情感信息。CAA 存在于两种环境中,一种是行为环境,另一种是遗传环境,CAA将从这样的环境中获取且仅获取到一次关于它自身的初始情绪(这种情绪信息描述了算法应该对这样环境下对应的结果持有何种态度)。在从遗传环境中获得基因组(物种)载体后,CAA 会在一个既包含理想情况又包含不理想情况的环境中学习一种寻求目标的行为。<ref> Bozinovski, S. (2001) "Self-learning agents: A connectionist theory of emotion based on crossbar value judgment." Cybernetics and Systems 32(6) 637-667. </ref>
| + | 它是一个只有一个输入、情景和一个输出、动作(或行为)的系统。既没有单独的强化输入,也没有来自环境的通知输入。反向传播价值(二次强化)是对结果情境的情感信息。CAA 存在于两种环境中,一种是行为环境,另一种是遗传环境,CAA将从这样的环境中获取且仅获取到一次关于它自身的初始情绪(这种情绪信息描述了算法应该对这样环境下对应的结果持有何种态度)。在从遗传环境中获得基因组(物种)载体后,CAA 会在一个既包含理想情况又包含不理想情况的环境中学习一种寻求目标的行为。<ref> Bozinovski, S. (2001) "Self-learning agents: A connectionist theory of emotion based on crossbar value judgment." Cybernetics and Systems 32(6) 637-667. </ref> |
| | | |
| | | |
第177行: |
第177行: |
| 一些学习算法,大多是[[无监督学习]]算法,旨在发现更好的输入的训练数据的表示。经典的例子包括[[主成分分析]]和[[聚类分析]]。表示学习算法通常试图在输入中保留信息,并将其转换成有用的方式,通常是在执行分类或预测之前的预处理步骤,允许重构来自未知数据生成分布的输入,而不一定对不太可能服从该分布的结构可靠。 | | 一些学习算法,大多是[[无监督学习]]算法,旨在发现更好的输入的训练数据的表示。经典的例子包括[[主成分分析]]和[[聚类分析]]。表示学习算法通常试图在输入中保留信息,并将其转换成有用的方式,通常是在执行分类或预测之前的预处理步骤,允许重构来自未知数据生成分布的输入,而不一定对不太可能服从该分布的结构可靠。 |
| | | |
− | [https://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction#Manifold_learning_algorithms 流形学习]算法尝试处理被学习的数据表示是低维的情况。[https://en.wikipedia.org/wiki/Neural_coding#Sparse_coding 稀疏编码]算法尝试处理被学习的数据表示是稀疏(有多个零)的情况。[https://en.wikipedia.org/wiki/Multilinear_subspace_learning 多线性子空间学习]算法的目的是直接从多维数据的[https://en.wikipedia.org/wiki/Tensor 张量]表示中学习低维表示,而不将它们重构成(高维)向量<ref>{{cite journal |first1=Haiping |last1=Lu |first2=K.N. |last2=Plataniotis |first3=A.N. |last3=Venetsanopoulos |url=http://www.dsp.utoronto.ca/~haiping/Publication/SurveyMSL_PR2011.pdf |title=A Survey of Multilinear Subspace Learning for Tensor Data |journal=Pattern Recognition |volume=44 |number=7 |pages=1540–1551 |year=2011 }}</ref>。深度学习算法能发现数据表示的多个层次,或者由低级特征定义(或生成)的更高、更抽象的特征层次。有人认为,智能机器是一种学习表示法的机器,它能找出那些解释观测数据的潜在变异因素<ref>{{cite book | title = Learning Deep Architectures for AI | author = Yoshua Bengio | publisher = Now Publishers Inc. | year = 2009 | isbn : 978-1-60198-294-0 | pages = 1–3 | url = https://books.google.com/books?id=cq5ewg7FniMC&pg=PA3 }}</ref>。 | + | [https://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction#Manifold_learning_algorithms 流形学习]算法尝试处理被学习的数据表示是低维的情况。[https://en.wikipedia.org/wiki/Neural_coding#Sparse_coding 稀疏编码]算法尝试处理被学习的数据表示是稀疏(有多个零)的情况。[https://en.wikipedia.org/wiki/Multilinear_subspace_learning 多线性子空间学习]算法的目的是直接从多维数据的张量表示中学习低维表示,而不将它们重构成(高维)向量<ref>{{cite journal |first1=Haiping |last1=Lu |first2=K.N. |last2=Plataniotis |first3=A.N. |last3=Venetsanopoulos |url=http://www.dsp.utoronto.ca/~haiping/Publication/SurveyMSL_PR2011.pdf |title=A Survey of Multilinear Subspace Learning for Tensor Data |journal=Pattern Recognition |volume=44 |number=7 |pages=1540–1551 |year=2011 }}</ref>。深度学习算法能发现数据表示的多个层次,或者由低级特征定义(或生成)的更高、更抽象的特征层次。有人认为,智能机器是一种学习表示法的机器,它能找出那些解释观测数据的潜在变异因素<ref>{{cite book | title = Learning Deep Architectures for AI | author = Yoshua Bengio | publisher = Now Publishers Inc. | year = 2009 | isbn : 978-1-60198-294-0 | pages = 1–3 | url = https://books.google.com/books?id=cq5ewg7FniMC&pg=PA3 }}</ref>。 |
| | | |
| | | |
第231行: |
第231行: |
| =====学习分类器===== | | =====学习分类器===== |
| | | |
− | '''学习分类器系统 Learning Classifier Systems,LCS'''是一组[https://en.wikipedia.org/wiki/Rule-based_machine_learning 基于规则的机器学习]算法,它将发现组件(通常是[[遗传算法]])与学习组件(执行有[[监督学习]]、[[强化学习]]或[[无监督学习]])结合起来。他们试图找出一套与情境相关的规则,这些规则以一种分段的方式,集体存储和应用知识,以便进行预测<ref>{{Cite journal|last=Urbanowicz|first=Ryan J.|last2=Moore|first2=Jason H.|date=2009-09-22|title=Learning Classifier Systems: A Complete Introduction, Review, and Roadmap|url=http://www.hindawi.com/archive/2009/736398/|journal=Journal of Artificial Evolution and Applications|language=en|volume=2009|pages=1–25|issn:1687-6229}}</ref>。 | + | '''学习分类器系统 Learning Classifier Systems,LCS'''是一组[https://en.wikipedia.org/wiki/Rule-based_machine_learning 基于规则的机器学习]算法,它将发现组件(通常是[[遗传算法]])与学习组件(执行有[[监督学习]]、[[强化学习]]或[[无监督学习]])结合起来。他们试图找出一套与情境相关的规则,这些规则以一种分段的方式,集体存储和应用知识,以便进行预测<ref>{{Cite journal|last=Urbanowicz|first=Ryan J.|last2=Moore|first2=Jason H.|date=2009-09-22|title=Learning Classifier Systems: A Complete Introduction, Review, and Roadmap|url=http://www.hindawi.com/archive/2009/736398/|journal=Journal of Artificial Evolution and Applications|language=en|volume=2009|pages=1–25|issn:1687-6229}}</ref>。 |
| | | |
| | | |
| ===== 归纳逻辑规划 ===== | | ===== 归纳逻辑规划 ===== |
− | '''归纳逻辑规划 Inductive Logic Programming(ILP)'''是一种用逻辑规划作为输入示例、背景知识和假设的统一表示的规则学习方法。如果将已知的背景知识进行编码,并将一组示例表示为事实的逻辑数据库,ILP 系统将推导出一个假设的逻辑程序,其中包含所有正面和负面的样例。归纳编程是一个与其相关的领域,它考虑用任何一种编程语言来表示假设(不仅仅是逻辑编程),比如'''函数编程 Functional programs'''。 | + | '''归纳逻辑规划 Inductive Logic Programming(ILP)'''是一种用逻辑规划作为输入示例、背景知识和假设的统一表示的规则学习方法。如果将已知的背景知识进行编码,并将一组示例表示为事实的逻辑数据库,ILP 系统将推导出一个假设的逻辑程序,其中包含所有正面和负面的样例。归纳编程是一个与其相关的领域,它考虑用任何一种编程语言来表示假设(不仅仅是逻辑编程),比如'''函数编程 Functional programs'''。 |
| | | |
| | | |
− | 而'''归纳逻辑程序设计 Inductive Logic Programming'''是一种将[https://en.wikipedia.org/wiki/Logic_programming 逻辑编程]作为输入实例、背景知识和假设的统一表示的规则学习方法。给定已知背景知识的编码和作为事实逻辑数据库表示的一组示例,ILP系统将导出一个假设逻辑程序,其中包含所有正负示例。[https://en.wikipedia.org/wiki/Inductive_programming 归纳编程]是一个相关的领域,它考虑任何类型的编程语言来表示假设(而不仅仅是逻辑编程),例如[https://en.wikipedia.org/wiki/Functional_programming 函数程序]。 | + | 而'''归纳逻辑程序设计 Inductive Logic Programming'''是一种将[https://en.wikipedia.org/wiki/Logic_programming 逻辑编程]作为输入实例、背景知识和假设的统一表示的规则学习方法。给定已知背景知识的编码和作为事实逻辑数据库表示的一组示例,ILP系统将导出一个假设逻辑程序,其中包含所有正负示例。[https://en.wikipedia.org/wiki/Inductive_programming 归纳编程]是一个相关的领域,它考虑任何类型的编程语言来表示假设(而不仅仅是逻辑编程),例如函数程序。 |
| | | |
| | | |
第245行: |
第245行: |
| | | |
| ====相似性与度量学习==== | | ====相似性与度量学习==== |
− | 在这个问题中,学习机器给出了一对被认为相似的对象和一对不太相似的对象。然后,它需要学习一个相似函数(或距离度量函数),该函数可以预测新对象是否相似。该算法有时用于推荐系统。
| + | 在这个问题中,学习机器给出了一对被认为相似的对象和一对不太相似的对象。然后,它需要学习一个相似函数(或距离度量函数),该函数可以预测新对象是否相似。该算法有时用于推荐系统。 |
| | | |
| | | |
第257行: |
第257行: |
| | | |
| | | |
− | [[人工神经网络]](ANN)学习算法,通常称为神经网络(NN),是一种受生物神经网络启发的学习算法。计算是根据一组相互关联的[https://en.wikipedia.org/wiki/Artificial_neuron 人工神经元]来构造的,它们使用连接主义的计算方法来处理信息。现代神经网络是非线性统计数据建模工具。它们通常用于模拟输入和输出之间的复杂关系,在数据中找到模式,或在观测变量之间的未知[[联合概率分布]]中寻找统计结构。 | + | [[人工神经网络]](ANN)学习算法,通常称为神经网络(NN),是一种受生物神经网络启发的学习算法。计算是根据一组相互关联的人工神经元来构造的,它们使用连接主义的计算方法来处理信息。现代神经网络是非线性统计数据建模工具。它们通常用于模拟输入和输出之间的复杂关系,在数据中找到模式,或在观测变量之间的未知[[联合概率分布]]中寻找统计结构。 |
| | | |
| | | |
− | 人工神经网络是一种基于一组被称为“人工神经元”的连接单元或节点的模型,人工神经元可以对生物大脑中的神经元进行松散的建模。每一个连接,就像生物大脑中的突触一样,可以将信息,一个“信号” ,从一个人工神经元传递到另一个。接收到信号的人工神经元可以处理它,然后发送信号给连接到它的其他人工神经元。在通常的人工神经网络实现中,人工神经元之间连接处的信号是一个实数,每个人工神经元的输出是由一些输入和的非线性函数计算出来的。人造神经元之间的连接称为“边缘”。人工神经元和边缘通常有一个权重,可以随着学习的进行而调整。重量增加或减少连接处信号的强度。人工神经元可能有一个阈值,这样只有当聚合信号超过这个阈值时才发送信号。通常,人造神经元聚集成层。不同的层可以对其输入执行不同类型的转换。信号从第一层(输入层)传输到最后一层(输出层) ,可能是在多次遍历这些层之后。 | + | 人工神经网络是一种基于一组被称为“人工神经元”的连接单元或节点的模型,人工神经元可以对生物大脑中的神经元进行松散的建模。每一个连接,就像生物大脑中的突触一样,可以将信息,一个“信号” ,从一个人工神经元传递到另一个。接收到信号的人工神经元可以处理它,然后发送信号给连接到它的其他人工神经元。在通常的人工神经网络实现中,人工神经元之间连接处的信号是一个实数,每个人工神经元的输出是由一些输入和的非线性函数计算出来的。人造神经元之间的连接称为“边缘”。人工神经元和边缘通常有一个权重,可以随着学习的进行而调整。重量增加或减少连接处信号的强度。人工神经元可能有一个阈值,这样只有当聚合信号超过这个阈值时才发送信号。通常,人造神经元聚集成层。不同的层可以对其输入执行不同类型的转换。信号从第一层(输入层)传输到最后一层(输出层) ,可能是在多次遍历这些层之后。 |
| | | |
| | | |
第277行: |
第277行: |
| | | |
| ==== 支持向量机 ==== | | ==== 支持向量机 ==== |
− | '''支持向量机 SupportVectorMachine(SVMs)'''是一种用于分类和回归的[[监督学习]]算法。给出一组训练实例,每个样本会被标记为属于两类中的一个,SVM算法建立了一个模型来预测一个新的例子是否属于一个类别或另一个类别。<ref name="CorinnaCortes">{{Cite journal |last1=Cortes |first1=Corinna |authorlink1=Corinna Cortes |last2=Vapnik |first2=Vladimir N. |year=1995 |title=Support-vector networks |journal=[[Machine Learning (journal)|Machine Learning]] |volume=20 |issue=3 |pages=273–297 |doi=10.1007/BF00994018 |doi-access=free }}</ref>支持向量机的训练算法用到的是一种非概率的二进制线性分类器,尽管在概率分类环境中也存在使用支持向量机的方法,如 Platt 缩放法。除了执行线性分类,支持向量机可以有效地执行非线性分类使用所谓的'''核技巧 Kernel trick''',隐式地将模型输入映射到高维特征空间。 | + | '''支持向量机 SupportVectorMachine(SVMs)'''是一种用于分类和回归的[[监督学习]]算法。给出一组训练实例,每个样本会被标记为属于两类中的一个,SVM算法建立了一个模型来预测一个新的例子是否属于一个类别或另一个类别。<ref name="CorinnaCortes">{{Cite journal |last1=Cortes |first1=Corinna |authorlink1=Corinna Cortes |last2=Vapnik |first2=Vladimir N. |year=1995 |title=Support-vector networks |journal=[[Machine Learning (journal)|Machine Learning]] |volume=20 |issue=3 |pages=273–297 |doi=10.1007/BF00994018 |doi-access=free }}</ref>支持向量机的训练算法用到的是一种非概率的二进制线性分类器,尽管在概率分类环境中也存在使用支持向量机的方法,如 Platt 缩放法。除了执行线性分类,支持向量机可以有效地执行非线性分类使用所谓的'''核技巧 Kernel trick''',隐式地将模型输入映射到高维特征空间。 |
| | | |
| [[Image:Linear regression.svg|thumb|upright=1.3|Illustration of linear regression on a data set.数据集上的线性回归]] | | [[Image:Linear regression.svg|thumb|upright=1.3|Illustration of linear regression on a data set.数据集上的线性回归]] |
第283行: |
第283行: |
| | | |
| ==== 回归分析 ==== | | ==== 回归分析 ==== |
− | '''回归分析 Regression Analysis'''包含了大量的统计方法来估计输入变量和它们的相关特征之间的关系。它最常见的形式是'''线性回归 Linear Regression''',根据一个数学标准,比如一般最小平方法,画一条线来最好地拟合给定的数据。后者通常通过正则化(数学)方法来扩展,以减少过拟合和偏差,如岭回归。在处理非线性问题时,常用的模型包括多项式回归(例如,在 Microsoft Excel 中用于趋势线拟合<ref>{{cite web|last1=Stevenson|first1=Christopher|title=Tutorial: Polynomial Regression in Excel|url=https://facultystaff.richmond.edu/~cstevens/301/Excel4.html|website=facultystaff.richmond.edu|accessdate=22 January 2017}}</ref>)、 Logit模型回归(通常用于分类)甚至核回归,它利用核技巧将输入变量隐式地映射到更高维度空间,从而引入了非线性。 | + | '''回归分析 Regression Analysis'''包含了大量的统计方法来估计输入变量和它们的相关特征之间的关系。它最常见的形式是'''线性回归 Linear Regression''',根据一个数学标准,比如一般最小平方法,画一条线来最好地拟合给定的数据。后者通常通过正则化(数学)方法来扩展,以减少过拟合和偏差,如岭回归。在处理非线性问题时,常用的模型包括多项式回归(例如,在 Microsoft Excel 中用于趋势线拟合<ref>{{cite web|last1=Stevenson|first1=Christopher|title=Tutorial: Polynomial Regression in Excel|url=https://facultystaff.richmond.edu/~cstevens/301/Excel4.html|website=facultystaff.richmond.edu|accessdate=22 January 2017}}</ref>)、 Logit模型回归(通常用于分类)甚至核回归,它利用核技巧将输入变量隐式地映射到更高维度空间,从而引入了非线性。 |
| | | |
| <br> | | <br> |
第290行: |
第290行: |
| [[Image:SimpleBayesNetNodes.svg|thumb|right|A simple Bayesian network. Rain influences whether the sprinkler is activated, and both rain and the sprinkler influence whether the grass is wet. 一个简单的贝叶斯网路。雨水会影响喷头是否被激活,而雨水和喷头都会影响草地是否湿润。]] | | [[Image:SimpleBayesNetNodes.svg|thumb|right|A simple Bayesian network. Rain influences whether the sprinkler is activated, and both rain and the sprinkler influence whether the grass is wet. 一个简单的贝叶斯网路。雨水会影响喷头是否被激活,而雨水和喷头都会影响草地是否湿润。]] |
| | | |
− | '''贝叶斯网路 Bayesian Network''',或称信任网络或者有向无环图形模型是通过'''[https://en.wikipedia.org/wiki/Directed_acyclic_graph 有向无环图] DAG'''表示一组[https://en.wikipedia.org/wiki/Random_variable 随机变量]及其[https://en.wikipedia.org/wiki/Conditional_independence 条件独立性]的[https://en.wikipedia.org/wiki/Graphical_model 概率图形模型]。例如,贝叶斯网络可以表示疾病和症状之间的概率关系。给定症状,网络可以用来计算各种疾病出现的概率。有效的算法可以进行[https://en.wikipedia.org/wiki/Inference 推理]和学习。 | + | '''贝叶斯网路 Bayesian Network''',或称信任网络或者有向无环图形模型是通过[[有向无环图]]表示一组随机变量及其条件独立性的概率图形模型。例如,贝叶斯网络可以表示疾病和症状之间的概率关系。给定症状,网络可以用来计算各种疾病出现的概率。有效的算法可以进行推理和学习。 |
| | | |
| | | |
第299行: |
第299行: |
| ==== 遗传算法==== | | ==== 遗传算法==== |
| | | |
− | '''遗传算法 Genetic Algorithm(GA)'''是一种模拟[https://en.wikipedia.org/wiki/Natural_selection 自然选择]过程的[https://en.wikipedia.org/wiki/Search_algorithm 搜索][https://en.wikipedia.org/wiki/Heuristic_(computer_science) 启发]式算法,它利用[https://en.wikipedia.org/wiki/Mutation_(genetic_algorithm) 变异]和[https://en.wikipedia.org/wiki/Crossover_(genetic_algorithm) 重组]等方法生成新的[https://en.wikipedia.org/wiki/Chromosome_(genetic_algorithm) 基因型],以期为给定问题找到好的解决方案。在机器学习中,遗传算法在20世纪80年代和90年代得到了一些应用 | + | '''遗传算法 Genetic Algorithm(GA)'''是一种模拟自然选择过程的搜索启发式算法,它利用变异和重组等方法生成新的基因型,以期为给定问题找到好的解决方案。在机器学习中,遗传算法在20世纪80年代和90年代得到了一些应用<ref>{{cite journal |last1=Goldberg |first1=David E. |first2=John H. |last2=Holland |title=Genetic algorithms and machine learning |journal=Machine Learning |volume=3 |issue=2 |year=1988 |pages=95–99 }}</ref><ref>{{cite book |title=Machine Learning, Neural and Statistical Classification |first1=D. |last1=Michie |first2=D. J. |last2=Spiegelhalter |first3=C. C. |last3=Taylor |year=1994 |publisher=Ellis Horwood}}</ref>。相反,机器学习技术被用来改进遗传算法和[[进化算法]]的性能<ref>{{cite journal |last1=Zhang |first1=Jun |last2=Zhan |first2=Zhi-hui |last3=Lin |first3=Ying |last4=Chen |first4=Ni |last5=Gong |first5=Yue-jiao |last6=Zhong |first6=Jing-hui |last7=Chung |first7=Henry S.H. |last8=Li |first8=Yun |last9=Shi |first9=Yu-hui |title=Evolutionary Computation Meets Machine Learning: A Survey |journal=Computational Intelligence Magazine |year=2011 |volume=6 |issue=4 |pages=68–75 |url=http://ieeexplore.ieee.org/iel5/10207/6052357/06052374.pdf?arnumber=6052374 }}</ref>。 |
− | <ref>{{cite journal |last1=Goldberg |first1=David E. |first2=John H. |last2=Holland |title=Genetic algorithms and machine learning |journal=Machine Learning |volume=3 |issue=2 |year=1988 |pages=95–99 }}</ref><ref>{{cite book |title=Machine Learning, Neural and Statistical Classification |first1=D. |last1=Michie |first2=D. J. |last2=Spiegelhalter |first3=C. C. |last3=Taylor |year=1994 |publisher=Ellis Horwood}}</ref>。 | |
− | 相反,机器学习技术被用来改进遗传算法和[https://en.wikipedia.org/wiki/Evolutionary_algorithm 进化算法]的性能
| |
− | <ref>{{cite journal |last1=Zhang |first1=Jun |last2=Zhan |first2=Zhi-hui |last3=Lin |first3=Ying |last4=Chen |first4=Ni |last5=Gong |first5=Yue-jiao |last6=Zhong |first6=Jing-hui |last7=Chung |first7=Henry S.H. |last8=Li |first8=Yun |last9=Shi |first9=Yu-hui |title=Evolutionary Computation Meets Machine Learning: A Survey |journal=Computational Intelligence Magazine |year=2011 |volume=6 |issue=4 |pages=68–75 |url=http://ieeexplore.ieee.org/iel5/10207/6052357/06052374.pdf?arnumber=6052374 }}</ref>。 | |
| | | |
| <br> | | <br> |
第308行: |
第305行: |
| === 训练模型 === | | === 训练模型 === |
| 通常情况下,机器学习模型需要大量的数据才能有良好的性能,因此当训练一个机器学习模型时,需要从一个训练集中收集大量有代表性的数据样本。来自训练集的数据可以像文本语料库、图像集合和从服务的单个用户收集的数据一样多种多样。当训练一个机器学习模型时,需要特别注意过拟合问题。 | | 通常情况下,机器学习模型需要大量的数据才能有良好的性能,因此当训练一个机器学习模型时,需要从一个训练集中收集大量有代表性的数据样本。来自训练集的数据可以像文本语料库、图像集合和从服务的单个用户收集的数据一样多种多样。当训练一个机器学习模型时,需要特别注意过拟合问题。 |
− |
| |
| | | |
| | | |
第349行: |
第345行: |
| [https://en.wikipedia.org/wiki/Robot_locomotion 机器人移动]<br> | | [https://en.wikipedia.org/wiki/Robot_locomotion 机器人移动]<br> |
| [https://en.wikipedia.org/wiki/Web_search_engine 搜索引擎]<br> | | [https://en.wikipedia.org/wiki/Web_search_engine 搜索引擎]<br> |
− | [https://en.wikipedia.org/wiki/Sentiment_analysis 情感分析](意见挖掘)<br> | + | [https://en.wikipedia.org/wiki/Sentiment_analysis 情感分析](意见挖掘)<br> |
| [https://en.wikipedia.org/wiki/Sequence_mining 序列挖掘]<br> | | [https://en.wikipedia.org/wiki/Sequence_mining 序列挖掘]<br> |
| [https://en.wikipedia.org/wiki/Software_engineering 软件工程]<br> | | [https://en.wikipedia.org/wiki/Software_engineering 软件工程]<br> |
第362行: |
第358行: |
| | | |
| | | |
− | 2006年,在线电影公司Netflix举办了第一届“[https://en.wikipedia.org/wiki/Netflix_Prize Netflix奖]”竞赛,目的是寻找一个更好地预测用户喜好的程序,并将现有Cinematch电影推荐算法的准确性提高至少10%。由AT&T实验室的研究人员组成的一个联合团队与“大混乱与务实理论”合作,以100万美元的价格建立了一个集成模型<ref>[http://www2.research.att.com/~volinsky/netflix/ "BelKor Home Page"] research.att.com</ref> ,赢得了2009年的大奖。在颁奖后不久,Netflix意识到,观众的收视率并不是他们观看模式的最佳指标(“一切都是推荐的”),于是他们相应地改变了推荐引擎 | + | 2006年,在线电影公司Netflix举办了第一届“[https://en.wikipedia.org/wiki/Netflix_Prize Netflix奖]”竞赛,目的是寻找一个更好地预测用户喜好的程序,并将现有Cinematch电影推荐算法的准确性提高至少10%。由AT&T实验室的研究人员组成的一个联合团队与“大混乱与务实理论”合作,以100万美元的价格建立了一个集成模型<ref>[http://www2.research.att.com/~volinsky/netflix/ "BelKor Home Page"] research.att.com</ref> ,赢得了2009年的大奖。在颁奖后不久,Netflix意识到,观众的收视率并不是他们观看模式的最佳指标(“一切都是推荐的”),于是他们相应地改变了推荐引擎 |
| <ref>[http://techblog.netflix.com/2012/04/netflix-recommendations-beyond-5-stars.html "The Netflix Tech Blog: Netflix Recommendations: Beyond the 5 stars (Part 1)"]. Retrieved 8 August 2015.</ref>。 | | <ref>[http://techblog.netflix.com/2012/04/netflix-recommendations-beyond-5-stars.html "The Netflix Tech Blog: Netflix Recommendations: Beyond the 5 stars (Part 1)"]. Retrieved 8 August 2015.</ref>。 |
| | | |
第370行: |
第366行: |
| | | |
| | | |
− | 2012年,[https://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems]的联合创始人[https://en.wikipedia.org/wiki/Vinod_Khosla VinodKhosla]预测,在接下来的20年里,80%的医生将因自动机器学习医疗诊断软件而失业<ref> Vonod Khosla (January 10, 2012). [https://techcrunch.com/2012/01/10/doctors-or-algorithms/ "Do We Need Doctors or Algorithms?"]. Tech Crunch.</ref>。 | + | 2012年,[https://en.wikipedia.org/wiki/Sun_Microsystems Sun Microsystems]的联合创始人VinodKhosla预测,在接下来的20年里,80%的医生将因自动机器学习医疗诊断软件而失业<ref> Vonod Khosla (January 10, 2012). [https://techcrunch.com/2012/01/10/doctors-or-algorithms/ "Do We Need Doctors or Algorithms?"]. Tech Crunch.</ref>。 |
| | | |
| | | |
第387行: |
第383行: |
| [https://venturebeat.com/2016/09/17/why-the-a-i-euphoria-is-doomed-to-fail/ "Why the A.I. euphoria is doomed to fail"]. VentureBeat. 2016-09-18. Retrieved 2018-08-20. | | [https://venturebeat.com/2016/09/17/why-the-a-i-euphoria-is-doomed-to-fail/ "Why the A.I. euphoria is doomed to fail"]. VentureBeat. 2016-09-18. Retrieved 2018-08-20. |
| </ref> 。 | | </ref> 。 |
− | 造成这种情况的原因很多:缺乏(适当的)数据、无法访问数据、数据偏见、隐私问题、错误的任务选择和算法、错误的工具和人员、缺乏资源和评估问题<ref>
| + | 造成这种情况的原因很多:缺乏(适当的)数据、无法访问数据、数据偏见、隐私问题、错误的任务选择和算法、错误的工具和人员、缺乏资源和评估问题<ref> |
| [https://www.kdnuggets.com/2018/07/why-machine-learning-project-fail.html|title=9 Reasons why your machine learning project will fail "9 Reasons why your machine learning project will fail"]. www.kdnuggets.com. Retrieved 2018-08-20. | | [https://www.kdnuggets.com/2018/07/why-machine-learning-project-fail.html|title=9 Reasons why your machine learning project will fail "9 Reasons why your machine learning project will fail"]. www.kdnuggets.com. Retrieved 2018-08-20. |
| </ref>。 | | </ref>。 |
| | | |
− | 机器学习方法尤其会受到不同数据偏见的影响。只针对当前客户进行训练的机器学习系统可能无法预测训练数据中未表示的新客户组的需求。当接受人工数据训练时,机器学习很可能会产生与社会上已经存在的相同的成体制偏见和无意识偏见 | + | 机器学习方法尤其会受到不同数据偏见的影响。只针对当前客户进行训练的机器学习系统可能无法预测训练数据中未表示的新客户组的需求。当接受人工数据训练时,机器学习很可能会产生与社会上已经存在的相同的成体制偏见和无意识偏见<ref>{{Cite journal|last=Garcia|first=Megan|date=2016|title=Racist in the Machine|url=https://read.dukeupress.edu/world-policy-journal/article/33/4/111-117/30942|journal=World Policy Journal|language=en|volume=33|issue=4|pages=111–117|issn:0740-2775}}</ref> 。 |
− | <ref>{{Cite journal|last=Garcia|first=Megan|date=2016|title=Racist in the Machine|url=https://read.dukeupress.edu/world-policy-journal/article/33/4/111-117/30942|journal=World Policy Journal|language=en|volume=33|issue=4|pages=111–117|issn:0740-2775}}</ref> 。 | + | 从数据中学到的语言模型已被证明含有类似人类的偏见<ref>{{Cite journal|last=Caliskan|first=Aylin|last2=Bryson|first2=Joanna J.|last3=Narayanan|first3=Arvind|date=2017-04-14|title=Semantics derived automatically from language corpora contain human-like biases|url=http://science.sciencemag.org/content/356/6334/183|journal=Science|language=en|volume=356|issue=6334|pages=183–186|doi:10.1126/science.aal4230|issn:0036-8075|pmid:28408601}}</ref><ref>Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, D. D.; Sugiyama, M.; Luxburg, U. V.; Guyon, I., eds., [http://papers.nips.cc/paper/6227-an-algorithm-for-l1-nearest-neighbor-search-via-monotonic-embedding.pdf "An algorithm for L1 nearest neighbor search via monotonic embedding"] (PDF), ''Advances in Neural Information Processing Systems 29'', Curran Associates, Inc., pp. 983–991, Retrieved 2018-08-20</ref> 。用于犯罪风险评估的机器学习系统被发现对黑人有偏见<ref>[https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing "Machine Bias"]. ProPublica. Julia Angwin, Jeff Larson, Lauren Kirchner, Surya Mattu. 2016-05-23. Retrieved 2018-08-20.</ref><ref>[https://www.nytimes.com/2017/10/26/opinion/algorithm-compas-sentencing-bias.html "Opinion | When an Algorithm Helps Send You to Prison"]. New York Times. Retrieved 2018-08-20.</ref> 。在2015年,谷歌上黑人的照片常常被贴上大猩猩的标签<ref>[https://www.bbc.co.uk/news/technology-33347866 "Google apologises for racist blunder"]. BBC News. 2015-07-01. Retrieved 2018-08-20.</ref> ,而到2018年,这仍然没有得到很好的解决,但据报道,谷歌仍在使用变通方法将所有大猩猩从训练数据中删除,因此根本无法识别真正的大猩猩<ref>[https://www.theverge.com/2018/1/12/16882408/google-racist-gorillas-photo-recognition-algorithm-ai "Google 'fixed' its racist algorithm by removing gorillas from its image-labeling tech"]. The Verge. Retrieved 2018-08-20.</ref>。在许多其他系统中<ref>[https://www.nytimes.com/2016/06/26/opinion/sunday/artificial-intelligences-white-guy-problem.html "Opinion | Artificial Intelligence's White Guy Problem"]. New York Times. Retrieved 2018-08-20.</ref> ,也发现了识别非白人的类似问题。2016年,微软测试了一个从Twitter上学习的[https://en.wikipedia.org/wiki/Chatbot 聊天机器人],而后者却很快学会了种族主义和性别歧视的语言<ref>Metz, Rachel. [https://www.technologyreview.com/s/601111/why-microsoft-accidentally-unleashed-a-neo-nazi-sexbot/ "Why Microsoft's teen chatbot, Tay, said lots of awful things online"]. MIT Technology Review. Retrieved 2018-08-20.</ref>。由于这些挑战,机器在其他领域的有效使用仍有很长的路要走<ref>Simonite, Tom. [https://www.technologyreview.com/s/603944/microsoft-ai-isnt-yet-adaptable-enough-to-help-businesses/ "Microsoft says its racist chatbot illustrates how AI isn't adaptable enough to help most businesses"]. MIT Technology Review. Retrieved 2018-08-20.</ref>。2018年,[https://en.wikipedia.org/wiki/Uber Uber]的一辆自动驾驶汽车未能检测到行人并导致其在事故中丧生。<ref>[https://www.economist.com/the-economist-explains/2018/05/29/why-ubers-self-driving-car-killed-a-pedestrian "Why Uber's self-driving car killed a pedestrian"]. The Economist. Retrieved 2018-08-20.</ref>。IBM Watson系统在医疗保健领域使用机器学习的尝试,即便经过多年的时间和数十亿美元的投资,也未能实现<ref> |
− | 从数据中学到的语言模型已被证明含有类似人类的偏见 | + | [https://www.statnews.com/2018/07/25/ibm-watson-recommended-unsafe-incorrect-treatments/ "IBM's Watson recommended 'unsafe and incorrect' cancer treatments - STAT"]. STAT. 2018-07-25. Retrieved 2018-08-21.</ref><ref>Hernandez, Daniela; Greenwald, Ted (2018-08-11). [https://www.wsj.com/articles/ibm-bet-billions-that-watson-could-improve-cancer-treatment-it-hasnt-worked-1533961147 "IBM Has a Watson Dilemma"].Wall Street Journal. ISSN 0099-9660. Retrieved 2018-08-21. |
− | <ref>{{Cite journal|last=Caliskan|first=Aylin|last2=Bryson|first2=Joanna J.|last3=Narayanan|first3=Arvind|date=2017-04-14|title=Semantics derived automatically from language corpora contain human-like biases|url=http://science.sciencemag.org/content/356/6334/183|journal=Science|language=en|volume=356|issue=6334|pages=183–186|doi:10.1126/science.aal4230|issn:0036-8075|pmid:28408601}}</ref> | |
− | <ref> | |
− | Wang, Xinan; Dasgupta, Sanjoy (2016), Lee, D. D.; Sugiyama, M.; Luxburg, U. V.; Guyon, I., eds., | |
− | [http://papers.nips.cc/paper/6227-an-algorithm-for-l1-nearest-neighbor-search-via-monotonic-embedding.pdf "An algorithm for L1 nearest neighbor search via monotonic embedding"] (PDF), | |
− | ''Advances in Neural Information Processing Systems 29'', Curran Associates, Inc., pp. 983–991, Retrieved 2018-08-20 | |
− | </ref> 。 | |
− | 用于犯罪风险评估的机器学习系统被发现对黑人有偏见<ref>
| |
− | [https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing "Machine Bias"]. ProPublica. Julia Angwin, Jeff Larson, Lauren Kirchner, Surya Mattu. 2016-05-23. Retrieved 2018-08-20. | |
− | </ref> | |
− | <ref> | |
− | [https://www.nytimes.com/2017/10/26/opinion/algorithm-compas-sentencing-bias.html "Opinion | When an Algorithm Helps Send You to Prison"]. New York Times. Retrieved 2018-08-20. | |
− | </ref> | |
− | 。在2015年,谷歌上黑人的照片常常被贴上大猩猩的标签 | |
− | <ref> | |
− | [https://www.bbc.co.uk/news/technology-33347866 "Google apologises for racist blunder"]. BBC News. 2015-07-01. Retrieved 2018-08-20. | |
− | </ref> , | |
− | 而到2018年,这仍然没有得到很好的解决,但据报道,谷歌仍在使用变通方法将所有大猩猩从训练数据中删除,因此根本无法识别真正的大猩猩
| |
− | <ref> | |
− | [https://www.theverge.com/2018/1/12/16882408/google-racist-gorillas-photo-recognition-algorithm-ai "Google 'fixed' its racist algorithm by removing gorillas from its image-labeling tech"]. The Verge. Retrieved 2018-08-20. | |
− | </ref>。 | |
− | 在许多其他系统中
| |
− | <ref> | |
− | [https://www.nytimes.com/2016/06/26/opinion/sunday/artificial-intelligences-white-guy-problem.html "Opinion | Artificial Intelligence's White Guy Problem"]. New York Times. Retrieved 2018-08-20. | |
− | </ref> ,也发现了识别非白人的类似问题。2016年,微软测试了一个从Twitter上学习的[https://en.wikipedia.org/wiki/Chatbot 聊天机器人],而后者却很快学会了种族主义和性别歧视的语言 | |
− | <ref> | |
− | Metz, Rachel. | |
− | [https://www.technologyreview.com/s/601111/why-microsoft-accidentally-unleashed-a-neo-nazi-sexbot/ "Why Microsoft's teen chatbot, Tay, said lots of awful things online"]. MIT Technology Review. Retrieved 2018-08-20. | |
− | </ref>。 | |
− | 由于这些挑战,机器在其他领域的有效使用仍有很长的路要走
| |
− | <ref> | |
− | Simonite, Tom. [https://www.technologyreview.com/s/603944/microsoft-ai-isnt-yet-adaptable-enough-to-help-businesses/ "Microsoft says its racist chatbot illustrates how AI isn't adaptable enough to help most businesses"]. MIT Technology Review. Retrieved 2018-08-20. | |
− | </ref>。2018年,[https://en.wikipedia.org/wiki/Uber Uber]的一辆自动驾驶汽车未能检测到行人并导致其在事故中丧生。 | |
− | <ref> | |
− | [https://www.economist.com/the-economist-explains/2018/05/29/why-ubers-self-driving-car-killed-a-pedestrian "Why Uber's self-driving car killed a pedestrian"]. The Economist. Retrieved 2018-08-20. | |
− | </ref>。 | |
− | [https://en.wikipedia.org/wiki/Watson_(computer) IBM Watson]系统在医疗保健领域使用机器学习的尝试,即便经过多年的时间和数十亿美元的投资,也未能实现
| |
− | <ref> | |
− | [https://www.statnews.com/2018/07/25/ibm-watson-recommended-unsafe-incorrect-treatments/ "IBM's Watson recommended 'unsafe and incorrect' cancer treatments - STAT"]. STAT. 2018-07-25. Retrieved 2018-08-21. | |
− | </ref> | |
− | <ref> | |
− | Hernandez, Daniela; Greenwald, Ted (2018-08-11). | |
− | [https://www.wsj.com/articles/ibm-bet-billions-that-watson-could-improve-cancer-treatment-it-hasnt-worked-1533961147 "IBM Has a Watson Dilemma"]. | |
− | Wall Street Journal. ISSN 0099-9660. Retrieved 2018-08-21. | |
| </ref>。 | | </ref>。 |
| + | |
| | | |
| ==模型评估== | | ==模型评估== |
− | 分类机学习模型可以通过例如 [https://en.wikipedia.org/wiki/Training,_test,_and_validation_sets Holdout] 方法等精度估计技术来验证,该方法将训练和测试集(通常指定2/3为训练集,1/3为测试集)中的数据分开,并对训练模型在测试集上的性能进行评估。比较而言,N重[https://en.wikipedia.org/wiki/Cross-validation_(statistics) 交叉验证方法]将数据随机分成k个子集,其中使用k-1个实例来训练模型,而使用第k个实例来测试训练模型的预测能力。除了Holdout方法和交叉验证方法之外,[https://en.wikipedia.org/wiki/Bootstrapping Bootstrap]还可以使用从数据集中替换的n个实例来评估模型的准确性。
| + | 分类机学习模型可以通过例如Holdout方法等精度估计技术来验证,该方法将训练和测试集(通常指定2/3为训练集,1/3为测试集)中的数据分开,并对训练模型在测试集上的性能进行评估。比较而言,N重[https://en.wikipedia.org/wiki/Cross-validation_(statistics) 交叉验证方法]将数据随机分成k个子集,其中使用k-1个实例来训练模型,而使用第k个实例来测试训练模型的预测能力。除了Holdout方法和交叉验证方法之外,[https://en.wikipedia.org/wiki/Bootstrapping Bootstrap]还可以使用从数据集中替换的n个实例来评估模型的准确性。 |
| + | |
| + | |
| + | 除了总体准确性外,调查人员还经常报告敏感性和特异性,即真阳性率(TPR)和真阴性率(TNR)。同样,调查人员有时报告[https://en.wikipedia.org/wiki/False_positive_rate 假阳性率](FPR)和[https://en.wikipedia.org/wiki/False_positives_and_false_negatives#False_positive_and_false_negative_rates 假阴性率](FNR)。然而,这些比率不能显示它们的分子和分母。[https://en.wikipedia.org/wiki/Total_operating_characteristic 总运行特性](TOC)是表示模型诊断能力的一种有效方法。TOC显示上述比率的分子和分母,因此TOC提供的信息比常用的[https://en.wikipedia.org/wiki/Receiver_operating_characteristic 受试者工作特征](ROC)和曲线下ROC的关联区域(AUC)提供的信息更多<ref>{{cite journal|last1=Pontius|first1=Robert Gilmore|last2=Si|first2=Kangping|title=The total operating characteristic to measure diagnostic ability for multiple thresholds| journal=International Journal of Geographical Information Science|volume=28|issue=3|year=2014|pages=570–583|doi:10.1080/13658816.2013.862623}}</ref>。 |
| | | |
− | 除了总体准确性外,调查人员还经常报告[https://en.wikipedia.org/wiki/Sensitivity_and_specificity 敏感性和特异性],即真阳性率(TPR)和真阴性率(TNR)。同样,调查人员有时报告[https://en.wikipedia.org/wiki/False_positive_rate 假阳性率](FPR)和[https://en.wikipedia.org/wiki/False_positives_and_false_negatives#False_positive_and_false_negative_rates 假阴性率](FNR)。然而,这些比率不能显示它们的分子和分母。[https://en.wikipedia.org/wiki/Total_operating_characteristic 总运行特性](TOC)是表示模型诊断能力的一种有效方法。TOC显示上述比率的分子和分母,因此TOC提供的信息比常用的[https://en.wikipedia.org/wiki/Receiver_operating_characteristic 受试者工作特征](ROC)和曲线下ROC的关联区域(AUC)提供的信息更多<ref>{{cite journal|last1=Pontius|first1=Robert Gilmore|last2=Si|first2=Kangping|title=The total operating characteristic to measure diagnostic ability for multiple thresholds| journal=International Journal of Geographical Information Science|volume=28|issue=3|year=2014|pages=570–583|doi:10.1080/13658816.2013.862623}}</ref>。
| |
| | | |
| ==规范准则== | | ==规范准则== |
− | 机器学习导致了许多[https://en.wikipedia.org/wiki/Machine_ethics 伦理问题]。利用偏见收集的数据集进行训练的系统可能会在使用时表现出这些偏见([https://en.wikipedia.org/wiki/Algorithmic_bias 算法偏见]),从而将文化偏见数字化
| + | 机器学习导致了许多伦理问题。利用偏见收集的数据集进行训练的系统可能会在使用时表现出这些偏见(算法偏见),从而将文化偏见数字化 |
− | <ref> | + | <ref>Bostrom, Nick (2011). [http://www.nickbostrom.com/ethics/artificial-intelligence.pdf "The Ethics of Artificial Intelligence"] (PDF). Retrieved 11 April 2016. |
− | Bostrom, Nick (2011). | + | </ref> 。例如,使用具有种族主义雇用政策的公司的招聘数据可能导致机器学习系统复制这种偏见,方法是将求职者与先前成功申请者的相似性打分 |
− | [http://www.nickbostrom.com/ethics/artificial-intelligence.pdf "The Ethics of Artificial Intelligence"] (PDF). Retrieved 11 April 2016. | + | <ref name="Edionwe Outline">Edionwe, Tolulope. [https://theoutline.com/post/1571/the-fight-against-racist-algorithms "The fight against racist algorithms"]. The Outline. Retrieved 17 November 2017.</ref><ref name="Jeffries Outline">Jeffries, Adrianne. [https://theoutline.com/post/1439/machine-learning-is-racist-because-the-internet-is-racist "Machine learning is racist because the internet is racist"]. The Outline. Retrieved 17 November 2017.</ref> 。负责任的数据收集和系统使用的算法规则的记录是机器学习的一个关键部分。因为语言包含偏见,受过语料库训练的机器也必然会学习偏见<ref>Narayanan, Arvind (August 24, 2016). [https://freedom-to-tinker.com/2016/08/24/language-necessarily-contains-human-biases-and-so-will-machines-trained-on-language-corpora/ "Language necessarily contains human biases, and so will machines trained on language corpora"]. Freedom to Tinker.</ref>。 |
− | </ref> 。 | |
− | 例如,使用具有种族主义雇用政策的公司的招聘数据可能导致机器学习系统复制这种偏见,方法是将求职者与先前成功申请者的相似性打分
| |
− | <ref name="Edionwe Outline"> | |
− | Edionwe, Tolulope. | |
− | [https://theoutline.com/post/1571/the-fight-against-racist-algorithms "The fight against racist algorithms"]. The Outline. Retrieved 17 November 2017. | |
− | </ref> | |
− | <ref name="Jeffries Outline"> | |
− | Jeffries, Adrianne. | |
− | [https://theoutline.com/post/1439/machine-learning-is-racist-because-the-internet-is-racist "Machine learning is racist because the internet is racist"]. The Outline. Retrieved 17 November 2017. | |
− | </ref> 。负责任的[https://en.wikipedia.org/wiki/Data_collection 数据收集]和系统使用的算法规则的记录是机器学习的一个关键部分。 | |
| | | |
− | 因为语言包含偏见,受过[https://en.wikipedia.org/wiki/Text_corpus 语料]库训练的机器也必然会学习偏见
| |
− | <ref>
| |
− | Narayanan, Arvind (August 24, 2016).
| |
− | [https://freedom-to-tinker.com/2016/08/24/language-necessarily-contains-human-biases-and-so-will-machines-trained-on-language-corpora/ "Language necessarily contains human biases, and so will machines trained on language corpora"]. Freedom to Tinker.
| |
− | </ref>。
| |
| | | |
| 其他与个人偏见无关的道德挑战则更多地体现在医疗保健方面。医疗保健专业人士担心,这些系统可能不是为了公众利益而设计的,而是作为创收机器设计的。这在改善医疗保健和增加利润方面存在长期的道德困境的美国尤其如此。例如,这些算法可以设计为患者提供不必要的测试或药物治疗,而该算法的专属所有者在这些测试或药物中持有股份。在医疗保健领域,机器学习在成为为专业人员提供诊断、药物治疗甚至计划病人康复路径的伟大工具上有着巨大的潜力,但这在前面提到的个人偏见和这些“贪婪”偏见得到解决之前是不可能发生的<ref>Char, D. S., Shah, N. H., & Magnus, D. (2018). Implementing Machine Learning in Health Care—Addressing Ethical Challenges.New England Journal of Medicine,378(11), 981-983. doi:10.1056/nejmp1714229</ref>。 | | 其他与个人偏见无关的道德挑战则更多地体现在医疗保健方面。医疗保健专业人士担心,这些系统可能不是为了公众利益而设计的,而是作为创收机器设计的。这在改善医疗保健和增加利润方面存在长期的道德困境的美国尤其如此。例如,这些算法可以设计为患者提供不必要的测试或药物治疗,而该算法的专属所有者在这些测试或药物中持有股份。在医疗保健领域,机器学习在成为为专业人员提供诊断、药物治疗甚至计划病人康复路径的伟大工具上有着巨大的潜力,但这在前面提到的个人偏见和这些“贪婪”偏见得到解决之前是不可能发生的<ref>Char, D. S., Shah, N. H., & Magnus, D. (2018). Implementing Machine Learning in Health Care—Addressing Ethical Challenges.New England Journal of Medicine,378(11), 981-983. doi:10.1056/nejmp1714229</ref>。 |
| + | |
| | | |
| ==软件== | | ==软件== |
第472行: |
第414行: |
| | | |
| ===免费开源软件=== | | ===免费开源软件=== |
− | ·[https://en.wikipedia.org/wiki/Microsoft_Cognitive_Toolkit CNTK] ·[https://en.wikipedia.org/wiki/MLPACK_(C%2B%2B_library) MLPACK] ·[https://en.wikipedia.org/wiki/Apache_Spark#MLlib_Machine_Learning_Library Spark MLlib]
| + | ·[https://en.wikipedia.org/wiki/Microsoft_Cognitive_Toolkit CNTK] |
− | ·[https://en.wikipedia.org/wiki/Deeplearning4j Deeplearning4j] ·[https://en.wikipedia.org/wiki/Apache_MXNet MXNet] ·[https://en.wikipedia.org/wiki/TensorFlow TensorFlow]
| + | ·[https://en.wikipedia.org/wiki/MLPACK_(C%2B%2B_library) MLPACK] |
− | ·[https://en.wikipedia.org/wiki/ELKI ELKI] ·[https://en.wikipedia.org/wiki/OpenNN OpenNN] ·[https://en.wikipedia.org/wiki/Torch_(machine_learning) Torch]/[https://en.wikipedia.org/wiki/PyTorch PyTorch]
| + | ·[https://en.wikipedia.org/wiki/Apache_Spark#MLlib_Machine_Learning_Library Spark MLlib] |
− | ·[https://en.wikipedia.org/wiki/H2O_(software) H2O] ·[https://en.wikipedia.org/wiki/Orange_(software) Orange] ·[https://en.wikipedia.org/wiki/Weka_(machine_learning) Weka] / [https://en.wikipedia.org/wiki/MOA_(Massive_Online_Analysis) MOA]
| + | ·[https://en.wikipedia.org/wiki/Deeplearning4j Deeplearning4j] |
− | ·[https://en.wikipedia.org/wiki/Apache_Mahout Mahout] ·[https://en.wikipedia.org/wiki/Scikit-learn scikit-learn] ·[https://en.wikipedia.org/wiki/Yooreeka Yooreeka]
| + | ·[https://en.wikipedia.org/wiki/Apache_MXNet MXNet] |
− | ·[https://en.wikipedia.org/wiki/Mallet_(software_project) Mallet] ·[https://en.wikipedia.org/wiki/Shogun_(toolbox) Shogun]
| + | ·[https://en.wikipedia.org/wiki/TensorFlow TensorFlow] |
| + | ·[https://en.wikipedia.org/wiki/ELKI ELKI] |
| + | ·[https://en.wikipedia.org/wiki/OpenNN OpenNN] |
| + | ·[https://en.wikipedia.org/wiki/Torch_(machine_learning) Torch]/[https://en.wikipedia.org/wiki/PyTorch PyTorch] |
| + | ·[https://en.wikipedia.org/wiki/H2O_(software) H2O] |
| + | ·[https://en.wikipedia.org/wiki/Orange_(software) Orange] |
| + | ·[https://en.wikipedia.org/wiki/Weka_(machine_learning) Weka] / [https://en.wikipedia.org/wiki/MOA_(Massive_Online_Analysis) MOA] |
| + | ·[https://en.wikipedia.org/wiki/Apache_Mahout Mahout] |
| + | ·[https://en.wikipedia.org/wiki/Scikit-learn scikit-learn] |
| + | ·[https://en.wikipedia.org/wiki/Yooreeka Yooreeka] |
| + | ·[https://en.wikipedia.org/wiki/Mallet_(software_project) Mallet] |
| + | ·[https://en.wikipedia.org/wiki/Shogun_(toolbox) Shogun] |
| | | |
| ===有免费开源版本的专利软件=== | | ===有免费开源版本的专利软件=== |