更改

删除4字节 、 2021年7月25日 (日) 23:55
第93行: 第93行:  
   
 
   
   −
'''无监督学习 Unsupervised Learning'''可以从数据流中发现某种模式,而不需要人类提前标注数据。'''有监督学习 Supervised Learning'''包括分类和回归,这需要人类首先标注数据。分类被用于确定某物属于哪个类别,这需要把大量来自多个类别的例子投入程序;回归用来产生一个描述输入和输出之间的关系的函数,并预测输出会如何随着输入的变化而变化<ref name="Machine learning"/><ref>{{cite journal|last1=Jordan|first1=M. I.|last2=Mitchell|first2=T. M.|title=Machine learning: Trends, perspectives, and prospects|journal=Science|date=16 July 2015|volume=349|issue=6245|pages=255–260|doi=10.1126/science.aaa8415|pmid=26185243|bibcode=2015Sci...349..255J}}</ref>。在强化学习<ref name="Russell & Norvig 2003"/><ref name="Luger & Stubblefield 2004"/>中,智能体会因为好的回应而受到奖励,因为坏的回应而受到惩罚;智能体通过一系列的奖励和惩罚形成了一个在其问题空间中可施行的策略。
+
'''无监督学习 Unsupervised Learning'''可以从数据流中发现某种模式,而不需要人类提前标注数据。'''监督学习 Supervised Learning'''包括分类和回归,这需要人类首先标注数据。分类被用于确定某物属于哪个类别,这需要把大量来自多个类别的例子投入程序;回归用来产生一个描述输入和输出之间的关系的函数,并预测输出会如何随着输入的变化而变化<ref name="Machine learning"/><ref>{{cite journal|last1=Jordan|first1=M. I.|last2=Mitchell|first2=T. M.|title=Machine learning: Trends, perspectives, and prospects|journal=Science|date=16 July 2015|volume=349|issue=6245|pages=255–260|doi=10.1126/science.aaa8415|pmid=26185243|bibcode=2015Sci...349..255J}}</ref>。在强化学习<ref name="Russell & Norvig 2003"/><ref name="Luger & Stubblefield 2004"/>中,智能体会因为好的回应而受到奖励,因为坏的回应而受到惩罚;智能体通过一系列的奖励和惩罚形成了一个在其问题空间中可施行的策略。
 
      
===自然语言处理===
 
===自然语言处理===
7,129

个编辑