− | 分类器可以通过多种方式进行训练;,比如许多统计学和机器学习方法。决策树可能是应用最广泛的机器学习算法。其他使用广泛的分类器还有神经网络、K最近邻算法、核方法(比如支持向量机)、''' 高斯混合模型 Gaussian Mixture Mode''',以及非常流行的'''朴素贝叶斯分类器 Naive Bayes Classifier'''。分类器的分类效果在很大程度上取决于待分类数据的特征,如数据集的大小、样本跨类别的分布、维数和噪声水平。如果假设的模型很符合实际数据,则基于这种模型的分类器就能给出很好的结果。否则,传统观点认为如果没有匹配模型可用,而且只关心准确性(而不是速度或可扩展性) ,在大多数实际数据集上鉴别分类器(尤其是支持向量机)往往比基于模型的分类器(如“朴素贝叶斯”)更准确。<ref>van der Walt, Christiaan; Bernard, Etienne (2006). "Data characteristics that determine classifier performance" (PDF). </ref><ref>Russell, Stuart J.; Norvig, Peter (2009). Artificial Intelligence: A Modern Approach (3rd ed.). Upper Saddle River, New Jersey: Prentice Hall. 18.12: Learning from Examples: Summary. ISBN 978-0-13-604259-4.</ref> | + | 分类器可以通过多种方式进行训练;,比如许多统计学和机器学习方法。决策树可能是应用最广泛的机器学习算法。<ref name="Domingos, Pedro (2015)"/>其他使用广泛的分类器还有神经网络、K最近邻算法、核方法(比如支持向量机)、''' 高斯混合模型 Gaussian Mixture Mode''',以及非常流行的'''朴素贝叶斯分类器 Naive Bayes Classifier'''。分类器的分类效果在很大程度上取决于待分类数据的特征,如数据集的大小、样本跨类别的分布、维数和噪声水平。如果假设的模型很符合实际数据,则基于这种模型的分类器就能给出很好的结果。否则,传统观点认为如果没有匹配模型可用,而且只关心准确性(而不是速度或可扩展性) ,在大多数实际数据集上鉴别分类器(尤其是支持向量机)往往比基于模型的分类器(如“朴素贝叶斯”)更准确。<ref>van der Walt, Christiaan; Bernard, Etienne (2006). "Data characteristics that determine classifier performance" (PDF). </ref><ref>Russell, Stuart J.; Norvig, Peter (2009). Artificial Intelligence: A Modern Approach (3rd ed.). Upper Saddle River, New Jersey: Prentice Hall. 18.12: Learning from Examples: Summary. ISBN 978-0-13-604259-4.</ref> |