更改

添加11字节 、 2020年5月15日 (五) 15:38
第218行: 第218行:     
=== 技术 ===
 
=== 技术 ===
*[[聚类分析|聚类]]是一种将数据分组整合的技术。
+
====聚类====
 +
[[聚类分析|聚类]]是一种将数据分组整合的技术。
      第231行: 第232行:  
#根据分类来研究各类样本的共性,找出规律。
 
#根据分类来研究各类样本的共性,找出规律。
   −
 
+
====降维====
*[[降维]]用于降低数据计算的复杂度,从而提高计算速度。
+
[[降维]]用于降低数据计算的复杂度,从而提高计算速度。
      第241行: 第242行:  
    
 
    
   −
:1. 特征选择
+
*特征选择
 
特征选择指根据一定的规则和经验,直接在原有的维度中挑选一部分参与到计算和建模过程,用选择的特征代替所有特征,不改变原有特征,也不产生新的特征值。
 
特征选择指根据一定的规则和经验,直接在原有的维度中挑选一部分参与到计算和建模过程,用选择的特征代替所有特征,不改变原有特征,也不产生新的特征值。
 
特征选择的降维方式好处是可以保留原有维度特征的基础上进行降维,既能满足后续数据处理和建模需求,又能保留维度原本的业务含义,以便于业务理解和应用。对于业务分析性的应用而言,模型的可理解性和可用性很多时候要有限于模型本身的准确率、效率等技术指标。例如,决策树得到的特征规则,可以作为选择用户样本的基础条件,而这些特征规则便是基于输入的维度产生。
 
特征选择的降维方式好处是可以保留原有维度特征的基础上进行降维,既能满足后续数据处理和建模需求,又能保留维度原本的业务含义,以便于业务理解和应用。对于业务分析性的应用而言,模型的可理解性和可用性很多时候要有限于模型本身的准确率、效率等技术指标。例如,决策树得到的特征规则,可以作为选择用户样本的基础条件,而这些特征规则便是基于输入的维度产生。
   −
:2. 维度转换
+
*维度转换
维度转换是按照一定数学变换方法,把给定的一组相关变量(维度)通过数学模型将高纬度空间的数据点映射到低纬度空间中,然后利用映射后变量的特征来表示原有变量的总体特征。这种方式是一种产生新维度的过程,转换后的维度并非原来特征,而是之前特征的转化后的表达式,新的特征丢失了原有数据的业务含义。 通过数据维度变换的降维方法是非常重要的降维方法,这种降维方法分为线性降维和非线性降维两种,其中常用的代表算法包括独立成分分析(ICA),主成分分析(PCA),因子分析(Factor Analysis,FA),线性判别分析(LDA),局部线性嵌入(LLE),核主成分分析(Kernel PCA)等。
+
维度转换是按照一定数学变换方法,把给定的一组相关变量(维度)通过数学模型将高纬度空间的数据点映射到低纬度空间中,然后利用映射后变量的特征来表示原有变量的总体特征。这种方式是一种产生新维度的过程,转换后的维度并非原来特征,而是之前特征的转化后的表达式,新的特征丢失了原有数据的业务含义。 通过数据维度变换的降维方法是非常重要的降维方法,这种降维方法分为线性降维和非线性降维两种,其中常用的代表算法包括独立成分分析 ICA,主成分分析 PCA,因子分析 Factor Analysis,FA,线性判别分析 LDA,局部线性嵌入 LLE,核主成分分析 Kernel PCA等。
      −
*[[机器学习]]是一种通过从数据中推断模式来执行任务的技术。
+
====机器学习====
 +
[[机器学习]]是一种通过从数据中推断模式来执行任务的技术。
     
763

个编辑