更改

添加1,655字节 、 2022年6月12日 (日) 23:25
无编辑摘要
第1行: 第1行:  
本词条由趣木木进行编写,未经过专家审校。
 
本词条由趣木木进行编写,未经过专家审校。
   −
'''回归分析'''是一种[[统计学]]上分析数据的方法,目的在于了解两个或多个变量间是否相关、其相关的方向与强度,建立数学模型以便观察特定变量,来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。通过回归分析我们可以由给出的自变量估计因变量的条件期望。
+
'''回归分析'''是一种利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。目的在于了解两个或多个变量间是否相关、其相关的方向与强度,观察特定变量,预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。通过回归分析我们可以由给出的自变量估计因变量的条件期望。
    
回归分析是建立因变量<math>Y</math>(或称依变数,反应变数)与自变量<math>X</math>(或称独变数,解释变数)之间关系的模型。[[简单线性回归]]使用一个自变量<math>X</math>,复回归使用超过一个自变量(<math>X_1, X_2 ... X_i</math>)。
 
回归分析是建立因变量<math>Y</math>(或称依变数,反应变数)与自变量<math>X</math>(或称独变数,解释变数)之间关系的模型。[[简单线性回归]]使用一个自变量<math>X</math>,复回归使用超过一个自变量(<math>X_1, X_2 ... X_i</math>)。
 
==起源==
 
==起源==
回归的最早形式是[[最小二乘法]],由1805年的[[阿德里安-马里·勒让德|勒让德]](Legendre)<ref name="Legendre">[[Adrien-Marie Legendre|A.M. Legendre]]. [https://books.google.com/books?id=FRcOAAAAQAAJ '<nowiki/>'''Nouvelles méthodes pour la détermination des orbites des comètes''''] {{Wayback|url=https://books.google.com/books?id=FRcOAAAAQAAJ |date=20190607155946 }}, Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.</ref>,和1809年的[[卡尔·弗里德里希·高斯|高斯]](Gauss)提出<ref name="Gauss">[[Carl Friedrich Gauss|C.F. Gauss]]. '<nowiki/>'''Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum''''. (1809)</ref>。勒让德和高斯都将该方法应用于从天文观测中,来确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展<ref name="Gauss2">C.F. Gauss. [https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false '<nowiki/>'''Theoria combinationis observationum erroribus minimis obnoxiae''''] {{Wayback|url=https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false |date=20190610143218 }}. (1821/1823)</ref>,包括[[高斯-马尔可夫定理]]的一个版本。
+
回归的最早形式是[[最小二乘法]],由1805年的[[阿德里安-马里·勒让德|勒让德]](Legendre)<ref name="Legendre">[[Adrien-Marie Legendre|A.M. Legendre]]. [https://books.google.com/books?id=FRcOAAAAQAAJ '<nowiki/>'''Nouvelles méthodes pour la détermination des orbites des comètes''''] {{Wayback|url=https://books.google.com/books?id=FRcOAAAAQAAJ |date=20190607155946 }}, Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.</ref>,和1809年的[[卡尔·弗里德里希·高斯|高斯]](Gauss)提出<ref name="Gauss">[[Carl Friedrich Gauss|C.F. Gauss]]. '<nowiki/>'''Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum''''. (1809)</ref>。勒让德和高斯都将该方法应用于从天文观测中,来确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展<ref name="Gauss2">C.F. Gauss. [https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false '<nowiki/>'''Theoria combinationis observationum erroribus minimis obnoxiae''''] {{Wayback|url=https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false |date=20190610143218 }}. (1821/1823)</ref>
   −
「回归」一词最早由[[法兰西斯·高尔顿]](Francis Galton)所使用<ref>{{cite book
+
”回归“一词最早由[[法兰西斯·高尔顿]](Francis Galton)所使用<ref>{{cite book
 
   | last = Mogull
 
   | last = Mogull
 
   | first = Robert G.
 
   | first = Robert G.
第18行: 第18行:     
在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,这种计算方法有时需要长达24小时才能得出结果<ref>Rodney Ramcharan. [http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm Regressions: Why Are Economists Obessessed with Them?] {{Wayback|url=http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm |date=20200805131639 }} March 2006. Accessed 2011-12-03.</ref>。
 
在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,这种计算方法有时需要长达24小时才能得出结果<ref>Rodney Ramcharan. [http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm Regressions: Why Are Economists Obessessed with Them?] {{Wayback|url=http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm |date=20200805131639 }} March 2006. Accessed 2011-12-03.</ref>。
==回归分析原理==
+
==回归模型基础知识==
*目的在于找出一条最能够代表所有观测资料的函数曲线(回归估计式)。
  −
*用此函数代表因变数和自变数之间的关系。
  −
===参数估计===
  −
*[[矩估计]](Method of Moment、MOM)
  −
*[[最小二乘法]](Ordinary Least Square Estimation, OLSE)
  −
*[[最大似然估计]](Maximum Likelihood Estimation, MLE)
  −
==回归模型==
   
回归模型主要包括以下变量:
 
回归模型主要包括以下变量:
 
*'''''未知参数''''',记为<math>\beta</math>,可以代表一个[[标量]]或一个[[向量]]。
 
*'''''未知参数''''',记为<math>\beta</math>,可以代表一个[[标量]]或一个[[向量]]。
第47行: 第40行:     
⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量<math>Y</math>和未知量<math>\beta</math>之间的关系。
 
⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量<math>Y</math>和未知量<math>\beta</math>之间的关系。
==回归分析的种类==
+
 
 +
== 原理 ==
 +
由回归分析法的定义知道,回归分析可以简单的理解为信息分析与预测。信息即统计数据,分析即对信息进行数学处理,预测就是加以外推,也就是适当扩大已有自变量取值范围,并承认该回归方程在该扩大的定义域内成立,然后就可以在该定义域上取值进行“未来预测”。当然,还可以对回归方程进行有效控制。
 +
*目的在于找出一条最能够代表所有观测资料的函数曲线(回归估计式)。
 +
*用此函数代表因变数和自变数之间的关系。
 +
 
 +
== 回归分析步骤 ==
 +
 
 +
# 根据自变量与因变量的现有数据以及关系,初步设定回归方程
 +
# 求出合理的回归系数
 +
# 进行相关性检验,确定相关系数
 +
# 在符合相关性要求后,即可根据已得的回归方程与具体条件相结合,来确定事物的未来状况,并计算预测值的置信区间
 +
 
 +
==回归分析的分类==
 
===简单线性回归===
 
===简单线性回归===
 
*应用时机
 
*应用时机
第63行: 第69行:  
====差分自回归滑动平均模型====
 
====差分自回归滑动平均模型====
 
====向量自回归模型====
 
====向量自回归模型====
 +
 +
== 回归分析主要解决的问题 ==
 +
 +
* 确定变量之间是否存在相关关系,若存在,则找出数学表达式
 +
* 根据一个或几个变量的值,预测或控制另一个或几个变量的值,且估计这种控制或预测可以达到何种精确度
 +
 +
== 回归分析的有效性和注意事项 ==
 +
 +
=== 有效性 ===
 +
用回归分析法进行预测首先要对各个自变量做出预测。若各个自变量可以由人工控制或易于预测,而且回归方程也较为符合实际,则应用回归预测是有效的,否则就很难应用。
 +
 +
=== 注意事项 ===
 +
为使回归方程较能符合实际,首先应尽可能定性判断自变量的可能种类和个数,并在观察事物发展规律的基础上定性判断回归方程的可能类型;其次,力求掌握较充分的高质量统计数据,再运用统计方法,利用数学工具和相关软件从定量方面计算或改进性判断。
 +
 
==参阅==
 
==参阅==
 
*[[曲线拟合]]
 
*[[曲线拟合]]