第5行: |
第5行: |
| 回归分析是建立因变量<math>Y</math>(或称依变数,反应变数)与自变量<math>X</math>(或称独变数,解释变数)之间关系的模型。[[简单线性回归]]使用一个自变量<math>X</math>,复回归使用超过一个自变量(<math>X_1, X_2 ... X_i</math>)。 | | 回归分析是建立因变量<math>Y</math>(或称依变数,反应变数)与自变量<math>X</math>(或称独变数,解释变数)之间关系的模型。[[简单线性回归]]使用一个自变量<math>X</math>,复回归使用超过一个自变量(<math>X_1, X_2 ... X_i</math>)。 |
| ==起源== | | ==起源== |
− | 回归的最早形式是[[最小二乘法]],由1805年的[[阿德里安-马里·勒让德|勒让德]](Legendre)<ref name="Legendre">[[Adrien-Marie Legendre|A.M. Legendre]]. [https://books.google.com/books?id=FRcOAAAAQAAJ '<nowiki/>'''Nouvelles méthodes pour la détermination des orbites des comètes''''] {{Wayback|url=https://books.google.com/books?id=FRcOAAAAQAAJ |date=20190607155946 }}, Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.</ref>,和1809年的[[卡尔·弗里德里希·高斯|高斯]](Gauss)提出<ref name="Gauss">[[Carl Friedrich Gauss|C.F. Gauss]]. '<nowiki/>'''Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum''''. (1809)</ref>。勒让德和高斯都将该方法应用于从天文观测中,来确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星<!-- Legendre''s first example is applied to [[C/1769 P1]] (Messier) -->)的问题。 高斯在1821年发表了最小二乘理论的进一步发展<ref name="Gauss2">C.F. Gauss. [https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false '<nowiki/>'''Theoria combinationis observationum erroribus minimis obnoxiae''''] {{Wayback|url=https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false |date=20190610143218 }}. (1821/1823)</ref>,包括[[高斯-马尔可夫定理]]的一个版本。 | + | 回归的最早形式是[[最小二乘法]],由1805年的[[阿德里安-马里·勒让德|勒让德]](Legendre)<ref name="Legendre">[[Adrien-Marie Legendre|A.M. Legendre]]. [https://books.google.com/books?id=FRcOAAAAQAAJ '<nowiki/>'''Nouvelles méthodes pour la détermination des orbites des comètes''''] {{Wayback|url=https://books.google.com/books?id=FRcOAAAAQAAJ |date=20190607155946 }}, Firmin Didot, Paris, 1805. “Sur la Méthode des moindres quarrés” appears as an appendix.</ref>,和1809年的[[卡尔·弗里德里希·高斯|高斯]](Gauss)提出<ref name="Gauss">[[Carl Friedrich Gauss|C.F. Gauss]]. '<nowiki/>'''Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum''''. (1809)</ref>。勒让德和高斯都将该方法应用于从天文观测中,来确定关于太阳的物体的轨道(主要是彗星,但后来是新发现的小行星)的问题。 高斯在1821年发表了最小二乘理论的进一步发展<ref name="Gauss2">C.F. Gauss. [https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false '<nowiki/>'''Theoria combinationis observationum erroribus minimis obnoxiae''''] {{Wayback|url=https://books.google.com/books?id=ZQ8OAAAAQAAJ&printsec=frontcover&dq=Theoria+combinationis+observationum+erroribus+minimis+obnoxiae&as_brr=3#v=onepage&q=&f=false |date=20190610143218 }}. (1821/1823)</ref>,包括[[高斯-马尔可夫定理]]的一个版本。 |
| | | |
| 「回归」一词最早由[[法兰西斯·高尔顿]](Francis Galton)所使用<ref>{{cite book | | 「回归」一词最早由[[法兰西斯·高尔顿]](Francis Galton)所使用<ref>{{cite book |
第15行: |
第15行: |
| | page = 59 | | | page = 59 |
| | isbn = 0-7575-1181-3 | | | isbn = 0-7575-1181-3 |
− | }}</ref><ref>{{cite journal | last=Galton | first=Francis | journal=Statistical Science | year=1989 | title=Kinship and Correlation (reprinted 1989) | url=https://archive.org/details/sim_statistical-science_1989-05_4_2/page/80 | volume=4 | jstor=2245330 | pages=80–86 | publisher=Institute of Mathematical Statistics | issue=2 | doi=10.1214/ss/1177012581}}</ref>。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐回归到中等(即人的[[平均]]值)」的现象。不过当时的回归和现在的回归在意义上已不尽相同。 | + | }}</ref><ref>{{cite journal | last=Galton | first=Francis | journal=Statistical Science | year=1989 | title=Kinship and Correlation (reprinted 1989) | url=https://archive.org/details/sim_statistical-science_1989-05_4_2/page/80 | volume=4 | jstor=2245330 | pages=80–86 | publisher=Institute of Mathematical Statistics | issue=2 | doi=10.1214/ss/1177012581}}</ref>。他曾对亲子间的身高做研究,发现父母的身高虽然会遗传给子女,但子女的身高却有逐渐回归到中等(即人的[[平均]]值)的现象。不过当时的回归和现在的回归在意义上已不尽相同。 |
| | | |
| 在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,这种计算方法有时需要长达24小时才能得出结果<ref>Rodney Ramcharan. [http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm Regressions: Why Are Economists Obessessed with Them?] {{Wayback|url=http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm |date=20200805131639 }} March 2006. Accessed 2011-12-03.</ref>。 | | 在1950年代和60年代,经济学家使用机械电子桌面计算器来计算回归。在1970年之前,这种计算方法有时需要长达24小时才能得出结果<ref>Rodney Ramcharan. [http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm Regressions: Why Are Economists Obessessed with Them?] {{Wayback|url=http://www.imf.org/external/pubs/ft/fandd/2006/03/basics.htm |date=20200805131639 }} March 2006. Accessed 2011-12-03.</ref>。 |
− | ==迴归分析原理== | + | ==回归分析原理== |
| *目的在于找出一条最能够代表所有观测资料的函数曲线(回归估计式)。 | | *目的在于找出一条最能够代表所有观测资料的函数曲线(回归估计式)。 |
| *用此函数代表因变数和自变数之间的关系。 | | *用此函数代表因变数和自变数之间的关系。 |
第47行: |
第47行: |
| | | |
| ⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量<math>Y</math>和未知量<math>\beta</math>之间的关系。 | | ⒉在特定统计假设下,回归分析使用数据中的多余信息给出关于因变量<math>Y</math>和未知量<math>\beta</math>之间的关系。 |
− | ==迴归分析的种类== | + | ==回归分析的种类== |
| ===简单线性回归=== | | ===简单线性回归=== |
| *应用时机 | | *应用时机 |
第53行: |
第53行: |
| #判断两变数之间相关的方向和程度 | | #判断两变数之间相关的方向和程度 |
| ===复回归(或多变量回归)=== | | ===复回归(或多变量回归)=== |
− | '''''[[复回归分析]]''''''是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。
| + | 复回归分析是简单线性回归的一种延伸应用,用以了解一个依变项与两组以上自变项的函数关系。 |
| ===对数线性回归=== | | ===对数线性回归=== |
− | ,是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。
| + | 对数线性回归,是将解释变项(实验设计中的自变项)和反应变项(实验设计中的依变项)都取对数值之后再进行线性回归,所以依据解释变项的数量,可能是对数简单线性回归,也可能是对数复回归。 |
| ===非线性回归=== | | ===非线性回归=== |
| ===对数几率回归=== | | ===对数几率回归=== |