第3行: |
第3行: |
| |description=是一种用于计量经济学和社会科学定量研究的统计技术 | | |description=是一种用于计量经济学和社会科学定量研究的统计技术 |
| }} | | }} |
− | '''双重差分法 Difference in differences'''('''DID'''<ref name=":0">{{cite journal |last=Abadie |first=A. |year=2005 |title=Semiparametric difference-in-differences estimators |journal=[[Review of Economic Studies]] |volume=72 |issue=1 |pages=1–19 |doi=10.1111/0034-6527.00321 |citeseerx=10.1.1.470.1475 }}</ref> 或 '''DD'''<ref name=Bertrand>{{cite journal |last1=Bertrand |first1=M. |last2=Duflo |first2=E. |author-link2=Esther Duflo |last3=Mullainathan |first3=S. |year=2004 |title=How Much Should We Trust Differences-in-Differences Estimates? |journal=[[Quarterly Journal of Economics]] |volume=119 |issue=1 |pages=249–275 |doi=10.1162/003355304772839588 |s2cid=470667 |url=http://www.nber.org/papers/w8841.pdf }}</ref>)是一种用于计量经济学和社会科学定量研究的统计技术,它试图利用观察性研究数据来模拟实验研究设计,通过研究自然实验<ref name=":1">{{cite book |last1=Angrist |first1=J. D. |last2=Pischke |first2=J. S. |year=2008 |title=Mostly Harmless Econometrics: An Empiricist's Companion |publisher=Princeton University Press |isbn=978-0-691-12034-8 |pages=227–243 |url=https://books.google.com/books?id=ztXL21Xd8v8C&pg=PA227 }}</ref>中的“治疗组”和“对照组”之间的差异性效果。它通过比较治疗组和对照组的结果变量在一段时间的平均变化,计算出治疗(即解释变量或'''自变量''')对结果(即反应变量或因变量)的影响。虽然该方法旨在减轻外部因素和选择偏差的影响,但取决于治疗组的选择方式,该方法仍可能受到某些偏差的影响(例如,均值回归、反向因果关系和遗漏变量偏差)。 | + | '''双重差分法 Difference in differences'''('''DID'''<ref name=":0">{{cite journal |last=Abadie |first=A. |year=2005 |title=Semiparametric difference-in-differences estimators |journal=[[Review of Economic Studies]] |volume=72 |issue=1 |pages=1–19 |doi=10.1111/0034-6527.00321 |citeseerx=10.1.1.470.1475 }}</ref> 或 '''DD'''<ref name=Bertrand>{{cite journal |last1=Bertrand |first1=M. |last2=Duflo |first2=E. |author-link2=Esther Duflo |last3=Mullainathan |first3=S. |year=2004 |title=How Much Should We Trust Differences-in-Differences Estimates? |journal=[[Quarterly Journal of Economics]] |volume=119 |issue=1 |pages=249–275 |doi=10.1162/003355304772839588|url=http://www.nber.org/papers/w8841.pdf }}</ref>)是一种用于计量经济学和社会科学定量研究的统计技术,它试图利用观察性研究数据来模拟实验研究设计,通过研究自然实验<ref name=":1">{{cite book |last1=Angrist |first1=J. D. |last2=Pischke |first2=J. S. |year=2008 |title=Mostly Harmless Econometrics: An Empiricist's Companion |publisher=Princeton University Press |isbn=978-0-691-12034-8 |pages=227–243 |url=https://books.google.com/books?id=ztXL21Xd8v8C&pg=PA227 }}</ref>中的“治疗组”和“对照组”之间的差异性效果。它通过比较治疗组和对照组的结果变量在一段时间的平均变化,计算出治疗(即解释变量或'''自变量''')对结果(即反应变量或因变量)的影响。虽然该方法旨在减轻外部因素和选择偏差的影响,但取决于治疗组的选择方式,该方法仍可能受到某些偏差的影响(例如,均值回归、反向因果关系和遗漏变量偏差)。 |
| | | |
| | | |
第11行: |
第11行: |
| | | |
| ==一般定义== | | ==一般定义== |
− | [[File:Illustration of Difference in Differences.png|thumb|upright=1.3|+双重差分法的说明]] | + | [[File:Illustration of Difference in Differences.png|thumb|upright=1.3|双重差分法的说明]] |
| 双重差分法要求从治疗组和对照组在两个或两个以上不同时间段测量数据,特别是“治疗”前以及“治疗”后的至少一个时间段。在图中的示例中,治疗组的结果用线''P''表示,对照组的结果用线''S''表示。两组的结果(因)变量都是在时间1,即任何一组接受治疗(即自变量或解释变量)前测量的,分别由点''P''<sub>1</sub>和''S''<sub>1</sub>表示。治疗组之后接受或经历治疗,并在时间2再次测量两组。并非所有治疗组和对照组在时间2的差异(即''P''<sub>2</sub>和''S''<sub>2</sub>的差异)都可以解释为是治疗的效果,因为治疗组和对照组在时间1的开始时间不同。因此,DID计算出两组的结果变量之间的“正常”差异(如果两组均未接受治疗,差异仍然存在),由虚线''Q''表示(注意:''P''<sub>1</sub>到''Q''的斜率与''S''<sub>1</sub>到''S''<sub>2</sub>的斜率相同)。治疗效果是观察结果(P<sub>2</sub>)和“正常”结果(P<sub>2</sub>和Q之间的差异)之间的差异。 | | 双重差分法要求从治疗组和对照组在两个或两个以上不同时间段测量数据,特别是“治疗”前以及“治疗”后的至少一个时间段。在图中的示例中,治疗组的结果用线''P''表示,对照组的结果用线''S''表示。两组的结果(因)变量都是在时间1,即任何一组接受治疗(即自变量或解释变量)前测量的,分别由点''P''<sub>1</sub>和''S''<sub>1</sub>表示。治疗组之后接受或经历治疗,并在时间2再次测量两组。并非所有治疗组和对照组在时间2的差异(即''P''<sub>2</sub>和''S''<sub>2</sub>的差异)都可以解释为是治疗的效果,因为治疗组和对照组在时间1的开始时间不同。因此,DID计算出两组的结果变量之间的“正常”差异(如果两组均未接受治疗,差异仍然存在),由虚线''Q''表示(注意:''P''<sub>1</sub>到''Q''的斜率与''S''<sub>1</sub>到''S''<sub>2</sub>的斜率相同)。治疗效果是观察结果(P<sub>2</sub>)和“正常”结果(P<sub>2</sub>和Q之间的差异)之间的差异。 |
| | | |
第73行: |
第73行: |
| | | |
| | | |
− | 为了保证DID估计的准确性,假定两组个体的组成在一段时间内保持不变。在使用 DID 模型时,必须考虑和处理可能影响结果的各种问题,如自相关<ref name=":3">{{cite journal |first1=Marianne |last1=Bertrand |first2=Esther |last2=Duflo | first3=Sendhil | last3=Mullainathan |year=2004 |title=How Much Should We Trust Differences-In-Differences Estimates? |journal=[[Quarterly Journal of Economics]] |volume=119 |issue=1 |pages=249–275 |doi=10.1162/003355304772839588|s2cid=470667 |url=http://www.nber.org/papers/w8841.pdf }}</ref>和 Ashenfelter 倾斜。 | + | 为了保证DID估计的准确性,假定两组个体的组成在一段时间内保持不变。在使用 DID 模型时,必须考虑和处理可能影响结果的各种问题,如自相关<ref name=":3">{{cite journal |first1=Marianne |last1=Bertrand |first2=Esther |last2=Duflo | first3=Sendhil | last3=Mullainathan |year=2004 |title=How Much Should We Trust Differences-In-Differences Estimates? |journal=[[Quarterly Journal of Economics]] |volume=119 |issue=1 |pages=249–275 |doi=10.1162/003355304772839588|url=http://www.nber.org/papers/w8841.pdf }}</ref>和 Ashenfelter 倾斜。 |
| | | |
| | | |
第169行: |
第169行: |
| | | |
| | | |
| + | ==编者推荐== |
| + | ===集智课程=== |
| + | ====[https://campus.swarma.org/course/3527 因果科学读书会第三季:因果+X]==== |
| + | “因果”并不是一个新概念,而是一个已经在多个学科中使用了数十年的分析技术。通过前两季的分享,我们主要梳理了因果科学在计算机领域的前沿进展。如要融会贯通,我们需要回顾数十年来在社会学、经济学、医学、生物学等多个领域中,都是使用了什么样的因果模型、以什么样的范式、解决了什么样的问题。我们还要尝试进行对比和创新,看能否以现在的眼光,用其他的模型,为这些研究提供新的解决思路。 |
| + | |
| + | |
| + | “因果+X”就是要让因果真正地应用于我们的科学研究中,不管你是来自计算机、数理统计领域,还是社会学、经济学、管理学领域,还是医学、生物学领域,我们希望共同探究出因果研究的范式,真正解决因果的多学科应用问题,乃至解决工业界的问题。 |
| + | |
| + | |
| + | ====[https://campus.swarma.org/course/714 计算社会经济学的内容与方法]==== |
| + | 准确和及时的感知社会经济发展状态,对理解社会结构演化和制定经济发展策略非常重要。近年来,私营部门积累的大规模数据,以低获取成本、实时更新和高时空分辨率等优势,弥补了传统经济普查的不足。统计机器学习算法的飞速发展,也极大的提高了对未来发展态势的准确预测。作为新数据和新方法催生的一门交叉学科,计算社会经济学将有机会更好的回答一些新的社会经济问题,比如:从在线社会网络的结构中,能不能推断出一个人的财富状况?除了翻阅统计年鉴,怎样快速的感知陌生城市的社会经济状态?在国家和区域的经济发展中,有没有最优的产业升级路径和策略? |
| + | |
| + | |
| + | 该课程中,电子科技大学博士生高见,将系统性的介绍计算社会经济学的主要研究内容和分析方法,阐述大规模社会经济数据(包括卫星遥感数据、手机通讯数据、社交媒体数据等)在解决全球贫困问题、刻画区域经济结构、推断个体财富和应急抢险救灾中的具体应用。 |
| | | |
| | | |