第17行: |
第17行: |
| 字数:315千字<br> | | 字数:315千字<br> |
| 版次:2018年11月第1版<br> | | 版次:2018年11月第1版<br> |
− |
| |
− |
| |
− | 二十一世纪是计算社会科学的时代。1998年邓肯·瓦茨关于小世界网络的模型和1999年阿尔伯特·巴拉巴西关于幂律和无标度网络的研究复兴了网络科学。一石激起千层浪,在学术领域产生了深远的影响。对于万维网上的人类行为的研究也形成了一个子领域,被称之为万维网科学(Web Science);伴随着社交媒体等数字媒体的发展,社会网络分析开始受到前所未有的重视,社交网络上的信息流动网络研究也引起广泛的兴趣;与此同时,机器学习和数据科学取得了突飞猛进的发展,进一步加速了计算化的浪潮;在新闻传播产业当中,数据驱动的新闻生产、计算广告和媒体推荐系统开始成为席卷世界的潮流。面对海量的互联网数据、持续困扰人类的重大社会问题、崭新的理论视角、诱人的物理学模型,在世界大战中发展起来的新闻传播学研究会走向什么地方?这构成了困扰我们的时代问题,而计算传播学正是试图回应这一时代叩问的一种尝试。在大数据和人工智能时代,未来的计算社会科学家更需要训练问题意识、培养计算思维、增强数据挖掘和分析的能力,而这正是本书写作的一个重要目的。<br>
| |
− | 计算传播学将传播学研究置于数据和计算方法的坚固基础上。数据作为一种新的石油,解放了社会科学家对于理论的过度依赖。随着数字媒体的发展,人类社会积累的人类传播行为数据的规模日趋庞大,详尽地记录了社会发展和人类互动的各种细节。运用这些生动的人类传播行为数据,可以从更细的颗粒度、更大的样本规模上让我们捕捉社会的发展。毫无疑问,对于数据的挖掘依赖于人类的计算能力的提高,依赖于跨学科的研究方法和研究视角。我们人类传播行为的基因恰恰隐藏在互动性当中,但这种人类传播行为的互动性本身也使得传播过程充满了复杂性。网络科学为捕捉到纷繁复杂的人类互动提供了一个很好的视角。从数据出发,借助于计算方法和好的理论视角,就可以更好地刻画人类传播行为的模式和法则。<br>
| |
| | | |
| == 作者介绍 == | | == 作者介绍 == |
第90行: |
第86行: |
| | | |
| == 部分书评 == | | == 部分书评 == |
− | 从豆瓣、知乎、简书等平台搬运一些好的书评,注明出处即可。
| + | [https://book.douban.com/review/9804380/ 寻找人类传播行为的基因:《计算传播学导论》后记] |
| + | 二十一世纪是计算社会科学的时代。1998年邓肯·瓦茨关于小世界网络的模型和1999年阿尔伯特·巴拉巴西关于幂律和无标度网络的研究复兴了网络科学。一石激起千层浪,在学术领域产生了深远的影响。对于万维网上的人类行为的研究也形成了一个子领域,被称之为万维网科学(Web Science);伴随着社交媒体等数字媒体的发展,社会网络分析开始受到前所未有的重视,社交网络上的信息流动网络研究也引起广泛的兴趣;与此同时,机器学习和数据科学取得了突飞猛进的发展,进一步加速了计算化的浪潮;在新闻传播产业当中,数据驱动的新闻生产、计算广告和媒体推荐系统开始成为席卷世界的潮流。面对海量的互联网数据、持续困扰人类的重大社会问题、崭新的理论视角、诱人的物理学模型,在世界大战中发展起来的新闻传播学研究会走向什么地方?这构成了困扰我们的时代问题,而计算传播学正是试图回应这一时代叩问的一种尝试。<br> |
| + | |
| + | 瓦茨指出网络科学的视角和大规模的互联网数据与实验为社会科学的发展提供了前所未有的理想条件,并乐观地认为“基于因特网的传播数据和互动将会变革我们对于人类群体行为的理解”。<br> |
| + | |
| + | 邓肯·瓦茨2008年在《自然》杂志上发表了题为《一个二十一世纪的科学》的文章。瓦茨认为社会科学才是二十一世纪的科学。社会系统当中充满了海量的异质性个体构成,这些个体之间的互动使得社会过程充满了复杂性。相比于自然科学,社会科学内部的复杂性更高,也更难研究。人类对于自然现象当中的很多规律已经非常了解,但对于社会现象的理解则通常非常有限。面对这些挑战,或许很多人可以做一群鸵鸟,只盯住让自己感觉舒适的领域,当危险来的时候干脆把头埋进沙子里,但是年轻人没有逃避的理由。年轻研究者唯有敢于冒险,才能走出不一样的路来。<br> |
| + | |
| + | “计算传播学”这个词语的提出源于香港城市大学互联网挖掘实验室成员之间在2012年初的一次组会讨论。<br> |
| + | |
| + | 互联网挖掘实验室由祝建华老师在2000年创建,最初起源于香港互联网使用调查项目。祝建华老师每周都会组织实验室成员进行讨论,讨论的主要内容除了每个人的研究进展之外,还包括文献分享、经验见闻等内容。置身于这样的一个实验室当中,使得我们较早就感受到在互联网人类传播行为的研究领域里来自跨学科的学术创新。这种范式的革新确立的一个标志是2009年大卫·拉泽等人发表在《科学》杂志上的一篇名为《计算社会科学》的文章。以拉泽为首的一群来自社会科学、计算机科学、网络科学等领域的资深研究者们宣告了计算社会科学的诞生。计算社会科学以大规模数据收集和数据分析作为主要的工具,采用网络科学作为主要的研究视角,力图揭示个体和群体行为的模式。<br> |
| + | 2010年我(王成军)作为博士生进入到香港城市大学互联网挖掘实验室以来,切身感受到了传播学研究者在互联网时代的身份焦虑。2012年1月,我在博客上写了一篇题为《计算传播学:宣言与版图》的短文,试图走一条计算驱动的研究道路,强调了将寻找人类传播行为的可计算基因作为计算传播学的发展使命。在更早一些时候,这篇小文章首先在一个名为《数字媒体阅读报告》的小圈子里流传。2012年2月,合作者林武来实验室交流,分享了关于Python编程基础、数据抓取、Hadoop使用等方面的知识。我们在此期间的一次组会中再次讨论了我们自己期待传播学将走向什么地方这一时代问题,并提出了计算传播(computational communication)的思路,激发了大家的进一步讨论的兴趣。在吴令飞的提议之下,计算传播学谷歌邮件组在2012年2月建立;2012年3月,计算传播学豆瓣小站正式建立;2012年底,吴令飞在多贝网上发布了一个名为计算传播学的系列课程;2014年暑假,我在腾讯实习期间,计算传播网正式建立。在此期间,我和许小可老师进行了一次讨论,我介绍了计算传播学的发展思路。当时,许小可、胡海波和张伦老师在写作一本关于社交网络上的信息传播的书,小可敏锐地觉察到他们所探索的研究范式可以采用计算传播学作为一个理论框架来进行理解,我也加入了这本书的写作。作为第一本计算传播学的图书,《社交网络上的计算传播学》于2015年在科学出版社正式出版。<br> |
| + | 2014年之后,计算传播学开始步入学科建制化的发展阶段。南京大学新闻传播学院计算传播学实验中心经过半年多的筹备在2015年2月成立;2016年1月国际传播学会(ICA)计算方法兴趣小组建立;2016年9月25日第一届计算传播学论坛在南京成功举办,此次会议的主题是“计算传播时代”,旨在让人们认识到基于互联网传播产生的数据和互动性正在变革我们对人类传播行为的认知,传播学研究面临着新的问题与挑战,以人类传播行为的可计算性基础为研究中心的计算传播学为传播学的发展提供了更广阔的空间与可能性;2017年9月14日,第六届全国社会媒体处理大会(SMP2017)在北京举办,张伦和我一起在SMP讲习班介绍了《计算社会科学视角下的计算传播学》,此次会议还设有计算传播学分论坛;2017年9月22-24日,第二届计算传播学论坛暨工作坊在南京大学成功举办。<br> |
| + | 2017年计算传播学工作坊为期一天半,分为两个子题并行进行,分别为“信息传播的网络分析”(Network Approaches to Information Diffusion)和“文本数据处理方法”(Processing Text Data)。前者定位为高级程度,聚焦于计算传播学研究中的一个核心而又困难的题目,以探讨研究设计、理论模型、数据要求、方法选择等问题为主、操作问题为辅,适合已掌握基本方法并有一定研究经验者。后者定位为入门程度,介绍用于文本数据处理的各个步骤上的方法、工具、算法等,含有众多动手操作。这次工作坊“信息传播的网络分析”部分由张子柯和王成军主讲《网络信息传播基础》、许小可讲《网络信息传播实证研究》、胡海波和阮中远讲解《网络信息传播模型》,“文本数据处理方法”部分由张伦主讲《文本分析的基本步骤与方法》、王成军介绍《主题模型》、汪臻真主讲《情感分析》。在酝酿<br> |
| + | |
| + | 在大数据和人工智能时代,未来的计算社会科学家更需要训练问题意识、培养计算思维、增强数据挖掘和分析的能力,而这正是本书写作的一个重要目的。<br> |
| + | |
| + | 第二届计算传播学论坛暨工作坊的过程中,许小可、胡海波、张伦和我开始计划写一本《计算传播学导论》书。按照祝建华老师的建议,我们曾对参加了2016年第一届计算传播学论坛的研究者公开征集计算传播学工作坊的题目。经过汇总整理之后的题目包括:计算机模拟/多主体建模、社交媒体数据爬取、传播文本挖掘和主题模型分析、使用深度学习进行传播学研究、社交媒体数据的时间序列分析和空间分析、传播学研究和数据新闻的可视化方法、传播网络分析(社区识别、复杂网络与信息流动)、机器学习、意见形成、Python编程,以及如何教授新闻传播学专业的学生网络分析/数据新闻/编程。我们的想法是每年遴选两个主题组织计算传播学工作坊,系统地整理和组织工作坊教学材料,基于此形成《计算传播学导论》一书的基本材料。<br> |
| + | 计算传播学作为一个概念的提出主要源于计算社会科学的发展。直到计算社会科学成为研究热点之后,计算传播作为一个概念才被正式提出。另外一种定义计算传播学的思路是计算传播的产业实践,可以将计算传播定义为数据驱动的、借助于可计算方法所进行的传播过程,而分析计算传播现象的研究领域就是计算传播学。计算传播的应用有很多,例如数据新闻、计算广告、媒体推荐系统等,在过去的几年里,产生了深远的影响。数据新闻风靡全球,重要的国际媒体和国内媒体纷纷采用数据新闻,以开放数据、数据挖掘、可视化的方式提供信息;计算广告备受瞩目,不管是门户网站、搜索引擎,还是社交媒体,纷纷将计算广告当做数据变现的重要渠道,以可计算的方法对广告进行拍卖,实现媒体、内容和用户三方的匹配;媒体推荐系统成为个性化信息获取的重要途径,既包括传统的社交新闻网站,也包括今日头条这种后起之秀,它们纷纷采用协同过滤的方法为用户提供信息,建立了新的信息把关模式。<br> |
| + | 计算传播学将传播学研究置于数据和计算方法的坚固基础上。数据作为一种新的石油,解放了社会科学家对于理论的过度依赖。随着数字媒体的发展,人类社会积累的人类传播行为数据的规模日趋庞大,详尽地记录了社会发展和人类互动的各种细节。运用这些生动的人类传播行为数据,可以从更细的颗粒度、更大的样本规模上让我们捕捉社会的发展。毫无疑问,对于数据的挖掘依赖于人类的计算能力的提高,依赖于跨学科的研究方法和研究视角。我们人类传播行为的基因恰恰隐藏在互动性当中,但这种人类传播行为的互动性本身也使得传播过程充满了复杂性。网络科学为捕捉到纷繁复杂的人类互动提供了一个很好的视角。从数据出发,借助于计算方法和好的理论视角,就可以更好地刻画人类传播行为的模式和法则。需要指出的是,不管是模式还是法则,本身并没有能够回答我们所观察到的社会现实是由何种社会机制构成,因而需要通过建构数学和物理模型的方式来解释社会机制并基于社会机制预测具体的社会现实。社会机制虽然可能非常复杂,但背后的普适性原理却可以非常简单。<br> |
| + | 计算传播学试图从重大的社会问题出发,系统地收集并分析人类传播行为的数据,刻画数据背后的行为模式,探索模式背后的社会机制,试图上升到一般性的原理,达到更好地解释和预测人类传播行为的目的。一个好的理论应当尝试捕捉到这种普适性的原理,基于一般性的原理生成机制,基于因果机制解释行为模式,基于模式预测现实,最终回答重要的社会问题。<br> |
| + | |
| + | 目标读者<br> |
| + | * 致力于进行“计算社会科学” 研究的本科生与研究生 |
| + | * 准备开设《计算传播学》或《计算社会科学》课程的青年教师 |
| + | * 对于定量传播学研究有基本了解 |
| + | * 对于Python、R等软件仅初步了解 |
| + | * 致力于日后进入相关数据科学领域工作的学生 |
| + | 本书特色<br> |
| + | * 强调跨学科合作 (传播学、网络科学、计算机科学) |
| + | * 介绍大量发表于Science、Nature、Proceedings of National Sciences (PNAS) 等国际顶级期刊的论文 |
| + | * 附加主要Python程序代码 |
| + | 书籍网站<br> |
| + | * Slides和Code见:https://github.com/computational-class/ccrbook |
| == 相关书籍 == | | == 相关书籍 == |
| 和这个主题相关的还有哪些推荐的书。 | | 和这个主题相关的还有哪些推荐的书。 |