基本信息

生成缩略图出错:无法找到文件

姓名:唐杰(Jie Tang)

国籍:中国

母校:清华大学

研究方向:人工智能,数据挖掘,社会网络,机器学习和知识图

研究经历:

清华大学计算机科学与技术系长聘教授,计算机系副主任、清华-工程院知识智能联合实验室主任,获杰青。

主持研发了研究者社会网络挖掘系统AMiner,吸引了220个国家/地区1000多万独立IP访问。曾担任国际期刊ACM TKDD的执行主编和国际会议CIKM’16、WSDM’15的程序委员会主席、KDD’18大会副主席以及IEEE TKDE、ACM TIST、IEEE TBD等期刊编委。获英国皇家学会-牛顿高级奖学金、CCF青年科学家奖、国家自然科学基金委员会杰出青年学者、北京市科技进步一等奖、中国人工智能学会科技进步一等奖、KDD'18 杰出贡献奖。

曾作为访问学者赴康奈尔大学 (与John Hopcroft 教授和 Jon Kleinberg教授合作) 、南安普敦大学(与Wendy Hall女士合作)、KU Leuven (与 Marie-Francine Moens 合作) 、伊利诺伊大学厄巴纳-香槟分校(短期与韩合作)、香港中文大学(与Jeffrey Yu合作) ,以及香港科技大学(与琼罗合作)。

2004年到2005年,实习于微软亚洲研究院的NLC集团;

2004年曾参加了IBM中国研究实验室的实习项目;

2012年获国家优秀青年科学基金;

2016年度获清华大学计算机系先进工作者称号。


学生

Post Doc博士后(部分)

Yunpeng Gao

Jing Xu

Sha Yuan

Yutao Zhang

Huaiyu Wan (Assistant Professor @ Beijing Jiaotong University) 怀玉湾北京交通大学助理教授

Daifeng Li (Associate Professor @ Sun Yat-Sen University) 李副教授@中山大学

PhD Students博士生(部分)

Chenghui Zhang

Jiezhong Qiu

Kan Wu

Wenzheng Feng

Fanjin Zhang

Aoao Feng

Yang Yang (Assistant Professor @ Zhejiang University) 浙江大学助理教授

Jing Zhang (Assistant Professor @ Renmin University) 中国人民大学助理教授

Master Students硕士生

Qingsong Lv

Gan Luo

Yukuo Cen 郁果岑(上海)贸易有限公司

Gan Luo

Vincent Couverchel 文森特 • 库维尔切尔

Edaurd Ergenzinger 埃达尔德 • 埃尔根辛格

Hong Yang (graduated in 2017, Assistant Professor @ Qinghai University) 2017年毕业,青海大学助理教授

Zhanpeng Fang (graduated in 2016, Google US) (2016年毕业于谷歌美国)

Zi Yang (graduated in 2011, now PhD at CMU) (2011年毕业,现在是卡内基梅隆大学的博士)

Limin Yao (co-advisor, graduated in 2008, @Twitter) (共同顾问,2008年毕业,@twitter)

Duo Zhang 张 (co-advisor, graduated in 2007, @Twitter...) (共同顾问,2007年毕业,@twitter...)

主要文章及著作

已发表了200多篇期刊及会议论文,拥有20项专利。

研究课题

主要创新性研究包括:

  1. 社会影响力分析:提出基于话题的社会网络影响力模型,针对大规模社会网络进行用户级别的微观建模,自动计算用户之间基于不同话题层次的影响力强度,为定量化、细粒度的网络影响力分析给出理论基础,部分解决了影响力最大传播模型的输入假设问题。
  2. 社会网络用户行为建模:将社会网络的基础理论(结构平衡理论、两阶段传播理论、结构洞理论等) 融入概率因子图模型中对社会网络关系和强度进行定量描述,实现了社会网络关系挖掘的统一学习算法。
  3. 网络行为建模和影响力分析,提出了针对社会网络的微观动态分析方法,并首次提出了社会影响力的量化分析方法,以及社会网络行为和社会影响力关联关系的分析方法。
  4. 应用上述研究成果,研发了完全自主知识产权的科技情报大数据挖掘与服务平台AMiner。系统2006年上线以来,吸引了来自全球220个国家/地区的1000多万次独立IP访问。
  5. 参与/负责课题:国家自然科学基金课题:统一的语义内容标注模型研究 (2008-2010)

国家自然科学基金重点课题:面向Web的社会网络理论与方法研究 (2010-2013) 863课题:基于概率图模型的异构XML数据集成与检索 (2009-2010) IBM国际合作项目:社会网络搜索和挖掘 (2007-2011) Nokia国际合作项目:基于移动终端的本体场景建模和管理 (2009-2011)

Representation Learning on Networks 网络表征学习

目标是使用神经网络等技术,将网络结构自动编码到低维空间(嵌入)。

该课题从理论上证明了最新的模型如 DeepWalk、LINE、PTE和node2vec可以统一到封闭形式的矩阵分解框架中。 针对传统的网络挖掘任务,提出了一种新的NetMF算法,该算法的性能明显优于DeepWalk 和LINE算法。并在此基础上,进一步提出了一种多头注意网络来预测用户行为。此外,我们把用户的意见加入预测中,并提出一个匪徒学习模型(a bandit learning model)。

数据集和代码:NetMF DeepInf

Social Network Mining 社交网络挖掘

在线社交网络已经成为连接我们日常生活和虚拟信息空间的桥梁,产生了海量的网络数据。 该研究的目的是了解隐藏在用户之间的社会交互动态和网络中的信息扩散的机制。

本文提出了一种新的主题亲和度传播方法(Topical Affinity Propagation,TAP)来模拟话题层次的社会影响、从众性影响分析、结构性影响、推断社会关系以及用户统计资料。在宏观层面上,我们专注于挖掘前k个结构孔扳手(top-k structural hole spanners),这些扳手控制信息在不同社区之间的传播以及跟随链接的传播。

代码和数据集:Topic-Influence Structural hole Datasets for SNA

Academic Knowledge Graph 学术知识图表

该课题专注于构建大规模知识图,尤其是学术数据。 在这项研究中,我们研究了多个主题,包括专家发现:职业轨迹挖掘、社会推荐、信息/知识整合、名称歧义消除、汇总、内容对齐、相似度搜索。

基于这些研究,我们开发了一个用于学术搜索和挖掘的系统AMiner(ArnetMiner)。该系统拥有超过1.36亿研究人员和2亿篇论文。自2006年以来,该系统已经吸引了来自220多个国家/地区的1000万个独立IP访问。

代码和数据集:AMiner Dataset Open Academic Graph

AI Driven MOOCs 人工智能驱动的网络公开课

大规模开放式在线课程(MOOC)收集在线学习环境中所有学生互动的完整记录,为我们提供了前所未有的机会来以前所未有的精细度分析学生的学习行为。

该课题使用来自中国最大的MOOC之一的xuetangX的数据集,分析了影响学生参与MOOC的关键因素,并研究了在多大程度上可以推断出学生的学习效果,提取了概念关系预测学生的辍学率。

已吸引超过1000万注册用户。

代码和数据集:MoocData

联系方式

1、邮箱地址:jietang@tsinghua.edu.cn

相关链接

1、唐杰个人主页

2、清华大学个人主页

3、百度百科词条