通用人工智能

编写者:冯睿洋 刘兆庭 徐博文

AGI的历史

观念萌生

早在400年前,哲学家们就意识到,或许机器也能够做到一些人类才能做到的事。布莱兹·帕斯卡(Blaise Pascal,1623—1662)于1642年建造了滚轮式加法器(Pascaline),并写道:“它产生的效用似乎比动物的所有行为更接近思维。”托马斯·霍布斯(Thomas Hobbes,1588—1679)在《利维坦》一书中提出了会思考的机器的想法。而笛卡尔在1637年就提出了图灵测试的雏形,尽管他并不认为人就是机器。十八世纪法国医生和哲学家拉美特利扩展了笛卡尔关于动物机器的论点,认为人类也只是机器。

研究伊始

现代人工智能研究始于 1950 年代中期。 在1956年的达特茅斯会议上,人工智能第一次被提出。从一开始,人工智能“AI”的含义就是“让机器具有人类的智能”。第一代人工智能研究人员确信,通用人工智能是可能的,而且它将在短短几十年内存在。人工智能先驱赫伯特·A·西蒙(Herbert A. Simon)在1965年写道:“机器在二十年内将能够完成人类可以做的任何工作。”几个经典的人工智能项目,如Doug Lenat的Cyc项目、Allen Newell的Soar项目、日本的第五代计算机项目,都是针对AGI的。

陷入低谷

上个世纪下半叶,也许是研究人员严重低估了该项目的难度,这些曾经野心勃勃的计划都失败了。资助机构对AGI持怀疑态度,并使研究人员面临越来越大的压力,要求他们生产有用的“应用人工智能”。主流人工智能逐渐远离一开始的目的,而转向特定领域的问题和特殊问题的解决方案上,并取得了较大的进展。到1990年左右,人工智能研究人员变得根本不愿意做出预测,并避免提及“人类水平”的人工智能,因为害怕被贴上“梦想家”的标签。

重获关注

大约在2004年至2007年期间,主流AI内部和外部对通用系统进行研究的呼声再次出现。一些重要会议以及多个致力于通用人工智能和相关话题的研究社区相继出现。在主流人工智能中,深度学习近年来取得了令人瞩目的进展,这再次激发了许多人对“人类水平”人工智能的希望。“已经通过图灵测试”的说法和AlphaGo在围棋中的成功重新引发了关于“人工智能”到底是什么以及如何达到它的讨论。但学者们仍然没有达成共识,甚至意见也没有趋同。几家科技巨头将他们的结果标记为“迈向AGI的步骤”,GPT-4 就是一个例子,其创建者声称它是“迈向 AGI 的重要一步”。而近期对AI安全的广泛关注以及暂停AI研究的呼吁也体现出对AGI实现可能性的重视。

关于AGI这一概念

什么是AGI

通用人工智能一词在不同的时代、语境下,往往有着不太相同的用法,人们对通用人工智能具体的形态也有着不尽相同的理解。

为了能够简单地对AGI进行大致的了解,我们可以这样描述它,但请注意,这只是一个描述而非一个严格的定义:

通用人工智能是不以解决专门问题为目标的人工智能系统,其旨在对“智能”本身这一“元能力”进行建模并用计算机实现。

尽管对AGI并不存在公认的精确定义,但目前的通用人工智能研究可以被视为具有以下特点:

● 强调智能的通用性,而不仅仅是专门解决某一领域任务的能力。

● 从整体上理解和研究智能。

● 认为是时候建立一个在通用性上与人类智能相媲美或超越人类的人工智能了。

什么是通用

AGI的“通用”性质多年来获得了不同的解释:

● 可以解决所有问题,

● 可以解决所有人类可以解决的问题,

● 可以解决所有可计算的问题,

● 可以尝试解决所有可表示(representable)的问题。

什么是智能

根据对“智能”不同角度的理解,AGI也存在不同的研究视角,天普大学的王培教授认为,有多种角度可以理解智能,以下是他对理解智能的五种角度的分类,这也可以被视为不同AGI项目的研究目标:

● 结构角度:智能来源于大脑结构,应尽可能准确地模拟大脑结构。这一目标的难点在于可能存在在人工智能系统中既不可能也没有必要复制的生物学细节。

● 行为角度:智能体现在人类行为中,应完全模拟人类行为。这一目标的难点在于可能存在既不可能也没有必要在人工智能系统中复制的心理或社会因素。

● 能力角度:智能体现在解决问题的能力,应解决当前只有人类能解决的实际问题。这一目标的难点在于,目前没有一个普遍认可的、仅从问题求解能力出发的智能定义。将智能视为解决问题的能力,存在将智能的范围窄化的风险,也难以判定某种算法是否真正属于“智能”。此外,专门解决特定问题的程序往往缺乏适应新环境的普适性和灵活性。

● 功能角度:智能包含一系列认知功能,应实现这些功能。这一目标的难点在于目前的人工智能技术高度碎片化,它们很难协同工作。

● 原理角度:智能是一种理性或最优性,应遵循某些一般原则。这一目标的难点在于智能和认知有太多的方面无法用简单的理论来解释和复现。

不同视角下的AGI

不同的学科或领域的学者对于AGI的关注在侧重点上有很大差异,这些内容将在随后开展的AGI通用人工智能读书会“多视角下的智能”这部分中展开讨论。以下是一些同样很重要但少有文章提及的,非技术性、更人文的视角:

认知科学哲学视角下的AGI

认知科学哲学的特点是受具体的科学成果启发,从而提出宏观的理论性假设进而启发科学研究,该领域下的研究人员对AGI之于认知和心灵相关研究的理论意义感兴趣。经典问题包括机器是否能够真正思考和理解,以约翰·塞尔(John Searle)为首的一批哲学家表示了反对,塞尔提出了著名的中文屋论证(The Chinese room argument),他认为机器根本无法做到真正的思考,因为它们缺乏与世界适当的语义连接。另一种质疑来自卢卡斯(Lucas),他认为哥德尔不完备性定理表明机器无法真正思考。福多(Fodor)和物理学家彭罗斯(Penrose)等人也在这一阵营贡献了自己的观点。除了这些经典问题与回应外,最近的讨论具体围绕大语言模型是否能够像人类一样理解自然语言展开。

科技哲学视角下的AGI

奇点问题(The Singularity)是该领域的代表问题之一:奇点即人工智能达到人类的智能水平,并有能力开发出属于自身的新一代人工智能,从而导致“智能爆炸增长”并威胁人类的假设。美国计算机科学家雷蒙德·库兹韦尔(Raymond Kurzweil)和哲学家大卫·查默斯(David Chalmers)为奇点的风险和应对贡献了相关讨论。此外,以唐娜·哈拉维(Donna Haraway)、N·凯瑟琳·海勒(N.Katherine Hayles)为代表的研究赛博格(Cyborg,一种人机融合体)和后人类(Posthuman,关注技术和人类文化转变的理论)的学者同样为AGI对人类社会的观念、文化和历史的影响贡献了大量观点。

在AGI的伦理方面,一个新近的话题在于对人工道德主体(Artificial Moral Agents,AMA)的讨论:随着人工智能在社会中承担的任务和责任的增加,必然导致其需要在一定程度上做出某种伦理决策,那么人工智能能否做出道德决策?应如何做出道德决策?能否并如何为道德决策负责?这些都是该领域的学者们所关注的。

社会智能视角下的AGI

该领域的研究者们关注如何让人工智能实现社会智能。他们将类人智能( human-like intelligence)分为了物理智能(physical intelligence )与社会智能(social intelligence),而当前人工社会智能(artificial social intelligence, ASI)被很多其他领域的研究者所忽略了。实现社会智能的难点主要是,社会智能往往依赖于环境/背景/语境的,并且其输入往往是非文字的、模糊的(比如同一个手势,可能被人们在不同情景下表达不同含义)。这个领域下的子领域/话题有社会感知、心智理论(Theory of Mind, ToM)和社会互动。

除此之外,AGI这一话题也涉及神经科学、复杂性科学、认知科学等众多重要的视角。这部分的内容会在随着AGI通用人工智能读书会的展开进行深入讨论后进行补充。感兴趣并有相关背景的朋友可以通过共创的方式在集智百科中完成。

AGI研究现状

为了实现AGI,当前研究人员们往往采用以下几种策略之一:

混合(Hybrid):混合是把各个专门问题的解决方案混合在一起组成一个系统,遇到不同问题就调用不同的程序。由于目前市面上几乎所有针对专门问题的功能模块都基于不同的理论基础,混合并不能带来模块间的协同工作,因此目前在该策略上并没有任何可靠的项目。

整合(Integrated):整合是预先画一个整体架构图,然后对于每个部分采用不同技术填充,这在一定程度上避免了内部不一致的矛盾。代表项目有ACT-R、Sigma、Soar等。

统一(Unified):统一是期待用同一个技术实现全部功能。例如大语言模型在回答不同领域的问题时,其操作都是在预测下一个token。代表项目有GPT-4、HTM、NARS、AIXI等。


以下是一些代表性的、有影响力的项目案例:

● 千脑智能(其前身是HTM)理论是一种满足脑的“生物约束”的理论模型,其基本思想是以皮质主为基本单元,时序学习、空间感知等过程分属皮质柱中的不同的层实现。

● GPT-4使用巨量的语料数据进行训练,采用人类反馈强化学习(RLHF)等技术使模型与人类“对齐”,最终复刻出人的语言行为。

● 许多认知架构希望通过建立人的认知计算模型来实现通用人工智能,相关工作包括ACT-R、Sigma、Soar等,主要方式是将工作记忆、过程性记忆、感知功能、运动功能等人的各个认知功能组织为一个整体的系统。

● 非公理推理系统(NARS)旨在用统一的理论建模智能,通过逻辑和推理来刻画感知、运动、规划、决策、问题求解等复杂的智能现象。

对于AGI的质疑

尽管学界与业界近年来都更加关注AGI并投入了许多精力,但仍有很多对于AGI的质疑的声音存在,以下是一些常见的质疑。

● AGI能实现吗?

由于近几年人工智能在部分任务上的表现逐渐接近乃至超越人类,这类质疑变得不再主流。

● AGI会带来很大的风险?

这类质疑从很早起便存在,且近年来越发增加。包括近期马斯克等AI行业领袖联合发起的呼吁暂停比GPT-4更强大的AI联名信,计算机科学家Stephen Wolfram 发表的《AI 会抢走所有工作并终结人类历史吗?》等。不过伴随着质疑的出现,也有Max Tegmark等学者在呼吁公众理性的同时加强对于安全与对齐问题的探索。

● 现在的人工智能的研究能否通向AGI?

近期大语言模型表现出的远超以往的智能水平让许多人都认为AGI离我们已经不远了,但也有一些学者质疑这样的进路是否最终能够通向AGI。这类质疑中比较有代表性的是Yann LeCun,他认为大语言模型由于缺少世界模型而不会演进为AGI。

相关资源

相关文献

Advances in Artificial General Intelligence: Concepts, Architectures and Algorithms是2006年AGI研讨会的会后论文集。

Theoretical Foundations of Artificial General Intelligence是由活跃的AGI研究人员合著的文献。每一章都涉及AGI中的一个理论主题,其编写风格也对非专业人员较为友好。

Suggested Education for Future AGI Researchers是天普大学的王培教授为准备学习AGI领域知识、成为AGI领域研究者的人写的学习指南。

AGI通用人工智能读书会文献推荐是岳玉涛、沈马成、徐博文三位老师为AGI通用人工智能读书会推荐的文献列表,集智斑图页面可以直接跳转、下载其中提及的文献。

相关会议、期刊、网站

annual AGI international conference series始于2008年。会议网站上包涵所有其接受的论文、演示文件和视频记录等其他材料。

Journal of Artificial General Intelligence(JAGI) 是一本开放获取的同行评审期刊,创刊于 2009 年。

Artificial General Intelligence Society AGI会议和期刊由Artificial General Intelligence Society(AGIS)管理。每个对AGI感兴趣的人都可以成为会员。


最后,非常感谢天普大学的王培老师授权很大程度上参考了他的工作。也感谢岳玉涛、沈马成、徐博文对百科提出的指导和建议,以及更多帮助到本文写作的小伙伴,包括金琪雨、李路凯、靳凯哲、林崧驰、李相羊等。

主要参考文献

1. https://cis.temple.edu/~pwang/AGI-Intro.html#TOC-Strategies-and-techniques

2. https://plato.stanford.edu/entries/artificial-intelligence/

3. https://plato.stanford.edu/entries/ethics-ai/

4. https://en.wikipedia.org/wiki/Artificial_general_intelligence

5. http://www.scholarpedia.org/article/Artificial_General_Intelligence

6. https://philpapers.org/browse/can-machines-think

7. Wang P, Goertzel B. Introduction: Aspects of artificial general intelligence[C]//Proceedings of the 2007 conference on Advances in Artificial General Intelligence: Concepts, Architectures and Algorithms: Proceedings of the AGI Workshop 2006. 2007: 1-16.

8. Wang P. On defining artificial intelligence[J]. Journal of Artificial General Intelligence, 2019, 10(2): 1-37.

9. Russell S J. Artificial intelligence a modern approach[M]. Pearson Education, Inc., 2010.