通用人工智能(Artificial General Intelligence),是指具有高效的学习和泛化能力、能够根据所处的复杂动态环境自主产生并完成任务的通用人工智能体,具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念。其研究发展通常涉及众多学科领域,包括
计算机科学、
认知科学、
心理学、
神经科学等。
发展历史
现代人工智能的发展起始于20世纪50年代中期,当时的一批研究者对于强人工智能的出现抱有强烈信心。赫伯特·亚历山大·西蒙(Herbert A.Simon)预言:“在20年之内,机器就能够做到一个人能做到的任何事”。1956-1974年的第一个黄金时代见证了机器定理证明和逻辑推理的突破。1974-1980年,因过于强调通用求解方法,忽略了知识表征,导致了第一次寒冬,主流的研究方法逐渐从通用目的转向针对特定领域。1980-1987年迎来了发展的第二个繁荣期,知识库和知识工程是主要的研究对象。而在1987-1993年,由于“符号落地”和“常识获取”的发展制约,人工智能遭遇第二次寒冬。1990年代至今,人工智能开始进入平稳发展期,分化成几个子领域,包含计算机视觉、自然语言处理、认知与推理、机器学习、机器人学、
多智能体领域等。每个领域均出现过突破性的成果,但是每个独立的成果局限在自己的子领域中,人工智能距离达到人类通用且泛化的智能水平仍然相差甚远。2004-2007年左右,研究通用目的系统的呼声重新在主流AI领域内外兴起,“集成AI(integrated AI)”、“通用系统(general-purpose system)”、“人类水平AI(human-level AI)”等主题逐具讨论度。2008年后,诸如Conference Series on Artificial General Intelligence, Advances in Cognitive Systems, IEEE Task Force on Towards Human-like Intelligence等会议或期刊相继出现,部分人工智能技术公司已经将自己的研究成果标记为“迈向AGI的一步”。2023年,OpenAI发布GPT-4,其所拥有能力的深度与广度,让它的创作者将其称为“迈向AGI的重要一步”。
人工智能的发展起伏跌宕,其哲学思想也经历几次转变。
第一时期(1960-1990)西方哲学思想引领了人工智能的发展。以苏格拉底、柏拉图、亚里士多德为代表的辩论与逻辑,发展成为严密的命题逻辑、谓词逻辑、事件逻辑等体系,为人工智能的逻辑、表达与推理等方面提供了理论框架。
第二时期(1990-2020) 概率建模、学习与随机计算占据主导地位。核心代表人物包括乌尔夫·格林纳德(Ulf Grenander)、朱迪亚·珀尔(Judea Pearl)、莱斯利·瓦利安特(Leslie Valiant)、杰弗里·辛顿(Geoffrey Hinton)等。研究思想与儒家的方法论“格物致知”一脉相承,本质是从数据到模型的知识发现过程,与当今人工智能领域的大数据方法思路相似。
然而,大数据催生的人工智能系统缺乏内驱的价值体系,缺乏主观的能动性,这种内驱的价值体系被中国哲学称之为“心”,包括“心即是理”, “心外无物”等概念。2020年之后,人工智能的发展由“理”(数理模型)向“心”(价值函数)过渡,人工智能的科研范式应从“数据驱动”转向“价值驱动”,而实现通用人工智能的关键是为机器立“心”。智能体由“心”驱动,实现从大数据到大任务、从感知到认知的飞跃,这是迈向通用人工智能的必经之路。
研究理论
一个统一理论
通用人工智能研究的目标是寻求统一的理论框架解释各种智能现象,并研发具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类情感、伦理与道德观念的通用智能体。
两个完备性
通用人工智能系统还需具备AI系统的两个完备性。
所谓AI Completeness,指的是:
(1)完备的认知架构(Complete CognitiveArchitecture),即任意一个AI任务都可映射到该架构中解决,并能分析任务的复杂度;
(2)完备的测试环境(Dynamic Environment with Physical and Social Interactions, DEPSI),即可提供任意复杂的物理与社会场景,将人类可能遇到的任务均可在平台上复现。
三个基本特征
实现通用人工智能需要满足三个关键要求。
(1)完成无限任务,包括在复杂动态的物理和社会环境中没有预先定义的任务;
(2)自主定义任务,像人类一样自主产生并完成任务;
(3)由价值驱动,智能体要像人一样由价值V驱动能力U。
当前的人工智能研究还大多集中在数据驱动的统计建模与学习,亟需增进因果推理能力,这是链接智能体的内在价值和外部行动,构成价值-因果-行为链条的关键所在;并开放具身能力,这是智能体能够进入现实世界与人和环境交互,执行并完成任务的基础。而当前的ChatGPT大语言模型还不具备以上这些特征的任何一个。
八个关键问题
关键问题1:认知架构——心智模型是通讯、学习、伦理道德形成的基础。认知架构是通用人工智能的表示框架,也是构建心与理U-V双系统价值驱动的根本。它构建了一套完整的认知体系,包括心智模型、通讯学习等理论。这是通用智能体与人类通讯、交流、信任、合作的基础。只有建立了完备的认知架构,通用智能体才能实现与人类的四个对齐(Alignment):共同的态势感知(Shared situation)、共同的演化模型(Shared predictive model)、共同的行动规范(Social norm)、共同的价值观(Shared value)。认知架构的重点在于实现“小数据、大任务”范式。决定人工智能系统的三个关键要素是架构、任务和数据,不同的选择导致不同的系统和路径。只有“小数据、大任务”范式才能摆脱掉“大数据、小任务”对数据的强烈依赖,以及模型不可解释、缺乏价值驱动等弊端,从而实现具有感知、认知、推理、学习、执行等能力的自主智能。
关键问题2:自我意识 指个体对自己的各种身心状态的认识、体验和愿望。在心理学中,测量自我意识的经典范式是镜子实验(Mirror test)。戈登盖洛普试图通过判断动物是否能够辨别出它在镜中的像是它自己而判断其自我认知能力。如何判断智能体是否涌现出了自我意识、如何应对智能体的自我意识,是未来通用人工智能发展的一个不可回避的问题。
关键问题3:价值函数 智能体的价值体系不是一成不变的,需要随着外部环境的变化而自动学习和调整。智能体的价值函数可以通过观察人类的行为、与人交互,学会并理解人类的“价值”,做到“察言观色”,时刻明确个人当前的价值需求,进而调整行为决策,自主产生并完成任务。
关键问题4:价值驱动 人类行为本质上受价值驱动。智能体可以通过观察人类的行为,学会和理解人类的“价值”,做到“察言观色”,时刻明确个人当前的价值需求,进而调整行为决策,自主产生并完成任务,才能实现通用智能。
价值函数(Value)是U-V双系统中V系统的表征。驱动通用智能体的内在价值函数的集合构成了价值体系,包含了个体基本生理与安全需求、社会需求、好奇心与自我潜能实现,以及群体利益等多个层级。机器的价值必须跟人类的基本价值观对齐。只有建立了“良知”之心,通用智能体才能被人类广泛接纳。
关键问题5:具身智能 具身智能是智能体使用身体完成物理任务的现象,其核心之一是“知行合一”。中国哲学家早已认识到“知行合一”的理念,即人对世界的“知”建立在“行”的基础上,这也是通用智能体能否真正进入物理场景和人类社会的关键所在。其核心之二在于“身体力行”。只有将智能体放置于真实的物理世界和人类社会中,让它们躬“身”体验环境物体、符合物理因果,才能切实了解并习得真实世界中事物之间的物理关系和不同智能体之间的社会关系。
关键问题6:社会智能 社会智能是人类在适应更为复杂的社会情境中所展现的社会认知能力。从进化的角度看,社会智能的发展对于人类的适应至关重要。社会智能具有密不可分的三方面:社会感知、心智理论和社会交互。研究社会智能有助于研究者设计出具有人类特征的交互智能体,使其做到“察言观色、眼里有活、主动帮助”。2023年3月,北京通用人工智能研究院认知计算与常识推理实验室联合北京大学人工智能研究院在CAAI Artificial Intelligence Research期刊上发表综述论文”Artificial Social Intelligence: A Comparative and Holistic View“,呼吁学界对人工社会智能领域进行关注。
关键问题7:可解释性 可解释人工智能指的是智能体以一种可解释、可理解、人机互动的方式,与人工智能系统的使用者、受影响者、决策者、开发者等,达成清晰有效的交流沟通,有效地“解释”自身行为和决策,以取得人类信任,同时满足各类应用场景对智能体决策机制的监管要求。解释是一个多轮次沟通的过程,其目的在于取得对方的理解、建立信任、达成合作、提高协作的效率。智能体只有有效地“解释”自己,才能取得用户的“信任”,从而产生高效的人机协作。
北京通用人工智能研究院于2022年发表了“实时双向人机价值对齐 Bidirectional human-robot value alignment”研究,论文同时被Science官网和Science Robotics官网头条刊登。这篇论文提出了一个可解释的人工智能系统,阐述了一种机器实时理解人类价值观的计算框架,并展示了机器人如何与人类用户通过实时沟通完成一系列复杂人机协作任务的过程。
关键问题8:人机互信 信任是人类在社会协作中的一种心理状态,一般分成两个层次:一是对其能力U的信任,即个人对周围的每个人、在某个条件下、是否合适做某件事,都有不同程度的信任;二是对其价值V的信任,包含了态度与感情。信任的本质是人类愿意暴露自己的“脆弱性”。这是人类在没有更好选择的情况下做出的决定。从理论上讲,其风险底线需要通过经济学范畴的合同来规范。人类与智能体也要“签合同”来实现人机互信。这需要智能体由内在价值函数驱动,通过价值对齐与认知架构形成通用智能体与人交流合作的基础,通过具身智能和社会智能实现机器与环境和人交互,通过可解释性的沟通和价值对齐形成人机信任关系,由此才能实现
人机共生。
测试体系
。
图灵测试
图灵测试由英国计算机科学家艾伦·图灵(Alan Turing)提出。在该测试过程中,测试者分别与一个人类和一台机器进行对话,但不知道对方是人类还是机器。如果测试者无法区分人类和机器,那么机器就通过了图灵测试,被认为具有智能。
咖啡测试
这项测试由人工智能研究员本·戈泽尔(Ben Goertzel)提出。人工智能应用程序被要求去一所房子内煮咖啡,它可以去到任何一个普通家庭的厨房,在没有刻意设定好配置程序的前提下,从陌生的环境中找到所需的配料、器具后,按照正确的步骤冲泡咖啡。
机器人学生测试
这项测试同样由本·戈泽尔(Ben Goertzel)提出。该测试要求人工智能进入一所大学就读,并使用和与其学位相同的学生同等的资源来获得学位。
雇员测试
人工智能研究员尼尔斯·尼尔森(Nils J.Nilsson)在其论文中提出了该测试方法。这项测试要求人工智能程序应该能够执行原本由人类负责的工作,并得到同等甚至更好的工作结果。
通智测试
2023年8月9日,朱松纯教授带领跨媒体通用人工智能全国重点实验室的团队在中国工程院院刊Engineering上发表了题为《通智测试:通用人工智能具身物理与社会测试评级系统》的文章,提出了通用人工智能的一套分类方法。
文章依据发展心理学和心智理论,参考人类婴幼儿发育的测试标准,研究总结出一种基于能力(U系统)和价值(V系统)的UV通用人工智能的评测方法,并开发了复杂动态的物理场景(模拟仿真)和社会交互(混合现实)的测试平台 -- 通智测试(Tong Test)。通智测试是一套面向通用人工智能的标准化、定量化和客观化的评估体系,其刻画了通用人工智能的3个基本特征,绘制了5个带有里程碑意义的通智测试等级(Level 1~5),为通用人工智能的科研及发展路径提供了重要参考。
未来趋势
人工智能的技术前沿将朝着以下四个方向发展。
第一个前沿方向为多模态大模型。从人类视角出发,人类智能是天然多模态的(眼、耳、鼻、舌、身、嘴),从AI视角出发,视觉,听觉等也可采取与
大语言模型相同的方法进行学习,并进一步与语言中的语义进行对齐,实现多模态对齐的智能能力。
第二个前沿方向为视频生成大模型。文生视频模型SORA将视频生成时长从几秒钟大幅提升到一分钟,且在分辨率、画面真实度、时序一致性等方面都有显著提升。SORA的最大意义是它具备了世界模型的基本特征,虽然仍然存在很多问题,但可以认为SORA学会了画面想象力和分钟级未来预测能力。
第三个前沿方向为具身智能。具身智能指有身体并支持与物理世界进行交互的智能体,通过多模态大模型处理多种传感数据输入,由大模型生成运动指令对智能体进行驱动,替代传统基于规则或者数学公式的运动驱动方式。具有具身智能的机器人,可以聚集人工智能的三大流派:以神经网络为代表的连接主义,以知识工程为代表的符号主义和控制论相关的行为主义,这预期会带来新的技术突破。
第四个前沿方向是AI4R(AI for Research)成为科学发现与技术发明的主要范式。当前科学发现主要依赖于实验和人脑智慧,而信息技术无论是计算和数据,都只是起到一些辅助和验证的作用。相较于人类,人工智能在记忆力、高维复杂、全视野、推理深度、猜想等方面具有较大优势,是否能以AI为主进行一些科学发现和技术发明,大幅提升人类科学发现的效率,比如主动发现物理学规律、预测蛋白质结构、设计高性能芯片、高效合成新药等。因为人工智能大模型具有全量数据,具备上帝视角,通过深度学习的能力,可以比人向前看更多步数。
与大语言模型的区别
大语言模型是一种基于深度学习技术的大型预训练神经网络模型,深度学习指的深度神经网络模型,是人工智能的分支“机器学习”下面的一种算法模型。虽然大型语言模型已经取得了一些惊人的进展,但大型语言模型还不符合通用人工智能的要求。
① 大型语言模型在处理任务方面的能力有限,它们只能处理文本领域的任务,无法与物理和社会环境进行互动。这意味着像 ChatGPT 这样的模型不能真正“理解” 语言的含义,因为它们没有身体来体验物理空间。中国的哲学家早就认识到 “知行合一” 的理念,即人对世界的 “知” 是建立在 “行” 的基础上的。这也是通用智能体能否真正进入物理场景和人类社会的关键所在。只有将人工智能体放置于真实的物理世界和人类社会中,它们才能切实了解并习得真实世界中事物之间的物理关系和不同智能体之间的社会关系,从而做到“知行合一”。
③ 虽然 ChatGPT 已经在不同的文本数据语料库上进行了大规模训练,包括隐含人类价值观的文本,但它并不具备理解人类价值或与人类价值保持一致的能力,即缺乏所谓的道德指南针。
加州大学伯克利分校教授Stuart Russell表示,关于ChatGPT,更多数据和更多算力不能带来真正的智能。要构建真正智能的系统,应当更加关注数理逻辑和知识推理,因为只有将系统建立在我们了解的方法之上,才能确保 AI不会失控,扩大规模不是答案,更多数据和更多算力不能解决问题,这种想法过于乐观,在智力上也不有趣。
大模型方向错了,智力无法接近人类。图灵奖得主Yann LeCun表示:语言只承载了所有人类知识的一小部分;大部分人类具有的知识都是非语言的,因此,大语言模型是无法接近人类水平智能的。深刻的非语言理解是语言有意义的必要条件,正是因为人类对世界有深刻的理解,所以我们可以很快理解别人在说什么。这种更广泛、对上下文敏感的学习和知识是一种更基础、更古老的知识,它是生物感知能力出现的基础,让生存和繁荣成为可能。这也是人工智能研究者在寻找人工智能中的常识时关注的更重要的任务。大语言模型没有稳定的身体可以感知,它们的知识更多是以单词开始和结束,这种常识总是肤浅的。人类处理各种大语言模型的丰富经验清楚地表明,仅从言语中可以获得的东西是如此之少。仅通过语言是无法让AI系统深刻理解世界,这是错误的方向。
政策支持
2023年5月23日,北京市人民政府办公厅印发《北京市促进通用人工智能创新发展的若干措施》,制定出提升算力资源统筹供给能力、提升高质量数据要素供给能力、系统构建大模型等通用人工智能技术体系、推动通用人工智能技术创新场景应用、探索营造包容审慎的监管环境等举措,推动通用人工智能实现创新引领和理性健康发展。
2023年8月28日,工业和信息化部印发通知,组织开展2023年未来产业创新任务揭榜挂帅工作。揭榜任务内容为面向元宇宙、人形机器人、
脑机接口、通用人工智能4个重点方向,聚焦核心基础、重点产品、公共支撑、示范应用等创新任务,发掘培育一批掌握关键核心技术、具备较强创新能力的优势单位,突破一批标志性技术产品,加速新技术、新产品落地应用。
2023年12月15日,国家数据局起草了《“数据要素×”三年行动计划(2024年-2026年)(征求意见稿)》,提出以科学数据支持大模型开发,深入挖掘包含科技文献在内的各类科学数据,通过细粒度的知识抽取,构建科学知识资源底座,建设高质量语料库和基础科学数据集,支持开展通用人工智能大模型和垂直领域人工智能大模型训练。
人才培养
2022年9月17日,2022全国人工智能院长论坛在北京大学举行,现场发布了《通用人工智能人才培养方案》白皮书。白皮书由北京大学和北京通用人工智能研究院共同编写,旨在提出一套培养兼具学术品位、科学精神和人文素养的本硕博贯通式通用人工智能人才培养体系,其核心目标是为了培养面向世界前沿科技的人工智能复合型顶尖人才,即“通识、通智、通用”。
人才培养以“通识”为基底,强调人工智能与人文、艺术、法律等社会科学的深度融合,旨在塑造学生的学术品味,使其以科学家精神为桨,人文素养为帆,敢于肩负国家和人民的重托,在学术道路上航行。
人才培养以“通智”为核心,强调人工智能核心知识的融会贯通,包含
计算机视觉、
自然语言处理、机器学习、认知与推理、机器人学、多智能体等专业课程,帮助学生理解和掌握人工智能专业的基础理论和方法,并构建人工智能学科内的知识图谱和领域全局观。
人才培养以“通用”为支撑,强调与产业端的融合发展,赋能千行百业,促进各行各业的智能化转型,为我国数字经济的高质量发展与向智能社会转型升级提供强力支撑。
依托于北京大学元培学院建设的通用人工智能实验班,一方面会立足于人工智能的学科内涵,即对内融合,依托北京大学智能学院开展工作,学生以人工智能的具体子领域为研究方向,旨在突破前沿基础理论;另一方面会立足于人工智能的学科外延,即对外交叉,依托北京大学人工智能研究院开展工作,学生选择人工智能的交叉学科进行研究,旨在产生创新的跨学科交叉探索成果。
2023年11月8日,通用人工智能协同攻关合作体人才培养计划(简称“通计划”)在北大英杰交流中心正式启动。“通计划”是由教育部支持、通研院与全国9所高校联合培养博士生的专项计划,将加强院校合作与资源共享,着力培养服务国家需求的通用人工智能领域拔尖人才。