文心一言(英文名:ERNIE Bot)是
百度全新一代知识增强
大语言模型,
文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取
信息、
知识和
灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
发展历程
早期研发
2019年3月16日,百度正式发布知识增强的文心大模型ERNIE 1.0,该模型基于飞桨深度学习平台打造,通过将数据与知识融合,提升了大模型学习效率及学习效果。
2019年7月31日,百度文心大模型升级到2.0。ERNIE 2.0通过持续学习框架,持续学习大规模语料中的词法、语法、语义等知识,在共计16个中英文任务上取得全球最好效果。
2020年7月9日,文心大模型(ERNIE)荣获世界人工智能大会WAIC最高奖项SAIL奖。
2021年7月6日,百度官方消息,百度发布文心大模型 3.0(ERNIE 3.0)。ERNIE 3.0首次在千亿级预训练模型中引入大规模知识图谱,ERNIE 3.0刷新54个中文NLP任务基准,并在国际权威的复杂语言理解评测SuperGLUE上, 以超越人类水平0.8个百分点的成绩登顶全球榜首。
2019年-2022年,文心大模型(ERNIE)在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破,在公开权威语义评测中斩获了十余项世界冠军。
发布历程
2023年2月7日,百度官宣新一代大语言模型文心一言(英文名:ERNIE Bot)。百度全栈布局人工智能四层架构,包括芯片层、框架层、模型层和应用层。文心一言,位于模型层。
2023年2月13日,百度官微消息,文心一言将于3月和大家正式见面。
2023年3月16日,百度新一代大语言模型文心一言正式启动邀测。
2023年3月16日,百度北京总部召开新闻发布会,主题围绕新一代大语言模型文心一言。百度创始人、董事长兼首席执行官李彦宏及百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰出席,并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
2023年4月16日,百度首席技术官、深度学习技术及应用国家工程研究中心主任
王海峰再次做客
CCTV-2 《
中国经济大讲堂》,阐释文心一言这类大语言模型的产品能力、技术原理和产业价值。
2023年4月17日,百度官微发文称文心一言在百度内部全面应用在智能工作平台“如流”。
2023年5月4日,百度创始人、董事长兼首席执行官
李彦宏在内部“新使命六周年暨百度骄傲颁奖典礼”发言:文心一言内测一个多月,就完成了4次大的技术升级,大模型推理成本已经降到了原来的十分之一,推理性能提升近10倍。
2023年5月26日,百度创始人、董事长兼首席执行官李彦宏在2023中关村论坛发表题为《大模型改变世界》演讲。他表示百度很快还会推出文心大模型3.5版本。
2023年6月26日,百度创始人、董事长兼首席执行官李彦宏出席“世界互联网大会数字文明尼山对话”,发表了题为《大模型重塑数字世界》的演讲。提到文心大模型已经迭代到3.5版本,与3月份的3.0版本相比,训练速度提升了2倍,推理速度提升了17倍,模型效果累计提升超过50%。
2023年6月27日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰接受采访,详细解读了文心3.5在技术和工程上的升级。据了解,与文心大模型3.0相比,3.5版本不仅在创作、问答、推理和代码能力上全面升级,安全性显著提升,训练和推理速度也大幅提升。功能方面,文心大模型最大的一个变化是新增了插件机制。
2023年8月16日,WAVE SUMMIT深度学习开发者大会消息,文心一言已上线五个官方原生插件:百度搜索(使模型具备生成实时准确信息)、览卷文档(基于文档的长文本摘要和问答)、E言易图(数据洞察和图表制作)、说图解画(基于图片的创作和问答)、一镜流影(文生视频能力)。据介绍,文心一言目前可以支持一次同时使用3个插件,不但扩展了大模型能力边界,也更适应场景需要。
2023年8月31日,文心一言率先向全社会全面开放。开放首日,文心一言共计回复网友超3342万个问题。
2023年9月18日晚,文心一言大语言模型作为科技创新成果代表登上《新闻联播》。
2023年10月17日,百度世界2023大会上,
李彦宏宣布文心大模型4.0正式发布,开启邀请测试。文心大模型4.0是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升。
2023年10月28日,
中国计算机大会上百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,文心一言发布至今,文心大模型4.0训练算法效率提升3.6倍,周均训练有效率超过98%,推理性能提升50倍。
2023年11月1日,文心一言专业版正式上线。文心一言官网显示,专业版会员连续包月费用为49.9元,单月购买为59.9元。此次专业版会员服务对应的模型版本是文心大模型4.0,而文心大模型3.5仍可免费使用。
2023年11月8日,世界互联网大会上,百度知识增强大语言模型关键技术荣获“世界互联网大会领先科技奖”。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰披露,文心一言用户规模现已达到7000万,场景4300个。
2023年12月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布,文心一言用户规模已突破1亿,飞桨开发者达到1070万。
2024年1月17日,由粤澳工商联会和百度联合主办的“百度‧澳门AI战略合作签署仪式暨文心一言App澳门智慧城市发布会”在澳门举办。
2024年1月26日,三星电子将在中国推出的Galaxy S24系列智能手机中集成百度的大语言模型文心一言,这将成为其新款手机系列的主要亮点。
2024年2月1日,目前文心一言APP正在内测数字分身新功能,2月2日起,iOS和Android用户升级新版本后,均可免费使用该功能。
2024年4月16日,百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上正式发布了文心大模型4.0的工具版。截止2024年4月16日,文心一言用户数已突破2亿,API日均调用量也突破了2亿,服务客户数8.5万,千帆平台AI原生应用数超过了19万。
2024年6月28日,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAVE SUMMIT深度学习开发者大会2024上宣布文心一言累计用户规模已达3亿,日调用次数也达到了5亿,并正式发布文心大模型4.0 Turbo、飞桨框架3.0等最新技术。
2024年9月4日,百度文心一言App获推4.0.0版本升级,更新日志显示,文心一言升级为“文小言”,号称“功能更强大,场景更丰富”。
2024年11月,王海峰公布文心一言用户规模达到4.3亿。
2024年12月,文心大模型日均调用量达16.5亿次,一年增长33倍。
2025年2月,百度宣布将发布下一代人工智能模型Ernie 5.0。2月,文心一言上线了深度搜索功能。
2025年4月1日起,文心一言全面免费,所有PC端和APP端用户均可体验文心系列最新模型。
2025年3月16日,文心大模型4.5和文心大模型X1正式发布!目前,两款模型已在文心一言官网上线,免费向用户开放。
模型能力
文心一言是新一代知识增强大语言模型,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。
五个场景综合能力
2023年3月16日文心一言新闻发布会上,百度创始人、董事长兼首席执行官李彦宏及百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成式AI在回答事实性问题时常常“胡编乱造”,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。
文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。连续三次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。
文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力,在中文语言和中国文化上有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
百度创始人、董事长兼首席执行官李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。文心一言甚至能够生成四川话等方言语音。
文心大模型 4.0
2023年10月17日百度世界大会上,文心大模型4.0正式发布。百度创始人、董事长兼首席执行官李彦宏表示,这是迄今为止最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,综合能力“与GPT-4相比毫不逊色”。 文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。
基于文心大模型4.0,百度创始人、董事长兼首席执行官李彦宏依次演示了四大能力的特点与应用场景。
在理解能力上,他通过询问公积金异地贷款政策的案例,展示了文心一言对前后乱序、模糊意图、潜台词等复杂提示词的理解力,例如“在北京工作”等同于“在北京缴纳公积金”等等,“今天,你说的每一句话,它大概率都能听懂”。
在生成能力上,李彦宏展示了文心一言如何在短短几分钟内,根据一张素材图片,迅速生成了一组广告海报、五条广告文案以及一条营销视频。据介绍,基于这一系列能力,百度已经推出了AIGC营销创意平台擎舵,让“一个人就成为一支AI营销队伍”。
同时,他还通过解数学题、总结知识点等场景,展示了大模型的逻辑能力;通过数千字的小说撰写和角色、情节设置,体现了大模型的记忆能力;以及数字人医生帮助患者解读药品说明书,来展现四大能力的综合应用。
文心大模型4.0在多个关键技术方向上进一步创新突破。在万卡算力上运行飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。建设了多维数据体系,形成了数据挖掘、分析、合成、标注、评估闭环,充分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。
文心大模型4.0在输入和输出阶段都进行知识点增强。一方面,对用户输入的问题进行理解,并拆解出回答问题所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,最后把这些找到的知识组装进prompt送入大模型,准确率好,效率也高。另一方面,对大模型的输出进行反思,从生成结果中拆解出知识点,然后再利用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,进而对有差错的点进行修正。
在强大的基础大模型的基础上,百度进一步研制了智能体机制,包括理解、规划、反思和进化,能够做到可靠执行、自我进化,并一定程度上将思考过程白盒化,让机器像人一样思考和行动,自主完成复杂任务,在环境中持续学习实现自主进化。
文心大模型 4.0 Turbo
百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰在WAVE SUMMIT深度学习开发者大会2024上发布了文心大模型4.0 Turbo,网页版、APP、API陆续面向用户开放。企业用户即刻起登录百度智能云千帆大模型平台,即可使用API服务。
通过数据、基础模型、对齐技术、提示、知识增强、检索增强和对话增强等核心技术的持续创新,以及飞桨文心的联合优化,文心大模型4.0 Turbo的速度更快,效果更好。
文心大模型 4.5
文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑推理、代码能力显著提升。
文心大模型4.5能力显著增强,离不开这些关键技术:
FlashMask动态注意力掩码:加速大模型灵活注意力掩码计算,有效提升长序列建模能力和训练效率,优化长文处理能力和多轮交互表现;
多模态异构专家扩展技术:根据模态特点构建模态异构专家,结合自适应模态感知损失函数,解决不同模态梯度不均衡问题,提升多模态融合能力;
时空维度表征压缩技术:在时空维度对图片和视频的语义表征进行高效压缩,大幅提升多模态数据训练效率,增强了从长视频中吸取世界知识的能力;
基于知识点的大规模数据构建技术:基于知识分级采样、数据压缩与融合、稀缺知识点定向合成技术,构建高知识密度预训练数据,提升模型学习效率,大幅降低模型幻觉;
基于自反馈的Post-training技术:融合多种评价方式的自反馈迭代式后训练技术,全面提升强化学习稳定性和鲁棒性,大幅提升预训练模型对齐人类意图能力。
文心大模型 X1
文心大模型X1具备更强的理解、规划、反思、进化能力,并支持多模态,是首个自主运用工具的深度思考模型。作为能力更全面的深度思考模型,文心大模型X1兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。
文心大模型X1能力的全面提升,得益于这些关键技术的支撑:
递进式强化学习训练方法:创新性地应用递进式强化学习方法,在创作、搜索、工具调用、推理等场景全面提升模型的综合应用能力;
基于思维链和行动链的端到端训练:针对深度搜索、工具调用等场景,根据结果反馈进行端到端的模型训练,显著提升训练效果;
多元统一的奖励系统:建立了统一的奖励系统,融合多种类型的奖励机制,为模型训练提供更加鲁棒的反馈。
技术优势
百度在搜索、人工智能领域深耕20多年。自2010年起开始全面布局人工智能,是全球为数不多、进行全栈布局的人工智能公司。从昆仑芯片、飞桨深度学习平台、文心大模型到应用四层架构中,百度在技术栈的各层都有领先业界的关键自研技术,实现了层与层反馈,端到端优化,大幅提升效率。文心一言新一代大语言模型,位于模型层。
文心一言的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是文心一言未来越来越强大的基础。