飞桨是中国首个自主研发、功能丰富、开源开放的深度学习平台。飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。飞桨助力开发者快速实现 AI 想法,创新 AI 应用,作为基础平台支撑越来越多行业实现产业智能化升级。
01 产品介绍
飞桨致力于人工智能的技术创新和大规模产业化,系统地建立了产业级深度学习开发、训练和部署全流程技术体系。主要领先技术如下:
开发便捷的深度学习框架。飞桨深度学习框架基于编程一致的深度学习计算抽象以及对应的前后端设计,拥有易学易用的前端编程界面和统一高效的内部核心架构,对普通开发者而言更容易上手并具备领先的训练性能。飞桨自然完备兼容命令式和声明式两种编程范式,是业内首个实现动静统一的深度学习框架,开发者默认使用动态图编程调试,一行代码即可转静态图训练部署。飞桨框架还提供了低代码开发的高层 API, 并且高层 API 和基础 API 采用了一体化设计,两者可以互相配合使用,做到高低融合,兼顾开发的便捷性和灵活性。
超大规模深度学习模型训练技术。飞桨突破了超大规模深度学习模型训练技术,率先实现了千亿稀疏特征、万亿参数、数百节点并行训练的能力,解决了超大规模深度学习模型的在线学习和部署难题。此外, 飞桨还覆盖支持包括模型并行、流水线并行在内的广泛并行模式和加速策略,推出业内首个通用异构参数服务器架构、4D 混合并行策略和端到端自适应分布式训练技术,引领大规模分布式训练技术的发展趋势。
多端多平台部署的高性能推理引擎。飞桨对推理部署提供全方位支持,可以将模型便捷地部署到云端、边缘端和设备端等不同平台上,结合训推一体的优势,让开发者拥有一次训练、随处部署的体验;飞桨从硬件接入、调度执行、高性能计算和模型压缩四个维度持续对推理功能深度优化,整体性能领先;在硬件接入方面,飞桨拥有硬件统一适配方案,携手各大硬件厂商软硬一体协同优化,大幅降低硬件厂商的对接成本,并带来领先的开发体验,特别是对国产硬件做到了广泛的适配。
产业级开源模型库。飞桨建设了大规模官方模型库,算法总数超过 700 个,包含领先的预训练模型、深度学习开发者经过产业实践长期打磨的主流模型以及在国际竞赛中的夺冠模型;提供面向语义理解、图像分类、目标检测、图像分割、文字识别(OCR)、语音合成等场景的多个端到端开发套件,满足企业低成本开发和快速集成的需求,助力快速产业应用。飞桨模型库是基于丰富产业实践打造的产业级模型库,服务企业遍布能源、金融、工业、农业等多个行业。其中产业级知识增强的文心大模型,已经形成涵盖基础大模型、任务大模型和行业大模型的三级体系。
发展历程
2021年12月,开源框架v2.2发布
主要端到端开发套件
飞桨文字识别开发套件PaddleOCR,旨在打造一套丰富、领先、且实用的OCR工具库,开源了以超轻量模型PP-OCRv3为代表的PP-OCR系列文本检测识别模型——支持中英文、纯英文、德法日韩等80多种多语言文本识别;以及PP-Structure文档分析系统,支持版面分析、表格识别、关键信息提取、命名实体识别等任务。打通22种训练部署软硬件环境与方式,覆盖企业90%的训练部署环境需求。同时开源文本风格数据合成工具Style-Text和半自动文本图像标注工具PPOCRLabel,已经成为全球知名的OCR开源项目。
飞桨图像识别套件 PaddleClas 是面向工业界和学术界的一个图像识别和图像分类任务的工具集,助力开发者训练出更好的视觉模型,并实现高效应用落地。同时 PaddleClas 集成了大量主流和前沿的计算机视觉骨干网络模型,支持下游视觉算法研发,提升模型效果。
飞桨目标检测开发套件PaddleDetection,内置30多个模型算法及250多个预训练模型,覆盖目标检测、实例分割、跟踪、关键点检测等方向,其中包括服务器端和移动端产业级SOTA模型、冠军方案和学术前沿算法,并提供配置化的网络模块组件、十余种数据增强策略和损失函数等高阶优化支持和多种部署方案;在打通数据处理、模型开发、训练、压缩、部署全流程的基础上,提供丰富的案例及教程,加速算法产业落地应用。
飞桨图像分割套件PaddleSeg,覆盖了包括MaskFormer、OCRNet、RTFormer、TopFormer在内的大量高精度和轻量级优质分割模型,全面覆盖不同需求方向。通过模块化的设计,提供了配置化驱动和API调用两种应用方式,帮助开发者更便捷地完成从训练到部署的全流程图像分割应用。
飞桨生成对抗网络开发套件PaddleGAN,提供图像生成、风格迁移、超分辨率、影像上色、人脸属性编辑、人脸融合、动作迁移等前沿算法 ,其模块化设计,便于开发者进行二次研发 ,同时提供30多个预训练模型,助力开发者快速开发丰富的应用。
主要工具与组件
飞桨深度强化学习框架PARL,夺得NeurIPS强化学习挑战赛 三连冠。具有高灵活性、可扩展性和高性能的特点,可支持 实现数千台CPU和GPU的高性能并行,实现了数十种主流强 化学习算法的示例,覆盖了从单智能体到多智能体,离散决策到连续控制,离线学习到在线学习等多样化的强化学习支 持。此外,飞桨还发布了业界首个通用元智能体训练环境 MetaGym,提升算法在不同配置智能体和多种环境中的适应能力,包含四轴飞行器、电梯调度、四足机器狗、3D迷 宫等多个仿真训练环境。
飞桨联邦学习框架PaddleFL,支持轻松复制和比较联邦学习算法,便捷地实现大规模分布式集群部署,并且提供丰富的横向和纵向联邦学习策略及其在计算机视觉、自然语言处理、推荐算法等领域的应用。此外,可以基于全栈开源软件轻松部署。
飞桨图学习框架PGL,业界首个提出通用消息并行传递机制,支持万亿级巨图的工业级图学习框架,覆盖30多个图学习模型,并内置KDDCup2021 PGL 冠军算法。内置分布式图推荐算法套件Graph4Rec 以及高效知识表示套件Graph4KG。历经大量真实工业应用验证,能够灵活、高效地搭建前沿的大规模图算法。
飞桨螺旋桨生物计算平台PaddleHelix,面向小分子创新药、多肽/蛋白药物和mRNA 疫苗设计等场景提供AI能力。在新药研发上,提供基于大规模数据预训练的分子表征和蛋白表征模型,助力分子生成、药物筛选、化合物合成等任务,同时提供从分子生成到药物筛选到全流程pipeline。在疫苗设计上,Linear系列算法相比传统方法效率大幅提升,序列设计可以同时设计考虑MFE和CAI指标,在效果上超过传统方法设计的序列。
飞桨低代码开发工具PaddleX,集成了飞桨开发套件多年积累的模型训练、推理全流程开发的优势能力,聚焦主流AI场景,精选多个不同场景的飞桨优质模型,构建了多条产业级模型产线,包含了多项能力的显著升级,旨在助力企业开发者以低成本、零门槛的方式,有效解决产业中的实际问题。
飞桨模型安全与隐私工具PaddleSleeve,为开发者提供丰富、有效、易用的模型安全及隐私评测及保护能力。该工具融合了业界最前沿的模型攻击测试方法与策略,用于多维度评估模型的安全与隐私性能,并拥有全面灵活的模型增强和防护手段,可广泛用于智能驾驶、人脸认证、内容审核等存在安全需求的应用场景。
飞桨星河社区
AI学习与实训社区,面向教育和学习场景,集开放数据、开源算法、免费算力于一体,为开发者提供高效易用的学习和开发环境、丰富的体系化课程、海量开源实践项目、以及高价值的Al竞赛,并提供教育版支撑高校和机构老师轻松实现Al教学,助力深度学习人才培养。
截至2024年6月,飞桨星河社区上已累计了1000多万开发者,平台累计600多万实训项目,覆盖AIGC、CV、推荐等众多领域;200余个模型覆盖十余个领域方向,支持线上训练、推理、下载;240余个精选应用在线体验,支持多种创建方式;22多万工业级数据集,支持多种上传方式。平台累计拥有超过一万课时精品课程、累计举办400余场AI赛事,每年举办200余场特色社区活动,100余个频道支持实时交流分享,并提供海量算力资源。
02 建设成果
截至2024年6月,飞桨文心生态已凝聚1465万开发者,服务37万家企事业单位,创建95万个模型。
IDC发布的2022年中国深度学习框架和平台市场份额报告显示,百度稳居中国深度学习平台市场综合份额第一。2022年7月,中国信通院最新报告显示,百度飞桨成为中国市场应用规模第一的深度学习框架和支撑平台。报告指出,以飞桨为代表的自主可控全栈平台和生态加速了我国技术普惠与产业赋能,是构建国产化生态体系的重要一环。
开发者生态
企业生态
百度AI技术生态企业生态,依托百度飞桨、文心核心技术及全域生态资源,通过产业赋能和产业人才培养不断降低产业AI使用门槛,助力大中小企业智能化升级。
教育生态
随着大模型技术的突破式进展,人工智能与产业结合愈发深入。产业界对AI人才提出了更高的要求,生成式人工智能也给高校教育改革与人才培养带来了更多机遇与挑战。飞桨在人工智能技术以及行业深入探索,基于来自产业界的真实项目场景、数据、行业经验,沉淀出一套包含实践平台、课程资源、高校服务在内的产教融合人才培养方案。一方面服务高校全校师生人工智能综合素质提升,另一方面,飞桨助力人工智能专业基于大模型的升级、非AI专业的创新与改革,为高校与社会人才培养注入新的活力。
硬件生态
03 荣誉表彰
2020年8月,获2019年度中国电子学会科学技术奖科技进步一等奖。
2020年9月,获2020年服贸会“科技创新服务示范案例”。
2020年12月,获中关村国家自主创新示范区-高精尖产业协同创新平台
2021年1月,获北京市人工智能产业创新应用平台
2021年3月,获2021 年度优秀软件产品
2021年9月,获2021 年全球智博会产品金奖
2022年3月,获2022 年度优秀软件产品