财经
当前位置:首页 > TMT > 正文

文心开源模型迎来新成员,ERNIE-4.5-21B-A3B-Thinking正式开源

文丨罗曾

9月9日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型联合承办的WAVE SUMMIT 深度学习开发者大会2025在京举行。会上,百度发布文心大模型X1.1,并公布文心和飞桨的一系列技术、产品、生态最新成果。

文心X1.1模型多项能力提升,百度AI加速赋能企业、公益与科普生态

会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布文心大模型X1.1深度思考模型,该模型在事实性、指令遵循和智能体等多项能力上有显著提升,目前已通过文心一言官网、文小言APP对用户开放,并正式上线百度智能云千帆平台,全面面向企业客户和开发者提供服务。

百度首席技术官、深度学习技术及应用国家工程研究中心主任 王海峰

百度首席技术官、深度学习技术及应用国家工程研究中心主任 王海峰

据王海峰现场介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心大模型X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。同时,在多个权威基准评测中,文心大模型X1.1整体表现超越DeepSeek R1-0528,同时,在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜则现场展示了文心大模型X1.1的实际使用体验,

该模型在处理复杂写作任务时,能够有效结合模型内化知识与联网检索,并深度思考用户需求,从而输出事实准确、逻辑清晰且语言流畅的内容。面对更复杂的长程任务,如在共享单车平台的多类用户问题与情绪识别场景中,X1.1可严格遵循业务流程先后规划、再自主调用工具,并结合用户情绪,短时内解决问题。

大模型能力的扩展和效率的提升,带来了更前瞻、更有想象力的创新应用。以数字人直播为例,超拟真数字人要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动,需要综合运用多种模态AI技术。

基于此,百度研制了剧本驱动多模协同的数字人技术,实现了语言、声音和形象的协调一致。这套技术方案重点包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术,让数字人主播展现出“高情商、强互动、长续航、更专业”的特色。据吴甜介绍,在百度慧播星的应用实践中,数字人直播的线上表现超过了真人。此前,罗永浩数字人直播首秀GMV突破行业新纪录,部分核心品类带货量超过真人直播。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任 吴甜

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任 吴甜

值得一提的是,面向老年群体,百度文心大模型与中国老龄事业发展基金会联合发起“AI助老公益计划”,通过智能体、AI应用、AI公益志愿活动等举措,帮助老年人适应数字社会。目前,“AI助老智能体”已正式上线,可在百度搜索“AI助老智能体”或打开小度智能健康屏。

在数据生态方面,“文心导师”团队中10年以上行业专家占比48%,专业技术及教职人员占比41%。百度同时发布了“文心导师·星耀计划”,该计划将依托飞桨文心生态资源,联合行业专家共同推进AI发展。

此外,中国科技馆联合百度发布“首个科技馆智能体矩阵”,聚合28家科技馆的科普数据资源,并吸引340名开发者参与建设,助力全国科技馆体系智能化升级。在我国首个法定全国科普月启幕之际,双方还启动了“未来之翼科普共创计划”,在科普月期间正式推行。

飞桨框架v3.2发布,ERNIE-4.5-21B-A3B-Thinking模型开源

文心大模型的持续快速进化,得益于百度在芯片、框架、模型和应用上的全栈布局,尤其是飞桨深度学习框架和文心大模型的联合优化。据最新数据披露,飞桨文心生态开发者达到2333万,服务企业达到76万家。

在此背景下,百度AI技术生态总经理马艳军正式对外发布飞桨(PaddlePaddle)框架v3.2,以及文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy和两大AI科学计算套件PaddleCFD、PaddleMaterials,全面降低大模型从训练到部署的应用门槛。依托计算优化、并行策略和原生容错能力三大核心升级,飞桨框架v3.2突破大模型训练技术难题,显著提升了训练效率,在ERNIE-4.5-300B-A47B模型上实现预训练MFU达47%。同时,该版本强化了类CUDA芯片适配能力,实现了最高92%的算子内核复用率,并全面兼容Safetensors权重及生态加速库一键接入,显著降低部署成本。

百度AI技术生态总经理 马艳军

百度AI技术生态总经理 马艳军

在推理部署侧,大模型高效部署套件FastDeploy通过模型压缩、推理和服务协同优化,显著提升端到端推理性能。基于该套件,ERNIE-4.5-300B-A47B模型在TPOT 50ms时延条件下,实现了输入57K tokens/秒、输出29K tokens/秒的高吞吐性能。

面向科研领域,PaddleCFD和PaddleMaterials两大AI科学计算开发套件能够有效提升流体力学和材料科学领域的研发效率,缩短科研周期,并提升任务精度。

大会现场,百度开源了最新思考模型ERNIE-4.5-21B-A3B-Thinking,该模型是在ERNIE-4.5-21B-A3B基础上训练的深度思考模型,在内容创作、逻辑推理、数学计算、代码生成与工具调用等多个任务中表现优异。此外,ERNIEKit文心大模型开发套件提供了更加便捷的模型后训练方案,仅需4张GPU即可对ERNIE-4.5-300B-A47B模型进行高效调优,进一步降低开发者将模型落地到实际应用的门槛;开源了大规模计算图数据集GraphNet,提供了超2700个模型计算图及标准化评测体系,填补了AI编译器测试基准的空白,助力优化设计与性能提升。

不仅如此,百度智能代码助手文心快码全新升级至3.5S(Super Synergistic AgentS)版本,强化多智能体自协同能力,实现“一人即团队”开发新模式。

百度副总裁 陈洋

百度副总裁 陈洋

据百度副总裁陈洋介绍,文心快码3.5S版本从三方面进行了升级。首先,智能体能力更强,能懂业务,会分解任务列表,执行更准;其次,从单智能体到多智能体协同,动态生成多个智能体,自主协同一起解决复杂任务;最后,团队协作更强,基于Rules与MCP构建统一的经验库,实现团队知识传承。

现场数据显示,文心快码目前已服务超过1000万的开发者。在百度内部,整体新增代码中已经有45%由AI生成,其中前10%的Agent用户,AI完成的部分甚至超过了75%。

(责任编辑:zx0280)

推荐阅读

DeepSeek,灵魂三问

DeepSeek,灵魂三问

没有什么技术能像大语言模型一般,能在破圈之后如此迅速地接入各行各业。

动脉网 2025-02-28 10:56:47
DeepSeek播种,阿里云“收割”?

DeepSeek播种,阿里云“收割”?

DeepSeek冲击影响下,云和AI正在成为重估阿里的标尺。

光子星球 2025-02-24 10:01:44
OpenAI打小报告,要求禁用DeepSeek

OpenAI打小报告,要求禁用DeepSeek

针对DeepSeek的全球风暴。

锌财经 2025-03-18 11:01:36
政务DeepSeek一体机,就得这么选

政务DeepSeek一体机,就得这么选

近日,各级地方政府接入DeepSeek向民众提供政务服务成为热潮。

中华网财经 2025-03-11 14:19:23
英伟达“扛住”DeepSeek冲击了吗

英伟达“扛住”DeepSeek冲击了吗

营收393.3亿美元、净利润220.66亿美元、毛利率73%……凭借多个超预期表现,AI龙头英伟达在DeepSeek冲击之下再次给投资者吃下一颗定心丸。

北京商报 2025-02-28 14:09:12
DeepSeek,为互联网医疗指了条新出路

DeepSeek,为互联网医疗指了条新出路

DeepSeek的热度仍在延续,深度推理模型、深度思考模式充分展现出较长思维链的优势。

动脉网 2025-02-25 10:16:48
大厂「AI」智能体,等待 DeepSeek 时刻

大厂「AI」智能体,等待 DeepSeek 时刻

DeepSeek 加速了 Agent 的普及,但深入场景还要再来一把火。

蓝洞商业 2025-07-31 14:25:31
孵化 DeepSeek 的量化交易:一个数据驱动的隐秘世界

孵化 DeepSeek 的量化交易:一个数据驱动的隐秘世界

从十万次交易到千亿参数的 AI 进化。

晚点LatePost 2025-03-11 10:26:57
从DeepSeek到Manus,AI为啥又开始混战了?

从DeepSeek到Manus,AI为啥又开始混战了?

DeepSeek出现了逆袭的现象,直到最近Manus的出现再度引发了市场的动荡,为什么AI又开始混战了?

江瀚视野观察 2025-03-10 09:48:41
DeepSeek大火让腾讯成了最大赢家,为啥是鹅厂?

DeepSeek大火让腾讯成了最大赢家,为啥是鹅厂?

让人没想到的是DeepSeek的大潮之中受益最多的不是那些在AI大模型领域的先行者们,而是AI相对落后的腾讯,鹅厂成为最大的赢家,这到底是怎么回事?

江瀚视野观察 2025-03-03 09:44:16
所有人都在接入DeepSeek,自研大模型还有必要吗?

所有人都在接入DeepSeek,自研大模型还有必要吗?

面对着DeepSeek的席卷之势,让人不禁想问自研大模型还有必要吗?

江瀚视野观察 2025-03-24 09:41:35
车企扎堆接入DeepSeek,概念狂欢还是认知革命?

车企扎堆接入DeepSeek,概念狂欢还是认知革命?

DeepSeek“上车”关键是看应用的领域,数据是否有效和丰富,场景对输出错误的容忍度。

钛媒体 2025-03-03 14:02:08
DeepSeek已植入90家大三甲,医院在用AI干什么活?

DeepSeek已植入90家大三甲,医院在用AI干什么活?

从企业到院端,医药圈彻底被DeepSeek“引爆”了。

健识局 2025-02-25 09:43:06
比DeepSeek R2先发!阿里巴巴Qwen3登顶全球最强开源模型

比DeepSeek R2先发!阿里巴巴Qwen3登顶全球最强开源模型

Qwen3千呼万唤始出来,直接登顶全球最强开源模型。

钛媒体 2025-04-29 14:22:56
日赚346万,利润率545%,DeepSeek率先打通商业闭环

日赚346万,利润率545%,DeepSeek率先打通商业闭环

谁也想不到,一直以“开源”和“免费”为核心的DeepSeek,居然是第一个打通商业闭环的AI大模型。

锌财经 2025-03-04 11:06:11
DeepSeek点燃AI革命,中国药企迎数智化新机遇

DeepSeek点燃AI革命,中国药企迎数智化新机遇

眼下,AI迭代正从通用领域向垂直行业加速渗透。

动脉网 2025-03-20 09:11:21
清华学霸创办的智谱,估值200亿,却被DeepSeek抢了风头?

清华学霸创办的智谱,估值200亿,却被DeepSeek抢了风头?

“AI六小虎”陷生存危机,智谱AI如何破局?

华尔街科技眼 2025-03-12 09:41:18
全面适配!京东云将DeepSeek推理场景性能提升50%

全面适配!京东云将DeepSeek推理场景性能提升50%

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

中华网财经 2025-03-04 10:59:01

联系方式

中华网新媒体 财经频道
互动/投稿邮箱:
finance@zhixun.china.com
网上不良信息举报电话:010-56177181
财经频道联系电话:(010)56176102