当前位置：首页 > TMT > 正文

全面适配！京东云将DeepSeek推理场景性能提升50%

2025-03-04 10:59:01 来源：中华网财经 A+A-

全面适配！京东云将DeepSeek推理场景性能提升50%

在DeepSeek为期五天的“开源周”中，其连续开源的五大核心技术（FlashMLA、DeepEP、DeepGEMM、DualPipe&EPLB、3FS文件系统），惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配，在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化，综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优，在DeepSeek推理场景下性能提升50%。

全面适配五大技术，DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术，Flash MLA通过动态调度GPU的显存与算力资源，解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能，使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍，配合最新的投机推理技术，以极低的显存需求，在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外，针对用于DeepSeek开源的通信库DeepEP，京东云vGPU AI算力平台已全面支持EP模式下的分布式推理，显著提高推理吞吐。通过整合DeepEP作为通信后端，针对机内通信使用NVLink传输数据，机间通信使用NVSHMEM接口走RDMA网络，同时通过灵活的GPU SM数量利用控制，增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率，让大模型真正用起来

针对客户大模型的使用需求，京东云vGPU AI算力平台，为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务，让大模型真正用起来。

在推理性能方面，针对DeepSeek大模型技术特点，京东云通过推理加速与内核驱动级优化，提升单台服务器推理性能50%。

在国产芯片适配方面，京东云已完成从底层算力到大模型和业务应用的全面国产化适配，包括十余家国产化AI算力，确保自主可控。

在数据安全方面，通过机密容器AI全场景密态计算和先进的容器隔离技术，确保模型数据的机密性与完整性，为用户提供金融级安全防护。

目前，在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同，京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek，既满足本地政务业务，又让当地企业不用投入资源，即可通过政务云调用DeepSeek。

(责任编辑：zx0280)

推荐阅读

京东分拆得与失

京东分拆得与失

轰轰烈烈的京东系分拆上市大计，再进一步。

斑马消费 2024-10-10 08:49:03

谁在围攻京东？

谁在围攻京东？

今天上午（11月26日），搜狐发布致歉声明，对其所发布传播的涉及刘强东章泽天的谣言向京东道歉。

华商韬略 2024-11-26 13:50:08

京东物流，格局更大了！

京东物流，格局更大了！

苦练17年，这家企业迎来一个良机！

华商韬略 2024-11-22 11:35:20

京东挖角，美团拔草

京东挖角，美团拔草

2月11日，京东官方公众号“京东黑板报”宣布京东外卖上线，启动“品质食堂餐饮商家”召募。

光子星球 2025-02-13 10:24:05

阿里巴巴、京东、腾讯发布最新财报

阿里巴巴、京东、腾讯发布最新财报

京东集团发布2024年第二季度财报8月15日，京东集团发布2024年第二季度财报，财报显示，二季度京东集团实现营收2914亿元，上半年营收5514亿元；经营利润105亿元

鳌头财经 2024-08-16 15:57:12

物流“拆墙” 阿里京东言和

物流“拆墙” 阿里京东言和

此前水火不容的阿里和京东，在“双11”前夕相互示好。

北京商报 2024-09-27 14:51:30

京东：赚得不多，发得不少

京东：赚得不多，发得不少

投资于人，是最好的投资。

华商韬略 2025-01-07 09:36:48

第七届京东摄影金像奖圆满落幕京东携手相机品牌掀起全民摄影创作热潮

第七届京东摄影金像奖圆满落幕京东携手相机品牌掀起全民摄影创作热潮

11月15日，第七届京东摄影金像奖颁奖典礼在北京举行。

中华网财经 2024-11-15 17:03:55

京东比“干饭人”更需要外卖

京东比“干饭人”更需要外卖

外卖江湖再现“三国演义”？

趣解商业 2025-02-18 10:11:08

京东秒送宣战美团

京东秒送宣战美团

京东出手了，外卖行业真的要大变天了吗？

食业家 2024-09-18 16:28:02

京东11.11购物用户数同比增长超20% 京东采销直播订单量同比增长3.8倍

京东11.11购物用户数同比增长超20% 京东采销直播订单量同比增长3.8倍

截至11月11日23:59，2024年京东11.11购物用户数同比增长超20%，京东采销直播订单量同比增长3.8倍。超17000个品牌成交额同比增长超5倍，超30000个中小商家成交额同比增长超2倍。

中华网财经 2024-11-12 10:34:40

京东一次招了一个“拼多多”

让有梦想的年轻人有实现梦想的地方，需要更多的“京东”站出来。

华商韬略 2024-09-06 10:37:19

多种支付方式刺激“电子年货”消费京东“国补”订单中京东支付占比近5成

多种支付方式刺激“电子年货”消费京东“国补”订单中京东支付占比近5成

随着手机等3C产品“国补”政策落地，叠加春节假期，手机、平板、智能手表等“电子年货”成为今年春节的消费新趋势，点燃了居民的消费热情。

中华网财经 2025-02-13 16:12:01

外卖江湖生变，京东也要加入？

外卖江湖生变，京东也要加入？

外卖江湖，“双雄”争霸。

消费记 2025-02-20 09:04:31

京东金像奖开放日启动：逛京东11.11入手参赛装备、爆款直降千元

京东金像奖开放日启动：逛京东11.11入手参赛装备、爆款直降千元

和京东11.11共同见证“有趣的灵魂”。

中华网财经 2024-10-30 09:50:49

京东物流“智狼”机器人全新发布

京东物流“智狼”机器人全新发布

11月5-8日，2024亚洲国际物流技术与运输系统展览会（CeMAT ASIA）在上海举行。

物流指闻 2024-11-06 09:45:54

京东外卖，只是美团“极速版”？

京东外卖，只是美团“极速版”？

年还没过完，各大市场的战火就已经燃烧起来了。比亚迪全面智驾，挑战全行业；阿里截胡百度，成为苹果AI的合作方；京东也要开始做外卖了。

斑马消费 2025-02-17 10:19:44

低价战略分野：阿里弱化，京东强化

低价战略分野：阿里弱化，京东强化

持续一年多的价格战后，电商平台交出了不同的答卷。

第三只眼看零售 2024-08-30 09:16:05

热门文章

中华网·WAIC 2026丨京东物流亮相WAIC，AI智能体已应用于供应链全链路超千个场景

中华网·WAIC 2026丨京东物流亮相WAIC，AI智能体已应用于供应链全链路超千个场景

中华网·WAIC 2026丨京东 AI 家庭赛道打法：零成本赋能厂商，2026年目标接入千万台智能硬件

中华网·WAIC 2026丨京东 AI 家庭赛道打法：零成本赋能厂商，2026年目标接入千万台智能硬件

中华网·WAIC 2026丨京东的"高质量具身智能数据生意"：约60万人给机器人当老师，两年要采1000万小时

中华网·WAIC 2026丨京东的"高质量具身智能数据生意"：约60万人给机器人当老师，两年要采1000万小时

2.76亿国人受失眠困扰，扬子江药业自研新药法赞雷生片正式上市

2.76亿国人受失眠困扰，扬子江药业自研新药法赞雷生片正式上市

飞天茅台酒年内第二次涨价，i 茅台平台零售价为1639元/瓶

飞天茅台酒年内第二次涨价，i 茅台平台零售价为1639元/瓶

全球首创！澳优攻克羊乳精深加工难关，羊乳CPP原料实现商业化落地

全球首创！澳优攻克羊乳精深加工难关，羊乳CPP原料实现商业化落地

热点排行

友情链接

中国高新网 | 北京商报网 | 蓝鲸财经 |

融媒体

中华网财经公众号

中华网财经头条号

中华网财经公众号

中华网财经公众号

联系方式

中华网新媒体财经频道
互动/投稿邮箱：
finance@zhixun.china.com
网上不良信息举报电话：010-56177181
财经频道联系电话：（010）56176102