当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

2个月前 (03-03)Deepseek最新资讯145

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

深圳大学与腾讯云达成合作 推出DeepSeek相关课程

深圳大学与腾讯云达成合作 推出DeepSeek相关课程

每经快讯,据深圳大学微信公众号2月17日消息,深圳大学大数据系统计算技术国家工程实验室近日与腾讯云达成合作,共同推出基于DeepSeek的人工智能通识课程。深大学生本学期即可选课学习。课程内容将涵盖人...

宁夏完成DeepSeek医疗大模型全域医疗专网+本地化部署

宁夏完成DeepSeek医疗大模型全域医疗专网+本地化部署

3月3日,记者从自治区卫生健康委员会获悉,宁夏81家二级以上公立医院全部接入宁夏卫生健康委员会本地部署DeepSeek国产医疗大模型,本着“全域、赋能、提质、增效、安全”原则,实现在政务云医疗云专区部...

DeepSeek助攻年轻人的口腔护理,一刷一含一漱健康从“齿”开始

DeepSeek助攻年轻人的口腔护理,一刷一含一漱健康从“齿”开始

你是不是也有这样的困扰:早上刷牙时牙龈出血,喝冰咖啡时牙齿敏感,吃完火锅后口腔异味挥之不去……别急,这些问题,DeepSeek用大数据告诉你:90%的年轻人都中招了!但好消息是,解决这些问题其实很简单...

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利

普通人如何抓住deepseek红利?要抓住DeepSeek这类AI技术公司的红利,普通人可以从以下几个方向切入,结合自身资源和能力选择最适合的路径:一、成为技术应用的早期参与者抢先体验产品注册成为De...

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

湖北日报讯(记者文俊、通讯员门玉英、丁迪、实习生朱诗果)3月11日,DeepSeek在湖北省科技信息研究院正式上线运行。记者获悉,在省科技厅指导下,该院在全国范围内率先完成基于DeepSeek的区域性...

零一万物打算用DeepSeek赚钱了

零一万物打算用DeepSeek赚钱了

花费更多GPU和资源烧万亿参数大模型,还是做一个可以赚钱的商业公司,零一万物选择了后者,也因此成为“AI六小虎”中最早转向的公司。如今,零一万物朝着这一目标加速前进。3月17日,零一万物举办了一场线上...