当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯198

新京报贝壳财经讯（记者罗亦丹）北京时间2月24日上午，DeepSeek发布了其“开源周”的第一项成果：FlashMLA（直译为快速多头潜在注意力机制）的代码。

据了解，MLA（多头潜在注意力机制）正是DeepSeek降低大模型成本使用的关键技术之一，其可以显著减少大模型训练和推理过程中的内存占用，而FlashMLA则是针对Hopper GPU（一种英伟达GPU架构）开发的高效MLA解码内核，其针对可变长度序列进行了优化，目前已投入了生产，其可以使得H800达到3000GB/s内存，实现580TFLOPS（每秒浮点运算次数）计算性能。

贝壳财经记者注意到，根据此前DeepSeek发布V3大模型时公开的技术文档，该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称，FlashMLA能在不损失模型性能的前提下，将缓存体积压缩至原来的1/4，从而大幅降低显存需求。例如，原始需要存储的100GB中间结果，压缩后仅需25GB，通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及，AI推理有望进入千元级硬件跑百亿模型的时代。

标签: DeepSeek 人工智能大数据数据分析

返回列表

上一篇：与DeepSeek思路同源商汤绝影发布R-UniAD端到端智能驾驶技术路线

下一篇：广东全省推进DeepSeek部署，开启AI智能服务新篇章！

“DeepSeek发布开源周首个成果可优化英伟达GPU效率” 的相关文章

DeepSeek发布开源周首个成果可优化英伟达GPU效率

“DeepSeek发布开源周首个成果可优化英伟达GPU效率” 的相关文章

与DeepSeek思路同源商汤绝影发布R-UniAD端到端智能驾驶技术路线

从算力底座到生态繁荣昇腾如何为江苏AI新纪元铺路？

直击股东大会｜麒麟信安：2025年国防业务发展有所加快，希望利用DeepSeek一体机打开市场

当湖北移动遇见DeepSeek，荆楚大地掀起智能新浪潮

深入了解DeepSeek：探索未来科技的无限潜力

积极拥抱AI技术，广东博众接入DeepSeek大模型

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

​与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

从算力底座到生态繁荣 昇腾如何为江苏AI新纪元铺路？

直击股东大会｜麒麟信安：2025年国防业务发展有所加快，希望利用DeepSeek一体机打开市场

当湖北移动遇见DeepSeek，荆楚大地掀起智能新浪潮

深入了解DeepSeek：探索未来科技的无限潜力

积极拥抱AI技术，广东博众接入DeepSeek大模型

Powered By Z-BlogPHP. Theme by TOYEAN.

DeepSeek发布开源周首个成果可优化英伟达GPU效率

“DeepSeek发布开源周首个成果可优化英伟达GPU效率” 的相关文章

与DeepSeek思路同源商汤绝影发布R-UniAD端到端智能驾驶技术路线

从算力底座到生态繁荣昇腾如何为江苏AI新纪元铺路？