当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯198

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

​与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

​与DeepSeek思路同源 商汤绝影发布R-UniAD端到端智能驾驶技术路线

经济观察网 周信/文 2025年2月22日,在“2025全球开发者先锋大会(GDC)”的商汤大模型生产力论坛上,商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚发布了行业首个“与世界模型...

从算力底座到生态繁荣 昇腾如何为江苏AI新纪元铺路?

从算力底座到生态繁荣 昇腾如何为江苏AI新纪元铺路?

 从数智赋能公共服务水平提升,到大模型本地部署打造数智员工,再到AI+警务、AI+医疗、AI+办公等行业应用释放新质生产力……  在前不久的“激发新质动能 智绘江苏蓝图”主题媒体探营暨“昇腾新动力 D...

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

直击股东大会|麒麟信安:2025年国防业务发展有所加快,希望利用DeepSeek一体机打开市场

5月21日下午,麒麟信安召开2024年年度股东大会,包括公司总经理、董秘等在内的高管参加并与投资者现场交流。据悉,麒麟信安2024年实现企稳回升,全年实现营业收入2.86亿元,同比增长75.24%;归...

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

当湖北移动遇见DeepSeek,荆楚大地掀起智能新浪潮

"九省通衢"的湖北,正在数智化浪潮中全速前进!当湖北移动的优质网络遇上DeepSeek的前沿AI,会擦出怎样的火花?今天,带您体验「5G+AI」的双重惊喜!01应用场景1政务+AI...

深入了解DeepSeek:探索未来科技的无限潜力

深入了解DeepSeek:探索未来科技的无限潜力

标题:深入了解DeepSeek:探索未来科技的无限潜力关键词:DeepSeek,人工智能,智能搜索,数据分析,技术革新,应用场景描述:深入解析DeepSeek的含义与应用,了解它如何革新行业和改善日常...

积极拥抱AI技术,广东博众接入DeepSeek大模型

积极拥抱AI技术,广东博众接入DeepSeek大模型

近年来,人工智能已成为推动各行业变革的核心力量。从金融领域的智能投顾到医疗行业的疾病诊断,从教育行业的个性化学习到交通领域的自动驾驶,AI技术正以前所未有的速度重塑着我们的生活和工作方式。在这场技术革...