当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-24)Deepseek最新资讯127

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

拥抱人工智能,岳阳县数据局开展DeepSeek应用培训

拥抱人工智能,岳阳县数据局开展DeepSeek应用培训

华声在线4月2日讯(通讯员 续鼎)为深化数字技术应用,全面提升干部对人工智能大模型DeepSeek的认知与应用能力,4月2日,岳阳县数据局组织机关全体干部职工进行DeepSeek人工智能技术与应用探索...

传音控股:传音控股旗下Infinix、TECNO品牌已接入DeepSeek

传音控股:传音控股旗下Infinix、TECNO品牌已接入DeepSeek

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...

从DeepSeek的成功经验看原始创新的重要性

从DeepSeek的成功经验看原始创新的重要性

在当今快速发展的科技领域,创新已成为推动进步的核心动力,企业生存和发展的关键。在众多创新类型中,原始创新因其独特性和突破性而备受关注。原始创新不仅能够带来技术上的重大突破,还能为企业创造持久的竞争优势...

专访学而思CTO田密:接入DeepSeek改变的不只是产品

专访学而思CTO田密:接入DeepSeek改变的不只是产品

开源的DeepSeek大模型火了,在线教育行业也因此卷起千层浪花。近期,学而思、网易有道、中公教育、猿辅导、作业帮等头部企业密集宣布接入DeepSeek大模型,这引发了业界广泛关注。DeepSeek为...

信安世纪:已完成包括DeepSeek在内的主流大模型本地化部署

信安世纪:已完成包括DeepSeek在内的主流大模型本地化部署

每经AI快讯,信安世纪(688201)2月28日在互动平台表示,公司已经完成包括DeepSeek在内的主流大模型本地化部署,正在进行相关产品的对接接入工作,今年暂无推出DeepSeek一体机计划。...

爆火的DeepSeek,普通人怎么用?一看就会→

爆火的DeepSeek,普通人怎么用?一看就会→

近日国产AI DeepSeek在中国、美国的科技圈受到广泛关注还被称为“神秘的东方力量”DeepSeek超越了ChatGPT,登顶苹果手机应用商店美国区免费应用榜单。它的访问使用量急速上升,已经成为目...