当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯138

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

长虹美菱:公司冰箱、空调产品已接入DeepSeek

长虹美菱:公司冰箱、空调产品已接入DeepSeek

 证券日报网讯 长虹美菱4月9日在互动平台回答投资者提问时表示,公司冰箱、空调产品已接入DeepSeek,公司通过接入DeepSeek赋能公司产品,让消费者感受更好的产品体验。(编辑 王雪儿)...

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

印度力图打造“本土DeepSeek”,分析师:你们不敢创新

凤凰网科技讯 4月16日,金融时报发文,印度正押注于“低成本创新”的传统以及其庞大的科技人才库,以求在全球AI竞赛中迎头赶上,同时在这个快速发展的行业中分得一杯羹。印度总理纳伦德拉・莫迪领导的政府认为...

安徽率先落地DeepSeek满血版,打造“人工智能+政务服务”样板

安徽率先落地DeepSeek满血版,打造“人工智能+政务服务”样板

日前,安徽省率先在全国省级层面完成DeepSeek满血版(671B)本地化部署,推出无差别综窗、公文写作、语音转文字等16个典型应用,并在全省试用推广。“我们已在‘皖政通’推出‘语音转文字’应用,利用...

DeepSeek:如何把留学花的300万赚回来

DeepSeek:如何把留学花的300万赚回来

在当今全球化的时代,越来越多的中国家庭选择将孩子送出国留学,希望通过优质的教育资源为孩子铺就一条通往成功的道路。然而,留学费用动辄数百万元,尤其是对于普通家庭来说,这无疑是一笔巨大的投资。面对300万...

4天赚了20万元!DeepSeek 掀起“淘金热”,有人已赚到第一桶金

4天赚了20万元!DeepSeek 掀起“淘金热”,有人已赚到第一桶金

春节以来,国产AI大模型DeepSeek以更创新的算法和架构,表现出更低成本、更优效能和更广泛的应用场景迅速火爆全球。它的强大也在不断凸显——不仅在于功能,更在于它让曾经遥不可及的AI技术,真正走进了...

“云上加速,智启未来”——DeepSeek赋能开启磁县智慧政务新纪元

“云上加速,智启未来”——DeepSeek赋能开启磁县智慧政务新纪元

转自:邯郸新闻网DeepSeek作为一款国产AI大模型,自发布以来便以其强大的语言处理能力和卓越的知识推理能力,在众多行业领域展现出了广泛的应用前景。近日,邯郸联通与磁县行政审批局成功合作骨干云与De...