当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

2个月前 (02-25)Deepseek最新资讯151

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

教育部部长谈DeepSeek:是教育改革和发展的重大机遇

教育部部长谈DeepSeek:是教育改革和发展的重大机遇

【教育部部长谈DeepSeek:是教育改革和发展的重大机遇】财联社3月5日电,在十四届全国人大三次会议首场“部长通道”上,教育部部长怀进鹏表示,DeepSeek和机器人在最近一段时间引起国内外广泛关注...

科蓝软件:公司已将DeepSeek-R1模型整合至公司的人工智能应用平台-魔聚平台

科蓝软件:公司已将DeepSeek-R1模型整合至公司的人工智能应用平台-魔聚平台

每经AI快讯,有投资者在投资者互动平台提问:请问董秘,公司是否接qudeepseek,有没有接入的计划。科蓝软件(300663.SZ)3月5日在投资者互动平台表示,公司已成功将DeepSeek-R1...

引力传媒:公司已完成DeepSeek-R1的本地化部署

引力传媒:公司已完成DeepSeek-R1的本地化部署

每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是真的已经完成deepseek本地化部署了吗引力传媒(603598.SH)2月24日在投资者互动平台表示,公司已完成DeepSeek-R1的本地化...

DeepSeek,搬进南开课堂!

DeepSeek,搬进南开课堂!

为扎实推进天津市2025年20项民心工程,深入实施“技能强企”行动,加速培育人工智能时代高素质技能人才,日前,南开区AI人工智能培训班在中国北方人才市场保山道园区举办。嘉思特医疗器材(天津)股份有限公...

淮北市人民政府网站完成DeepSeek大模型接入

淮北市人民政府网站完成DeepSeek大模型接入

日前,市人民政府网站完成DeepSeek大模型接入工作,同步梳理并接入全市政府网站群近153万条海量数据。自上线以来,DeepSeek大模型智能问答累计处理各类咨询、办事等业务请求超1.5万件次,政民...

推荐大家阅读这本书:《DeepSeek全攻略 人人需要的AI通识课》

推荐大家阅读这本书:《DeepSeek全攻略 人人需要的AI通识课》

该书以对话问答的形式,将复杂的AI技术概念转化为易于理解的通俗语言,从基础知识到应用实践,从理论讲解到案例分析,深入浅出地介绍了AI技术的核心原理和应用方法,为大家提供了全面的AI通识认知框架。值得一...