当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

3个月前 (03-19)Deepseek应用场景186

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

信阳市审计局举办DeepSeek专题大数据审计论坛

信阳市审计局举办DeepSeek专题大数据审计论坛

为深入践行科技强审理念,推动审计工作提质增效,2月20日,市审计局举办以人工智能为主题的大数据审计论坛,探讨人工智能技术在审计领域的最新进展及其实际应用。  该局三名年轻大数据审计能手潜心研究、精心准...

Deepseek的算法创新主要体现在哪些方面

Deepseek的算法创新主要体现在哪些方面

DeepSeek的算法创新主要体现在以下几个方面:一、创新的架构设计混合专家架构(MoE):DeepSeek采用了细粒度专家分配策略,每个MoE层包含1个共享专家和多个路由专家(如256个)。通过动态...

东方国信推出新一代满血版“幕僚DeepSeek一体机”

东方国信推出新一代满血版“幕僚DeepSeek一体机”

人民财讯3月10日电,东方国信发文称,公司充分发挥自身在算力基础设施、行业大数据积累及垂直大模型领域的核心优势,重磅推出新一代满血版“幕僚DeepSeek一体机”。...

DeepSeek接入个人知识,回答速度飞快,确实可以封神了!

DeepSeek接入个人知识,回答速度飞快,确实可以封神了!

DeepSeek-R1正在引起越来越多人的关注,近来收到很多读者后台留言,虽然无法逐一作答,但是大家的问题我都阅读了。总结来看,大家普遍关心三类DeepSeek接入个人知识的相关问题:1)DeepSe...

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

1200行代码逆袭!DeepSeek工程师开源轻量级vLLM,吞吐量逼近原版

机器之心报道机器之心编辑部开源社区的人应该对 vLLM 不陌生,它是一个由加州大学伯克利分校团队开发的高性能、开源 LLM 推理和服务引擎,核心目标是提升 LLM 的推理速度(吞吐量)和资源利用率(尤...

DeepSeek开放平台使用指南:开启智能服务新纪元

DeepSeek开放平台使用指南:开启智能服务新纪元

DeepSeek开放平台使用指南:开启智能服务新纪元一、引言在数字化转型的大潮中,企业对于高效、智能的解决方案需求日益增长。DeepSeek开放平台作为一款功能强大的人工智能工具,凭借其灵活的API接...