当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

4个月前 (02-24)Deepseek最新资讯227

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

信阳市审计局举办DeepSeek专题大数据审计论坛

信阳市审计局举办DeepSeek专题大数据审计论坛

为深入践行科技强审理念,推动审计工作提质增效,2月20日,市审计局举办以人工智能为主题的大数据审计论坛,探讨人工智能技术在审计领域的最新进展及其实际应用。  该局三名年轻大数据审计能手潜心研究、精心准...

车企扎堆接入DeepSeek,概念狂欢还是认知革命?|钛度车库

车企扎堆接入DeepSeek,概念狂欢还是认知革命?|钛度车库

原创 韩敬娴 钛媒体▎DeepSeek“上车”关键是看应用的领域,数据是否有效和丰富,场景对输出错误的容忍度。作者|韩敬娴编辑|李玉鹏本文首发于钛媒体APP技术革命的浪潮正加速席卷汽车行业。春节过后,...

托普云农(301556)已接入deepseek

托普云农(301556)已接入deepseek

 同花顺(300033)金融研究中心03月24日讯,有投资者向托普云农(301556)提问, 请问公司是否接入deepseek?  公司回答表示,您好!我司已接入。此次接入对公司业绩无直接影响,截止目...

EasyStack+DeepSeek渐进式构建可进化的AI基础设施

EasyStack+DeepSeek渐进式构建可进化的AI基础设施

当大模型从技术奇点向产业纵深演进,企业正面临AI基础设施的多重挑战:既要通过私有化部署满足数据隐私和安全需求,又要承载百亿、千亿参数规模的澎湃算力;既要应对动态演进的业务需求,又要平衡基础设施的投入成...

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”

【消息称DeepSeek-R2或下周发布 官方暂无回应】财联社3月11日电,有消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于下周一(3月17日)正式发布。截至目前,DeepSee...

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

董明珠:将基于 DeepSeek 等打造格力智能家居垂类大模型

IT之家 3 月 10 日消息,据证券日报昨日晚间报道,格力董明珠透露:“格力电器已成功将自有的多模型框架与 DeepSeek R1 满血版大模型深度融合。”“例如,这一合作成果已经体现在格力电器的语...