当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

2个月前 (02-24)Deepseek最新资讯151

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

DeepSeek实战技巧:最强使用攻略,100个精品提示词

DeepSeek实战技巧:最强使用攻略,100个精品提示词

掌握 DeepSeek 这招,1000 神级提示词带你秒变 AI 高手想成为 AI 领域的佼佼者吗?这里有一份 DeepSeek 实战技巧大礼包!涵盖从新手入门到高手进阶的全方位教程,揭秘 99% 的...

一周两场,场场火爆!Deepseek+数字人营销训练营吸引百余位青岛企业家参加:必须学会新武器

一周两场,场场火爆!Deepseek+数字人营销训练营吸引百余位青岛企业家参加:必须学会新武器

面对人力成本攀升、爆款内容稀缺、矩阵账号管理低效等难题,AI已成为企业降本增效的“救命稻草”。4月17日-18日,由半岛都市报风口财经联合青岛市女企业家协会、青岛市时装设计师协会、小冰华北运营中心举办...

用deepseek写材料,6个公式解决你所有使用场景

用deepseek写材料,6个公式解决你所有使用场景

为什么总是感觉deepseek不好用呢,明明已经收藏了很多提示词啊,说的是不是屏幕前的你?其实啊,deepseek的推理模式真的很强大,当你掌握了基础公式,借助好公式模版,你就能写出最符合自己现实需求...

科大讯飞:目前公司与DeepSeek无股权关系

科大讯飞:目前公司与DeepSeek无股权关系

新京报贝壳财经讯 2月15日,针对有消息称20家车企已引入DeepSeek,科大讯飞在互动平台表示,在智能汽车领域,科大讯飞将持续融合集成行业最新相关技术,通过与星火大模型融合协作,为用户提供更加智能...

著名作家邱华栋评价DeepSeek:“写作还处在中等偏下水平”

著名作家邱华栋评价DeepSeek:“写作还处在中等偏下水平”

(来源:大江网-江南都市报 )“我认为DeepSeek的写作还处在中等偏下水平……”3月15日,中国作协副主席、著名作家邱华栋登上南昌市图书馆“豫章讲坛”,为南昌读者带来了“写作的长路没有尽头”的主题...

电信运营商接入DeepSeek影响几何?

电信运营商接入DeepSeek影响几何?

中新网北京2月28日电 (记者 刘育英)中国三家电信运营商已全面接入DeepSeek,给运营商充分利用自身算力,加快赋能千行百业数智化转型,改善自身业绩带来机遇。至2月初,中国电信旗下天翼云“息壤”已...