当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

2个月前 (02-24)Deepseek最新资讯130

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

“博惠办”DeepSeek智能服务正式上线!

“博惠办”DeepSeek智能服务正式上线!

当“国产AI之光”DeepSeek接入政务服务,将会带来怎样的加速度?博山区行政审批服务局将AI大模型技术运用于政务服务智能问答场景,推出“博惠办”DeepSeek智能政服,为企业群众提供智能化、便捷...

AI手机迎来“DeepSeek时刻”?

AI手机迎来“DeepSeek时刻”?

2025年将是AI商业化落地元年,智能手机行业的争夺战尤其激烈。苹果CEO库克曾表示,在已开放使用Apple Intelligence技术的国家内,iPhone 16系列销量更高。而iPhone 16...

首台全国产化部署DeepSeek一体机,无锡造!

首台全国产化部署DeepSeek一体机,无锡造!

“写一篇关于申威平台完成DeepSeek适配的报道。”眨眼间,一篇关于申威平台与DeepSeek共同打造国产AI新生态的文稿就出现在屏幕上,从适配的意义、技术细节、应用场景、未来计划等各个方面阐述中国...

2025年AI入门指南,从DeepSeek到AI智能体

2025年AI入门指南,从DeepSeek到AI智能体

DeepSeek火爆,AI学习的热潮也吹到了我们公司,上周给公司的同事做了一期关于AI入门的分享,感觉内容非常适合小白入门了解AI,于是整理成公众号文章,作为我AI入门科普的总集和收尾,后面会更专注写...

当DeepSeek链接杨浦高中的创新实验室,“指数级”变化让人惊叹

当DeepSeek链接杨浦高中的创新实验室,“指数级”变化让人惊叹

“飞机飞行的原理是什么?”在同济大学第一附属中学高一年级“创意飞行器”的课堂上,学生桑田雨用Pad提出问题,立刻收到了即时的回复:“飞机飞行的原理主要基于四个力的相互作用:升力、重力、推力和阻力。这些...

Deepseek对百度搜索的冲击有多大?

Deepseek对百度搜索的冲击有多大?

纯从技术出发,Deepseek并没有远胜于国内字节豆包,阿里通义和腾讯元宝,或者微软必应集成的ChatGPT,先行用上AI的这波人本身就不会用百度,但这波国家带动的热度炒作让更多普通人用上新一代的人工...