当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

3个月前 (03-25)Deepseek最新资讯263

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek“引燃”金融圈!券商、基金经理发声

DeepSeek“引燃”金融圈!券商、基金经理发声

记者获悉,近日,民生证券研究院内部下发通知,宣布将全面深化人工智能平台DeepSeek在研究业务中的融合应用,加速构建智能化研究体系。此外,国联民生将于2月27日至28日举办首届资本市场论坛,论坛聚焦...

学烧菜、学剪视频,老年居民学用DeepSeek解锁智能生活

学烧菜、学剪视频,老年居民学用DeepSeek解锁智能生活

随着人工智能发展火热,deepseek问世后掀起了一股全民学习的热潮。近日,四平路街道阜新路社区睦邻中心组织开展了专门的教学活动,教老年人如何使用deepseek并普及人工智能知识,助力老年人跨越“数...

DeepSeek-R1使用指南(简版)+1000个DeepSeek神级提示词+3个DeepSeek隐藏玩法等10几份教程指南

DeepSeek-R1使用指南(简版)+1000个DeepSeek神级提示词+3个DeepSeek隐藏玩法等10几份教程指南

 在人工智能飞速发展的当下,DeepSeek 成为不少人工作、学习和生活的得力助手。但对新手来说,初次接触可能会有些摸不着头脑。别担心,今天就为大家带来超详细的 DeepSeek 使用入门攻...

超200亿“弹药”来了!问了DeepSeek,如何更好配置科创板

超200亿“弹药”来了!问了DeepSeek,如何更好配置科创板

近年来,指数投资已经成为最常用的投资配置工具。科创板更是A股指数化投资比例最高的板块。根据上交所数据显示,科创板相关指数产品合计规模超2400亿元,占科创板整体自由流通市值比例为8.3%。开年以来,科...

启明创投创始人:中国创新药的“DeepSeek时刻”

启明创投创始人:中国创新药的“DeepSeek时刻”

中国AI DeepSeek引爆全球,但生物技术领域正在发生一场更为静默的革命。曾经生产仿制药的中国制药公司,现在正崛起成为快速、高效的药物发现领域的全球领导者。近日,资本市场关注到了创新药领域的这场革...

中国电信云南公司:携手DeepSeek赋能数字云南建设再升级

中国电信云南公司:携手DeepSeek赋能数字云南建设再升级

近日,云南多地政务、教育领域迎来智能化升级新突破。中国电信云南公司携手DeepSeek,通过AI大模型本地化部署,在教育教学、基层社会治理、政务服务等领域打造了一批具有示范效应的创新案例,为推动行业数...