当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

1个月前 (03-25)Deepseek最新资讯157

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek大消息!高管发生变更

DeepSeek大消息!高管发生变更

企查查APP显示,近日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司发生工商变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人,同时经营范围新增互联网信息服务。该公...

云南电信:携手DeepSeek赋能数字云南建设再升级

云南电信:携手DeepSeek赋能数字云南建设再升级

近日,云南多地政务、教育领域迎来智能化升级新突破。中国电信云南公司携手DeepSeek,通过AI大模型本地化部署,在教育教学、基层社会治理、政务服务等领域打造了一批具有示范效应的创新案例,为推动行业数...

观察:有人炒股,有人算命,DeepSeek咋用才能飞起来

观察:有人炒股,有人算命,DeepSeek咋用才能飞起来

春节期间,一款名为DeepSeek的国产AI工具以“技术奇迹”与“社交狂欢”的双重姿态席卷全网,成为新年最火的现象级网红。从股市前瞻到算命预测,再到情感陪伴,DeepSeek“无所不能”的神奇特质吸引...

同程旅行宣布接入DeepSeek大模型,打造一站式智能旅行服务

同程旅行宣布接入DeepSeek大模型,打造一站式智能旅行服务

3月3日消息,同程旅行日前宣布其自主研发的旅游行业专属模型——同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的在线旅游平台(OTA)。目前,该功能已进入内测阶段,预计3月...

攀升新品亮相,首款搭载本地DeepSeek的定制AIPC开箱即用

攀升新品亮相,首款搭载本地DeepSeek的定制AIPC开箱即用

近日,国产开源大模型DeepSeek引发全球AI领域高度关注。PC作为应用场景最广泛的生产力工具,是承载大规模本地模型的首选终端。相较于手机、可穿戴等设备,PC能够支持远程会议、图形设计、编程开发、多...

深圳港集团实现DeepSeek大模型本地化部署

深圳港集团实现DeepSeek大模型本地化部署

每经AI快讯,据深圳港集团公众号消息,在全球生成式AI技术蓬勃发展的浪潮中,针对港口行业数据安全与响应效率的特殊需求,深圳港集团数字化创新中心携手盐田港资讯公司和盐田国际公司,成功实现DeepSeek...