在DeepSeek-V3模型更新两个月后,DeepSeek-R1也迎来低调升级。
5月29日晚,DeepSeek在公众号正式发文披露DeepSeek-R1升级为DeepSeek-R1-0528,并发布官方测评。
此次更新后的新模型思考更深,推理更强,主流基准测评在国内所有模型中首屈一指,整体表现接近OpenAI的o3、谷歌的Gemini-2.5-Pro等国际顶尖模型。
前一天晚间,DeepSeek官方在用户交流群中宣布R1推理模型完成小版本试升级,29日凌晨则在开源社区公开了模型及权重,并陆续更新了模型卡等更多信息。
这次低调的更新在海内外开发者社区和社交平台仍引发不小关注。综合多位网友体验,DeepSeek-R1-0528在编程、逻辑推理、交互能力等方面均有显著提升。
“这个小升级实际上是一个重大的飞跃”,这是不少人的实测体验。随着DeepSeek-R1新模型登顶全球最强开源模型,网友们也纷纷发问:DeepSeek-R2,还有多远?
整体性能接近o3,幻觉率降低45%-50%
DeepSeek发布的测评结果显示,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
页码:下一页