新京報貝殼財經(jīng)訊(記者羅亦丹)5月29日晚,DeepSeek官方微信公眾號發(fā)文稱,DeepSeek-R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。用戶通過官方網(wǎng)站、APP 或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API 也已同步更新,調(diào)用方式不變。
具體來看,DeepSeek-R1-0528 仍然使用 2024 年 12 月所發(fā)布的 DeepSeek V3 Base 模型作為基座,但在后續(xù)訓(xùn)練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新后的R1模型在數(shù)學、編程與通用邏輯等多個基準測評中取得了當前國內(nèi)所有模型中首屈一指的優(yōu)異成績,并且在整體表現(xiàn)上已接近其他國際頂尖模型,如o3與 Gemini-2.5-Pro。
相較于舊版 R1,新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升。例如在 AIME 2025 測試中,新版模型準確率由舊版的 70% 提升至 87.5%。這一進步得益于模型在推理過程中的思維深度增強:在 AIME 2025 測試集上,舊版模型平均每題使用 12K tokens,而新版模型平均每題使用 23K tokens,表明其在解題過程中進行了更為詳盡和深入的思考。
同時,蒸餾 DeepSeek-R1-0528 的思維鏈后訓(xùn)練Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。該 8B 模型在數(shù)學測試 AIME 2024 中僅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),與 Qwen3-235B 相當?!拔覀兿嘈?,DeepSeek-R1-0528 的思維鏈對于學術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義?!盌eepSeek方面表示。
此外,新版 DeepSeek R1 針對“幻覺”問題進行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低了 45%~50% 左右,能夠有效地提供更為準確、可靠的結(jié)果。
而在創(chuàng)意寫作方面,在舊版R1的基礎(chǔ)上,更新后的R1模型針對議論文、小說、散文等文體進行了進一步優(yōu)化,能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風格。
最后,DeepSeek保持了一貫的開源做派,提供了相關(guān)模型的下載鏈接。
編輯 陳莉 校對 楊許麗