新京報貝殼財經(jīng)訊（記者羅亦丹）5月29日晚，DeepSeek官方微信公眾號發(fā)文稱，DeepSeek-R1模型已完成小版本升級，當前版本為DeepSeek-R1-0528。用戶通過官方網(wǎng)站、APP 或小程序進入對話界面后，開啟“深度思考”功能即可體驗最新版本。API 也已同步更新，調(diào)用方式不變。

具體來看，DeepSeek-R1-0528 仍然使用 2024 年 12 月所發(fā)布的 DeepSeek V3 Base 模型作為基座，但在后續(xù)訓(xùn)練過程中投入了更多算力，顯著提升了模型的思維深度與推理能力。更新后的R1模型在數(shù)學、編程與通用邏輯等多個基準測評中取得了當前國內(nèi)所有模型中首屈一指的優(yōu)異成績，并且在整體表現(xiàn)上已接近其他國際頂尖模型，如o3與 Gemini-2.5-Pro。

相較于舊版 R1，新版模型在復(fù)雜推理任務(wù)中的表現(xiàn)有了顯著提升。例如在 AIME 2025 測試中，新版模型準確率由舊版的 70% 提升至 87.5%。這一進步得益于模型在推理過程中的思維深度增強：在 AIME 2025 測試集上，舊版模型平均每題使用 12K tokens，而新版模型平均每題使用 23K tokens，表明其在解題過程中進行了更為詳盡和深入的思考。

同時，蒸餾 DeepSeek-R1-0528 的思維鏈后訓(xùn)練Qwen3-8B Base，得到了 DeepSeek-R1-0528-Qwen3-8B。該 8B 模型在數(shù)學測試 AIME 2024 中僅次于 DeepSeek-R1-0528，超越 Qwen3-8B （+10.0%），與 Qwen3-235B 相當?！拔覀兿嘈?，DeepSeek-R1-0528 的思維鏈對于學術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義?！盌eepSeek方面表示。

此外，新版 DeepSeek R1 針對“幻覺”問題進行了優(yōu)化。與舊版相比，更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中，幻覺率降低了 45%～50% 左右，能夠有效地提供更為準確、可靠的結(jié)果。

而在創(chuàng)意寫作方面，在舊版R1的基礎(chǔ)上，更新后的R1模型針對議論文、小說、散文等文體進行了進一步優(yōu)化，能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品，同時呈現(xiàn)出更加貼近人類偏好的寫作風格。

最后，DeepSeek保持了一貫的開源做派，提供了相關(guān)模型的下載鏈接。

編輯陳莉校對楊許麗

13 +1

微博

微信

我要評論

直播

直播中

2025校歌會暨第11屆北京沙河高教園區(qū)文化交流月開幕
12757人參與
預(yù) 告蘇州金雞湖龍舟賽非遺民俗鬧端午
2025-05-31 08:50
預(yù) 告弘揚科學家精神走進朝陽法院聽科學家科技報國感人故事
2025-05-30 14:40

DeepSeek-R1模型完成小版本升級：思考更深，推理更強

我要評論

直播

熱點

最新

熱議

DeepSeek-R1模型完成小版本升級：思考更深，推理更強

我要評論

直播

熱點

最新

熱議

DeepSeek-R1模型完成小版本升級：思考更深，推理更強