DeepSeek推理模型預(yù)覽版上線，解密o1推理過程

2025-07-16 02:17| 來源: 網(wǎng)絡(luò)整理| 查看: 265

今天，DeepSeek 全新研發(fā)的推理模型 DeepSeek-R1-Lite 預(yù)覽版正式上線。

所有用戶均可登錄官方網(wǎng)頁（chat.deepseek.com），一鍵開啟與 R1-Lite 預(yù)覽版模型的超強(qiáng)推理對話體驗(yàn)。

DeepSeek R1 系列模型使用強(qiáng)化學(xué)習(xí)訓(xùn)練，推理過程包含大量反思和驗(yàn)證，思維鏈長度可達(dá)數(shù)萬字。

該系列模型在數(shù)學(xué)、代碼以及各種復(fù)雜邏輯推理任務(wù)上，取得了媲美 o1-preview 的推理效果，并為用戶展現(xiàn)了 o1 沒有公開的完整思考過程。

全面提升的推理性能? DeepSeek-R1-Lite 預(yù)覽版模型在美國數(shù)學(xué)競賽（AMC）中難度等級最高的 AIME 以及全球頂級編程競賽（codeforces）等權(quán)威評測中，均取得了卓越的成績，大幅超越了 GPT-4o 等知名模型。下表為 DeepSeek-R1-Lite 在各項(xiàng)相關(guān)評測中的得分結(jié)果：

深度思考的效果與潛力?

DeepSeek-R1-Lite 的推理過程長，并且包含了大量的反思和驗(yàn)證。下圖展示了模型在數(shù)學(xué)競賽上的得分與測試所允許思考的長度緊密相關(guān)。

紅色實(shí)線展示了模型所能達(dá)到的準(zhǔn)確率與所給定的推理長度呈正相關(guān)；相比傳統(tǒng)的多次采樣+投票（Majority Voting），模型思維鏈長度增加展現(xiàn)出了更高的效率。全面上線，嘗鮮體驗(yàn)?

登錄 chat.deepseek.com，在輸入框中選擇“深度思考”模式，即可開啟與 DeepSeek-R1-Lite 預(yù)覽版的對話。

“深度思考” 模式專門針對數(shù)學(xué)、代碼等各類復(fù)雜邏輯推理問題而設(shè)計(jì)，相比于普通的簡單問題，能夠提供更加全面、清晰、思路嚴(yán)謹(jǐn)?shù)膬?yōu)質(zhì)解答，充分展現(xiàn)出較長思維鏈的更多優(yōu)勢。

對話開啟示例：

適用場景與效果示例：

新的開始，敬請期待?

DeepSeek-R1-Lite 目前仍處于迭代開發(fā)階段，僅支持網(wǎng)頁使用，暫不支持 API 調(diào)用。DeepSeek-R1-Lite 所使用的也是一個較小的基座模型，無法完全釋放長思維鏈的潛力。

當(dāng)前，我們正在持續(xù)迭代推理系列模型。之后，正式版 DeepSeek-R1 模型將完全開源，我們將公開技術(shù)報(bào)告，并部署 API 服務(wù)。

掃碼與 DeepSeek 開啟對話

【本文地址】

公司簡介

聯(lián)系我們

今日新聞

推薦新聞

專題文章