DeepSeek推理模型預(yù)覽版上線,解密o1推理過程 | 您所在的位置:網(wǎng)站首頁 › deepseek算卦準(zhǔn)不準(zhǔn) › DeepSeek推理模型預(yù)覽版上線,解密o1推理過程 |
DeepSeek推理模型預(yù)覽版上線,解密o1推理過程
今天,DeepSeek 全新研發(fā)的推理模型 DeepSeek-R1-Lite 預(yù)覽版正式上線。 所有用戶均可登錄官方網(wǎng)頁(chat.deepseek.com),一鍵開啟與 R1-Lite 預(yù)覽版模型的超強(qiáng)推理對話體驗(yàn)。 DeepSeek R1 系列模型使用強(qiáng)化學(xué)習(xí)訓(xùn)練,推理過程包含大量反思和驗(yàn)證,思維鏈長度可達(dá)數(shù)萬字。 該系列模型在數(shù)學(xué)、代碼以及各種復(fù)雜邏輯推理任務(wù)上,取得了媲美 o1-preview 的推理效果,并為用戶展現(xiàn)了 o1 沒有公開的完整思考過程。 全面提升的推理性能? DeepSeek-R1-Lite 預(yù)覽版模型在美國數(shù)學(xué)競賽(AMC)中難度等級最高的 AIME 以及全球頂級編程競賽(codeforces)等權(quán)威評測中,均取得了卓越的成績,大幅超越了 GPT-4o 等知名模型。 下表為 DeepSeek-R1-Lite 在各項(xiàng)相關(guān)評測中的得分結(jié)果:![]() DeepSeek-R1-Lite 的推理過程長,并且包含了大量的反思和驗(yàn)證。下圖展示了模型在數(shù)學(xué)競賽上的得分與測試所允許思考的長度緊密相關(guān)。 ![]() 登錄 chat.deepseek.com,在輸入框中選擇“深度思考”模式,即可開啟與 DeepSeek-R1-Lite 預(yù)覽版的對話。 “深度思考” 模式專門針對數(shù)學(xué)、代碼等各類復(fù)雜邏輯推理問題而設(shè)計(jì),相比于普通的簡單問題,能夠提供更加全面、清晰、思路嚴(yán)謹(jǐn)?shù)膬?yōu)質(zhì)解答,充分展現(xiàn)出較長思維鏈的更多優(yōu)勢。 對話開啟示例:![]() ![]() ![]() DeepSeek-R1-Lite 目前仍處于迭代開發(fā)階段,僅支持網(wǎng)頁使用,暫不支持 API 調(diào)用。DeepSeek-R1-Lite 所使用的也是一個較小的基座模型,無法完全釋放長思維鏈的潛力。 當(dāng)前,我們正在持續(xù)迭代推理系列模型。之后,正式版 DeepSeek-R1 模型將完全開源,我們將公開技術(shù)報(bào)告,并部署 API 服務(wù)。 ![]() 掃碼與 DeepSeek 開啟對話 |
今日新聞 |
推薦新聞 |
專題文章 |
CopyRight 2018-2019 實(shí)驗(yàn)室設(shè)備網(wǎng) 版權(quán)所有 |