DeepSeek-R1系列模型性能對比 DeepSeek-R1 在繼承了 V3 的創新架構的基礎上,在后訓練階段大規模使用了強化學習技術,自動選擇有價值的數據進行標注和訓練,減少數據標注量和計算資源浪費,并在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上, DeepSeek 在 AIME 2024 測評中上獲得 79.8% 的 pass@1 得分,略微超過 OpenAI-o1;在 MATH-500 上,獲得了 97.3% 的得分,與 OpenAI-o1 性能相當,并且顯著優于其他模型。。 行業數據 下載Excel 下載圖片 原圖定位