
DeepSeek 的火爆表現主要源于其出色的推理表現,DeepSeek-R1 與 OpenAI-o1的水平相當。DeepSeek-R1 的基準表現,R1 在多個評測中表現結果持平甚至超過了OpenAI-o1,尤其是在數學領域的表現尤為突出,DeepSeek-R1 在 2024 年 AIME 上的單次預測準確率達到 79.8%;在 MATH-500 上,它取得了令人矚目的 97.3 的分數,與o1-1217 表現相當,顯著超越了其他模型。在代碼領域雖然表現差于 o1,但得分差距較小,在 Codeforces 上獲得了 2029 Elo 評級,超過了 96.3%的競賽參與者,整體來看,DeepSeek-R1 具有非常優秀的推理能力。