
Deepseek-R1 發布,性能比肩 OpenAI o1 正式版。Deepseek 模型通過創新智能架構設計,以更小的參數規模實現國際頂尖性能,DeepSeek-R1 模型在數學、代碼、自然語言推理等任務上的性能比肩 OpenAI o1 模型正式版。根據Deepseek 官網發布的測評報告數據,在 AIME 2024 數學基準測試中,DeepSeek-R1 得分率為 79.8%,OpenAI-o1-1217 的得分率為 72.6%;在 MATH-500 基準測試中,DeepSeek-R1 得分率為 97.3%,OpenAI-o1-1217 的得分率為 94.3%。