
DeepSeek R1 性能對齊 OpenAI-o1 正式版。2025 年 1 月 20 日,DeepSeek 發布DeepSeek-R1,并同步開源模型權重。R1 對用戶開放思維鏈輸出,其在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 OpenAI o1 正式版。此外在開源 DeepSeek-R1-Zero 和 DeepSeek-R1 兩個 660B 模型的同時,其通過 DeepSeek-R1 的輸出,蒸餾了 6 個開源小模型,其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1-mini 的效果。較低的成本下 V3 及 R1 的 API 價格遠低于市面上其他大模型。