
2025 年 1 月 20 日,DeepSeek 正式發布 DeepSeek-R1。從技術性能來看,DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅依賴極少標注數據的情況下,顯著提升了模型推理能力。在數學、代碼、自然語言推理等任務上,其性能表現已與 OpenAI o1正式版相當,展現強大的競爭力。從商業化角度來看,DeepSeek-R1 的 API 服務定價策略極具市場吸引力,其定價為每百萬輸入 tokens 1 元(緩存命中)/4 元(緩存未命中),每百萬輸出 tokens 16 元,顯著低于 open AI o1 模型,為企業在成本敏感場景下的 AI 應用提供了更具性價比的選擇。從開源生態建設來看,為推動和鼓勵開源社區及行業生態的發展,公司不僅將 R1 模型及其權重完全開源,還采用了標準化且寬松的 MIT License,完全開源,允許用戶自由商用,且無需額外申請。此外,公司還明確允許用戶基于模型輸出進行二次開發,包括通過模型蒸餾等方式訓練其他模型。這一舉措不僅降低了行業技術門檻,也為開源社區和行業生態的繁榮注入了活力。