
DeepSeek-R1 發布,模型性能對齊 OpenAI-o1 正式版。2025 年 1 月 20 日,北京深度求索科技有限公司正式發布了 DeepSeek-R1,并同步開源了模型權重。DeepSeek-R1 在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩 Opening o1 正式版。DeepSeek-R1 蒸餾了 6 個小模型,其中 32B 和 70B 模型在多項能力上實現了對標 OpenAI o1 mini 的效果。通過將 R1 模型知識蒸餾到輕量化模型中,不僅能夠提升輕量化模型的性能,同時也會降低成本,有助于進一步加快端側 AI 的發展。這一發布標志著人工智能領域的一個重要里程碑。