AI 三要素迎來拐點,低參數量特征為本地化部署到 AI 終端運行提供可能。DeepSeek-R1以少量 SFT 數據+多輪強化學習的方法重構訓練流程,實現了低內存占用、低計算開銷和高模型準確性的特征,通過優化訓練流程實現算力和性能的近似線性關系,模型推理能力每增加一張GPU即可穩定提升,無需依賴外部復雜監督機制。同時,2025 年后發布的大模型具備低參數量的特征,低參數量模型適合在資源有限的終端設備運行,DeepSeek 的性價比和效率優勢有望實現端側平臺部署。此外,AI 技術創新圍繞算力、數據、算法三因素循環,2025年再次進入算法創新階段。
AI 三要素迎來拐點,低參數量特征為本地化部署到 AI 終端運行提供可能。DeepSeek-R1以少量 SFT 數據+多輪強化學習的方法重構訓練流程,實現了低內存占用、低計算開銷和高模型準確性的特征,通過優化訓練流程實現算力和性能的近似線性關系,模型推理能力每增加一張GPU即可穩定提升,無需依賴外部復雜監督機制。同時,2025 年后發布的大模型具備低參數量的特征,低參數量模型適合在資源有限的終端設備運行,DeepSeek 的性價比和效率優勢有望實現端側平臺部署。此外,AI 技術創新圍繞算力、數據、算法三因素循環,2025年再次進入算法創新階段。