圖32OpenAIo1在訓練和推理階段算力資源的投入與模型性能的關系 (5)o1 模型的發布證明了推理側的算力資源投入同樣重要,“Scaling Law”在推理階段或同樣適用。o1 模型引入的思維鏈類似人類在回答困難問題之前的長時間思考,通過訓練時的強化學習,o1 能夠鍛煉其思維鏈并改進其使用的策略,它還能夠識別并改正錯誤,將棘手的問題拆分成更簡單的步驟,如果目前的方式不奏效,o1 還會嘗試不同的解決方式。上述思維鏈讓 o1 的推理能力大幅增強。從下圖可知,當推理側的算力資源增加時,模型處理問題的準確度顯著提升,代表著類似于預訓練階段的“Scaling Law”在推理階段也同樣兌現了。 行業數據 下載Excel 下載圖片 原圖定位