
半導體 V3 的訓練成本具有極大的經濟性,根據 DeepSeek-R1 Technical Report 的數據,在預訓練階段,每處理 1 萬億 tokens,訓練 DeepSeek-V3 僅需 18 萬 H800 GPU 小時,即在 2048 塊H800 GPU 的集群上需要 3.7 天;因此,DeepSeek-V3 的預訓練階段在不到兩個月內完成,耗時 266.4 萬(2664K)GPU 小時;加上上下文長度擴展所需的 11.9 萬 GPU 小時和后訓練所需的 5 千 GPU 小時,DeepSeek-V3 的完整訓練僅需 278.8 萬 GPU 小時;假設 H800 GPU的租賃價格為每小時 2 美元,DeepSeek-V3 的總訓練成本僅為 557.6 萬美元。2025 年 1 月20 日 DeepSeek-R1 正式發布,其 API 定價為每百萬輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出 tokens 16 元;OpenAl o1 定價為每百萬輸入 tokens 55 元(緩存命中)/110 元(緩存未命中),每百萬輸出 tokens 438 元;DeepSeek-R1 API 調用成本不到 OpenAl o1 的 5%。DeepSeek-V3 性能對標 GPT-4o,DeepSeek-R1 性能對標 OpenAI