DeepSeek-V3采用FP8為主的混合精度訓練方法 制化通信內核、低精度通信以及對未來硬件設計的建議,顯著提高了跨節點通信的效率。這些技術不僅減少了通信開銷,還提高了整體訓練效率,為大規模分布式訓練提供了強大的支持。 行業數據 下載Excel 下載圖片 原圖定位