
需求多樣,更靈活計費模式亦在不斷探索。國內大模型廠商為提升客單價在按量計費的基礎上持續創新,推出靈活計費模式。百度文心一言 4.0推出了Tokens資源包收費形式,最高 10.2萬元可購買 10億 Tokens,優惠單價低至0.102元/千 Tokens,適合需求量大的 B端開發者用戶。還有的實施限速分級計費模式,如文心一言 4.0中用戶可根據所需 TPM和 RPM速率需求購買相應數量的 TPM配額(按月付),且在突增峰值流量時購買額外的 TPM配額包(按小時付),靈活滿足用戶的使用速率需求。Moonshot 則根據累計充值金額分級限速,滿足不同用戶需求的同時,預計提升客單價。