《2019年美團外賣商業變現實踐.pdf》由會員分享,可在線閱讀,更多相關《2019年美團外賣商業變現實踐.pdf(38頁珍藏版)》請在三個皮匠報告上搜索。
1、目錄01業務介紹02平臺側:收入優化03商家側:轉化優化04用戶側:體驗優化目錄01業務介紹02平臺側:收入優化03商家側:轉化優化04用戶側:體驗優化用戶獲取用戶服務商業變現商戶數360萬,用戶數3億+,日活躍騎手60萬,覆蓋城市2500+業務形態多產品形式多售賣模式多參與方商業生態平臺商家用戶Display AdsSearch AdsFeeds AdsPush AdsCPT/GDCPMCPCCPA曝光下單點擊計算廣告的核心問題Find the“best match”between a given user in a given context and a suitable advertis
2、ement目標平臺用戶商家平臺:收入商家:質、量用戶:體驗如何表達、優化平臺收益?如何表達、優化商家質、量?如何表達、優化用戶體驗?目錄01業務介紹02平臺側:收入優化03商家側:轉化優化04用戶側:體驗優化平臺收入=廣告收入=CPC售賣下核心問題:每一項如何優化平臺收入=廣告收入=CPC售賣下核心問題:每一項如何優化外賣廣告預估框架表示學習背景外賣類別特征較多:店鋪、商品、用戶等常用類別特征表示方法:One-Hot Encoding,嵌入Embedding層,Pre-Train Embedding表示學習充分利用全網非廣告數據應用層算子層訓練層構造層動作層數據層POISKUImageText
3、ClickOrderSearchSequenceGraphSub-GraphDeep Learning basedRandom walk basedFactorization basedW2VFastTextGFHOPEDeepWalkNode2vecLINESDNEGCNConcatPoolingAttentionSimilarityRecallTargetingRankRelevance表示學習框架Sequence版本1.構建用戶行為序列2.Skip-Gram+Negative Sampling3.關鍵問題 如何構建序列-固定時間段-固定時間間隔-時間節點 構建什么序列:Click、Ord
4、er、Click+OrderProjection從Sequence到Graph1.基于用戶行為構建Graph2.基于Graph產生Sequence3.Skip-Gram+Negative SamplingDeepWalk:DFSNode2Vec:BFS+DFSLINE:BFS核心問題有向無向帶權核心方法ProjectionSide Information應對冷啟動問題從ID序列到多模態序列文本序列反映語義偏好:口味、折扣等圖像序列反映視覺偏好:色調、風格等Embedding序列龍蝦享半價起特價烤魚28元起龍蝦享半價起Word2VecLSTMVGGInceptionEmbedding模型中使用C
5、oncatSimilarityPoolingAttention業界模型發展歷程線性模型樹模型神經網絡模型LR、FM、FFMGBDT、XGB、LGBDNN、W&D、FNN、DeepFM優點:簡單、可解釋性缺點:線性,表達能力弱LR:人工組合特征、易到瓶頸FM:比較慢、耗資源優點:非線性,可解釋性強缺點:不能Online高維離散特征處理能力弱優點:自動組合特征,表達能力強缺點:非常慢、可解釋性差、耗資源外賣廣告預估模型的演進XGBLGBDNNW&DDeepFMCNNLSTMDQNMTLDINDIEN線性模型+神經網絡多模態信息刻畫用戶長短期興趣提升迭代效率增加擬合能力多目標學習序列決策Myerso
6、n Auction1.出價:部分廣告主出價較低2.CPC下GSP計費不能反映流量價值3.解法:Myerson Auction0.00%5.00%10.00%15.00%出價=(,用戶體驗)計費與點擊率反比GSP局部無嫉妒均衡期望收益Myerson 均衡GSP均衡VCG刻畫流量價值理論收益最高Myerson Auction建模有約束最優化問題st個體理性激勵兼容常識難點:f要嚴格符合Log Normal分布方法:預估分布目錄01業務介紹02平臺側:收入優化03商家側:轉化優化04用戶側:體驗優化商家側:轉化優化ROI=產出投入商戶側優化OCPC用戶A用戶B出價=1元商家下單概率0.15下單概率0
7、.01問題同價不同質傳統廣告粗粒度的流量區分和匹配,非收益最優商戶側優化OCPC MNOPQPRSTMNOPQPRST=()f 如何設計?特征有哪些?特征參數如何學習?核心問題用戶A用戶B出價=1元商家下單概率0.15下單概率0.01高質量流量低質量流量出價1.5元出價0.5元人工策略進化策略強化學習人工策略如何定義流量質量?先調價、后排序、計費,調價時不知道計費,如何得到ROI?如何度量流量質量的好壞?核心問題MNOPQPRST=()從人工策略到進化策略核心方法:通過參數空間的擾動尋找最優區域,根據Reward反饋計算下一次采樣參數是Policy Gradient方法的一種,工程實現簡單,便
8、于調試分析在離線模擬上可以穩定收斂,且保證目標單調上升便于我們更好的探索狀態和獎賞函數的設計從進化策略到強化學習核心問題建模:如何根據業務設計合理的State、Reward、Action?探索:如何低成本、高效的進行樣本探索?評估:如何快速、準確的對強化學習模型進行評估?建模:如何根據業務設計合理的State、Reward、Action業務問題強化學習轉化優化OCPC排序GSPRewardStateState設計需要考慮整個過程nState設計需要考慮從State到Reward的整個過程nReward多目標優化問題多目標非獨立問題個別目標學偏問題探索:如何低成本、高效的進行樣本探索n 探索的重
9、要性Supervised Learning:Learning From TeacherReinforcement Learning:Learning From Experience探索:如何低成本、高效的進行樣本探索對模型參數隨機擾動可以對模型實時更新Epsilon-Greedy一定概率隨機推薦,獲取充分豐富的樣本樸素Bandit隨機若干次后選擇收益最大的UCBDBGD(DuelingBanditGradientDescent)評估:仿真模擬離線仿真模塊業務無損的進行探索,產生訓練樣本對強化學習模型進行效果評估強化學習效果評估路徑目錄01業務介紹02平臺側:收入優化03商家側:轉化優化04用戶側:體驗優化用戶體驗n 背景廣告:用戶體驗換收入需求長期不能滿足會喪失廣告區域的興趣n 難點用戶體驗是什么?外賣場景線下+線上結合,線下體驗如何評估?用戶體驗如何持續優化?自反饋可度量可迭代n 用戶體驗三要素用戶體驗短期體驗中期體驗長期體驗點擊率轉化率頁面互動復購率用戶月活用戶留存n 用戶體驗三個階段n Utility角度理解用戶體驗XYSZ=+S_O S_O?Pbc.?Pbc.PVTwo Week長期總結業務介紹:外賣廣告業務介紹、計算廣告的核心問題拆解平臺側收入優化:模型預估+機制設計商家側轉化優化:OCPC從人工策略到強化學習的迭代用戶側體驗優化:用戶體驗建模優化謝謝大家!