京東廣告受眾屬性預估.pdf

編號:29736 PDF 27頁 1.92MB 下載積分:VIP專享
下載報告請您先登錄!

京東廣告受眾屬性預估.pdf

1、京東零售 標簽研發部 王賀 廣告受眾基礎屬性預估 DataFunTalk IT人如何通過競賽來提升自身價值 01 賽題理解 02 03 04 特征工程 方案演變 總結與思考 02 本次分享的內容 賽題理解 Day1 點擊序列 Day2 點擊序列 Day n 點擊序列 用戶瀏覽廣告,產生用戶的廣告序列 性別? 年齡? 產生數據 預 測 根據用戶點擊的日志,預測 用戶的性別、年齡信息 準確率(accuracy)= 年齡準確率 + 性別準確率 賽題理解-賽題特點 實際業務中我們常通過用戶各類屬性信息為用戶進行精準推薦,廣告投放等。 然而本賽題是逆序建模思路,也就是說,用戶通過點擊經過系統推薦的廣告,

2、 再通過點擊的廣告行為數據反推推薦的邏輯。 廣告推薦系統 曝光 點擊獲得數據 賽題理解 1010分類 2 2分類 2 20 0分類 用戶行為序列預測用戶人口統計學屬性 91天用戶行為序列 = Age & Gender Train: 300W用戶 Test: 100W用戶 賽題理解-稀疏性 用戶行為稀疏廣告投放稀疏 id長尾特性+為現實意義明確的實體的場景下:相似度流派完勝統計流派 id為現實意義明確的實體時,往往具有很豐富的信息,在分布較為稀疏時, 往往基于低頻特征無法很好的學習到id的具體信息。所以需要稠密化轉化。 特征工程-統計特征 1) 用戶出現的總次數和天數 2) 用戶點擊廣告的總次數

3、 3) 用戶點擊不同廣告、產品、類別、素材、廣告主的總數 4) 用戶每天每條廣告點擊的平均次數,均值和方差 交互行為興趣范圍 種子人群 統計每個廣告 受眾人群的性 別年齡分布 該用戶性別年齡的概率分布 平均 廣告ID 屬性ID 特征工程-概率分布特征 方案演變-傳統方案 TFIDFTFIDF統計特征概率分布. ad_idtime TFIDF creative_i d . LightGBM/XGBoost 向量相關 思考:TFIDF的效率 和維度 方案演變-傳統方案 advertiser id1 advertiser id2 ad_id1 ad_id2ad_id3 creative id1 creative id2 creative id3 creative id4 廣告主分層 廣告稀疏屬性具有層級結構,為一對多的關系。 分層編碼:將一對一的詞使用同一個id進行編碼。 可以無損的降低一半詞表

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(京東廣告受眾屬性預估.pdf)為本站 (X-iao) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站