《2019年基于創新算法的半監督的lookalike效果營銷.pdf》由會員分享,可在線閱讀,更多相關《2019年基于創新算法的半監督的lookalike效果營銷.pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、基于基于創新算法的半創新算法的半監督監督lookalike的的效果效果營銷營銷讓 世 界 心 中 有 數目 錄CONTENTS01.MobTech公司介紹02.市場分析03.Lookalike場景下樣本補充技術04.營銷場景下的模型算法05.轉化率技術革新下的飛躍案例06.MobTech產品介紹Lookalike 市場分析廠家GoogleFacebookYahoo!微信建模方法predict modelpredict modelSVM,GBDT,LRLR/GBDT+LR主要特征近30天網頁瀏覽行為,app行為,搜索行為,網頁類型、query類型。社交行為,人口統計學標簽人口統計學標簽,網頁瀏覽
2、行為、app行為社交行為、閱讀、關注最小種子用戶規模500100,推薦200+1000,推薦10000+/通過目標種子人群,擴散到整個到整個人群庫中,根據種子特性,尋找最相似的人特點:只有正樣本,且一般量級不大當使用分類模型來處理lookalike業務時,最大的問題就是負樣本的獲取。隨機選取,依賴自然情況下負樣本事件發生的概率較大。傳統做法MobTech做法不用負樣本:PNB算法PU Learning(Positive-Unlabelled Learning)Lookalike場景下樣本補充技術半監督式機器學習詳見下例NBSpy的基本思想是從P中劃分出一個子集S,將S中的樣本放到U中,從而得到
3、新的正樣本集P-S和未標識樣本集U+S。使用P-S作為正樣本,U+S作為負樣本進行分類,當分類結束后,利用對那些“間諜”樣本的標識,確定一個閾值th,再對U中的文檔進行劃分得到可靠的負樣本集合RN。其中,從P中劃分子集S的數量比例一般為15%。Spy使用Rocchio算法與上述NB分類器計算RN的步驟很類似,只要把上述算法中第3步的分類器替換為Rocchio分類器即可。Rocchio對特征one hot編碼后,對每個特征,如果其在P集合中的出現頻次大于N集合,記該特征為正特征(Positive Feature,PF),所有滿足該條件的特征組成一個PF集合。對U中的每個樣本,如果其完全不包含PF
4、集合中的任意一個特征,則該樣本應加入RN。1-DNF相比純粹的隨機挑選,盡可能地從無標注里剔除掉接近正樣本的樣本,有多種算法。Lookalike場景下樣本補充技術半監督式機器學習給定正樣本集PD及無標注樣本UD在PD上學習正樣本下各特征的概率分布#(|1)=,(-.,01),(01)引入超參Pr(1),使用業務經驗、數據積累賦值,得到正負樣本的先驗概率。再利用全概率公式及UD,得到負樣本各特征的概率分布#2=#20#0+#21#1#20=#2#(2|1)#(1)1#(1)但應用NB算法,需要計算負樣本各特征的概率分布及正負樣本的先驗概率。在沒有負樣本ND的情況下。Lookalike場景下樣本補
5、充技術半監督式機器學習大同小異,以NB為例:Step 1Assign each item in the class label-1Step 2Build a NB classifier using and Step 3Use the classifier to classify.Those items in that are classified as negative form the reliable negative set Step 4Assign each item in the class label 1相比純隨機挑選的負樣本,使用進過PU-Learning后得到的負樣本,最終得到
6、的模型在效果上能有2%5%的提升。Lookalike場景下樣本補充技術半監督式機器學習將AUC理解為:從正負樣本集中隨機挑選一個正樣本以及一個負樣本,模型對正樣本的Score大于負樣本的Score的概率。形式化為:=Pr(.B.D).進一步的,設正樣本集為P,負樣本集為Q,計數函數g(x)如下:=G0,0,則()J=K0L(.(NB OD)LOPK0NPK最終,為了方便應用梯度下降法,將g(x)改為sigmoid函數,(當x值特別大時,sigmoid的結果等于g(x),故此為AUC的良好近似)=1R(.(NB OD)0,LN,O最終,能在驗證集的AUC上取得3%左右的提升AUC是2分類問題中最
7、常用的模型評價指標。既然如此,為何不直接以AUC 為 損 失 函 數?基 于此,改造出了MobTech獨特的邏輯回歸模型營銷場景下的模型算法機器學習算法A/B Test,隨機選取小部分流量(如5%),用于新模型測試,運行一段時間后,與同期運行的舊模型進行統計、比較。傳統做法在營銷系統中引入MAB(Multi-Armed Bandit)來做自動優化,盡量減少機會成本。MobTech做法弊端承受測試時將流量分給低轉化率模型導致的機會成本。研發出來的新算法,經過本地測試、歷史數據測試,最終還是要上生產環境投產測試。如何分配測試流量?營銷場景下的模型算法機器學習算法Step 04Step 03Step
8、 02Step 01隨機選取小部分流量(如5%),分配給新模型用于測試;經過1個stage之后,統計新模型和舊模型效果,得到兩者分別的beta(,)分布;基于兩者的beta分布計算兩者在下一stage的流量比例;按照第3步得到的比例分配流量,回到第2步循環,直到測試結束。MobTech具體算法營銷場景下的模型算法機器學習算法相比A/B Test,能取得更好的轉化效果營銷場景下的模型算法機器學習算法完善的全景完善的全景營銷生態閉環營銷生態閉環客客戶戶SMS短信推送短信推送轉化率技術革新下的飛躍案例0.02%0.13%2018/050.03%0.04%0.05%0.06%0.07%0.08%0.0
9、9%0.10%0.11%0.12%0.29%0.23%2018/062018/072018/082018/092018/102018/112018/122019/012019/022019/032019/042019/052019/062018年5月2019年6月期間,Lookalike在游戲行業投放情況的數據顯示,普通用戶在使用3個月后轉化率提升至0.05%;當模型lookalike升級使用PU Learning半年后,轉化率高達0.11%;再次升級算法包括AUC+MAB后,短短三個月轉化率就已達到0.29%,效果顯著。轉化率技術革新下的飛躍案例0.04%0.08%0.21%0.25%0.3
10、0%0.35%0.36%0.39%0.90%1.04%1.07%1.29%1.61%1.75%2018/052018/062018/072018/082018/092018/102018/112018/122019/012019/022019/032019/042019/052019/062018年5月2019年6月期間,Lookalike在金融行業投放情況的數據顯示,普通用戶在使用3個月后轉化率提升至0.25%,轉化效果非常顯著;當模型算法采用PNB/PU Learning使用近半年后,轉化率高達0.90%;再次升級算法包括AUC+MAB后,短短三個月轉化率就已達到0.29%,效果顯著。Mo
11、bTech是全球領先的綜合性智能科技企業,以數據應用為主導,融合頂尖的大數據、云計算、人工智能等多元先進技術,打造MobService、MobSmart,MobAI,MobData研究院4大品牌,為全球200多個國家和地區的企業、開發者和政府機構提供商業智能解決方案、App運營賦能方案、企業級AI智能方案、數據咨詢研究等服務。讓世界心中有數品牌網絡MobSmart全球領先的第三方全景數據服務平臺MobAI企業級【AI+數據】智能實驗室MobService第三方移動應用服務平臺Mob研究院大數據研究咨詢機構19MobTech數據實力累計覆蓋設備100億+可以覆蓋國內95%+的獨立設備MAU 10
12、億+月活躍獨立設備數5000+興趣標簽體系3層標簽+垂直場景DAU 2.5億+日活躍獨立設備數覆蓋APP 40萬+服務開發者30萬+LBS覆蓋設備30億+4重定位地理場景信息2億+2021Mob自有數據企業一方數據第三方合作數據數據感知系統數據聚合數據治理質量控制數據認知系統行業AI大腦大規模數據集群行業數據云數據索引知識沉淀畫像標簽用戶關聯數據資產管理數據調度引擎數據安全行業應用開放平臺BI服務SAAS工具數據超市政府營銷金融風控商業地理PAASAI實驗室科技平臺+行業AI規則引擎數據標簽維度構建千人千面的標簽維度5000+22第三方全景數據服務平臺介紹第三方移動應用服務平臺MobServi
13、ce是隸屬于MobTech旗下的第三方移動應用服務平臺,從2012年開始便為App的開發與運營全面賦能,相繼推出十余款SDK產品和場景解決方案,形成了覆蓋App全生命周期的多維功能矩陣,全面革新開發和運營場景,讓移動開發更加智能化、自動化,讓App運營更加低成本、高能效。0元完全免費,開發者可享受Mob提供的免費技術服務。5分鐘用不到5分鐘就能夠集成一個甚至數個SDK,操作簡單,方便高效。600K包體小于原生SDK,iOS端可以去SDK化,Android最小600k24小時我們提供7*24小時的專業技術支持服務100%100%開源,可自定義界面,符合自己的APP需求6年6年多的技術積累,研發了
14、Gradle插件MobService產品矩陣Mob云驗證移動場景還原方案ShareSDKSMSSDKMobPushMobLink智能化推送服務社會化分享組件云識別免驗證碼服務短信及語音驗證系統極簡驗證,讓用戶不再等待秒 驗秒驗優勢3秒完成驗證準全快新準確率達99%以上專人維護,保持最新三大運營商合作第三方全景數據服務平臺MobSmart,是隸屬于MobTech旗下,全球領先的第三方全景數據服務平臺,能夠為企業提供從線上到線下,覆蓋行業多場景的商業化智能解決方案。以【全景大數據+場景小數據】的服務戰略為支撐,MobSmart積極探索數據智能與商業應用的更多結合點,并不斷突破驅動技術前沿,打造出“
15、前臺+中臺+后臺”的商業化智能協同網絡,針對不同行業的營銷、風控、增益、效能等等全場景問題,迅速判斷、協同輸出最直接有效的智能解決方案,全鏈路優化營銷推廣、市場分析、管理決策、運營輔助、內部架構等流程,幫助企業快速跨入智能化商業道路。MobTech全景服務平臺產品矩陣MobSmart深度行業洞察Mob研究院全景大數據咨詢服務Mob APP360移動應用監測產品Mob MktGo移動設備監測產品Mob Games移動游戲行業解決方案Mob Tourism旅游地理解決方案Mob Retail商業地理解決方案Mob Market+大數據營銷解決方案Mob Fin金融行業解決方案28Mob Retai
16、l商業地理行業解決方案新零售展會智慧旅游房地產商業地產基礎地理客群洞察競品調研營銷觸達商圈研究門店運營選址分析項目研策運營管理商業評級景區規劃客流預警景區對標實時監控人群洞察營銷觸達地塊研究案場管理客群觸達29商業地產解決方案城市商業數據地圖第一方數據第三方數據商業數據獲取行業場景應用城市研策人口結構變化 產業經濟發展消費力房價數據 區域/板塊選址商圈指數商圈覆蓋 客流指數 業態配比標桿商業項目分析 客流分布項目數據項目數據 業態配比客流監測 品牌占比項目周邊環境住宅小區寫字樓 沿街商業產業園區 學校 醫院土地評估已成交地塊 掛牌地塊土地用途 土地可利用率品牌招商城市分布 品牌評級品牌分類 招
17、商評級運營監測消費地域偏好 消費業態偏好消費品牌偏好 消費軌跡分析潛客調研社會屬性 興趣偏好 搜索偏好廣告偏好 出行偏好項目交通地鐵/公交站點分布樞紐規劃交通指數商業布局商業定位商業評級商業運營30Mob Market+大數據營銷解決方案持續性營銷個性化營銷數據洞察決策分析決策效果追蹤 行業&競品洞察 消費者屬性洞察 媒介洞察 客群定向 活動編排 持續觸達9種人群圈選模式5000+細化標簽維度一站式品牌營銷服務200+人大數據專業團隊8種媒介觸達渠道超億級流量資源精準高效省心省力多場景適用31Mob Market+用戶營銷評分MobSmart將整合各類數據,進行聯合建模,構建整個建模評分體系,
18、幫助企業實現用戶有效性和用戶價值評分的評估一方數據MobSmart數據聯合建模特征工程圖分析參數/非參數模型機器學習決策引擎高分客戶,高價值活躍,應該重視這類客戶出參:各類評分評估用戶有效性入參:各類線上、線下行為App使用行為、競品使用、偏好類別等線上行為線下行為銷售數據、常去消費地等中分客戶,高價值沉默,應該增加對這類客戶的重視中低分客戶,低價值沉默用戶和活躍用戶,持續性關注低分客戶,無價值用戶,更新用戶信息考慮放棄32MobSmart金融行業解決方案,是以MobTech大數據、云計算、人工智能等先進技術為基礎,針對金融行業在風控與投研場景下的難點布局產品數據超市行業難點:金融機構缺少多維
19、數據強化風控模型解決方案:MobSmart 5000+維度跨行業標簽,補充并優化風控模型,降低金融機構壞賬率風控場景特征平臺APP360獨角獸版APP360標準版行業難點:金融機構缺少有效數據支撐投資策略解決方案:通過MobSmart對移動設備市場的高覆蓋率,幫助金融機構掌握一、二級市場的真實趨勢,降低投資風險投研場景移動監測智熵AI實驗室補充成品標簽定制場景標簽二級市場研究一級市場研究Mob Fin 金融行業解決方案33合作伙伴舉例覆蓋零售、汽車、地產、金融、教育、旅游、游戲等傳統行業及互聯網企業傳統行業紅星美凱龍萬達井岡山景區中糧綠地漢堡王肯德基VIVO捷豹路虎梅賽德斯中鐵萬科互聯網行業拍拍貸挖財騰訊游戲移動手機營業廳銀聯攜程U-CLOUD融創小紅書玖富滴滴出行艾瑞傳統&互聯網行業大數據+34Thank you!