1、機器學習在LBS中的應用-百勝智能選址TalkingData 研發副總裁目錄一三零售行業的發展現狀和需求新一代位置智能-基于智能的位置數據四新一代位置智能-基于智能的應用工具五下一代商業智能的暢想二傳統位置智能的現狀和局限面向行業的分析-百勝當前經營狀態西北東北西南全國8個大區市場人員200人要采集人口、流量、商業環境等大量數據每年要更新數據2次面向行業的分析-百勝當前經營狀態管理成本:數據采集、整理成本巨大,每次采集人口均要走訪當地,全國300個城市,小區、街道眾多數據客觀性:多數數據采集只是問問本地居委會等,很難確保數據客觀準確數據新鮮程度:每年更新數據2次,但是現在人口流動情況復雜、城市
2、規劃變化快數據解釋性:采集上的人口,多數是戶籍人口,但是無法覆蓋非戶籍人口,更無法準確采集動態流量面向行業的分析-百勝對數據、AI方面的需求根據人口、流量數據、現實競爭對手態勢,持續的觀察現實世界的商業變化,幫助企業快速做出決策和可執行的動作持續的智能傳統使用者對人工智能還是心存疑慮,為了解決這種疑慮,人工智能要有可解釋性??山忉尩闹悄苋丝跀祿?、流量數據要能解釋現實狀態,可以大范圍替代現有人工采集的方式,數據大且精準全球領先的信息技術研究和顧問公司Gartner指出,增強型分析(augmented analytics)、持續型智能(continuous intelligence)與可解釋型人工
3、智能(explainable AI)是數據與分析(data and analytics)技術領域內的主要趨勢之一,并有可能在未來三到五年帶來重大顛覆。目錄一三零售行業的發展現狀和需求新一代位置智能-基于智能的位置數據四新一代位置智能-基于智能的應用工具五下一代商業智能的暢想二傳統位置智能的現狀和局限傳統位置智能的現狀和局限第一代產品Map(Base)Point、Line、AreaVisualizationStyleTools(圓、多邊形、距離、面積)Query、Label傳統位置智能的現狀和局限第二代產品傳統位置智能的現狀和局限2006開始應用GIS系統擁有200多個圖層全國覆蓋,大量聚客點大
4、量商業信息、情報和業務結合緊密,全國200多個市場人員使用傳統位置智能的現狀和局限目錄一三零售行業的發展現狀和需求新一代位置智能-基于智能的位置數據四新一代位置智能-基于智能的應用工具五下一代商業智能的暢想二傳統位置智能的現狀和局限基于算法的位置數據增強 方法論Enrich your data and add context with our value-added location data services:demographics,segmentation,routing and more.Process hundreds of millions of data points from
5、first、second、third partin the location analysis system.ANALYSE ToolsInteract with actionable dashboards and use geo-analytical algorithms to bring previously buried patterns and correlations to the surface.MAP&DISCOVERRadically shorten the time-to-insight to uncover root causes,improve operational p
6、rocesses,anticipate customer needs,find new areas of profitable growth and more.PREDICTENRICH Data基于算法的位置數據增強 如何用算法提高數據密度GPS基站WIFIWIFI數據在可定位數據中占較大的部分基于算法的位置數據增強 如何用算法提高數據密度設備的連接行為以一個月內0到23小時對應的連接天數來表征,共24維,Double類型,也就是說我們基于這24維特征進行聚類分析。常用的聚類算法有基于距離(相似度)的K-Means及其變體,基于密度的DBScan等,DBScan常用于位置點的聚類,能夠識別出
7、異常點作為噪聲,K-Means算法是通用的聚類算法,通過計算樣本之間的距離(相似度)來聚類,目標是使得簇內距離盡可能小,簇間距離盡可能大?;谒惴ǖ奈恢脭祿鰪?如何用算法提高人口數據精準度單臺設備采集數據離散位置點離散位置點(共11個)紅色:夜間采集點采集點(7個)藍色:日間采集點采集點(3+1個)基于算法的位置數據增強 如何用算法提高人口數據精準度引入聚類算法進行地理上聚合問題:海量的離散位置點離散位置點無法表達精確精確定位信息(例如居住定位信息(例如居住地、工作地地、工作地),需要聚合成有意義的點),需要聚合成有意義的點經過N輪(例子中是12輪)聚合,將數百個離散點離散點聚合得到3個聚合
8、點聚合點(符號表示)聚類就是按照某個特定標準(如距離準則)把一個數據集分割成不同的類或簇,使得同一個簇內的數據對象的相似性盡可能大,同時不在同一個簇中的數據對象的差異性也盡可能地大。即聚類后同一類的數據盡可能聚集到一起,不同數據盡量分離?;谒惴ǖ奈恢脭祿鰪?如何用算法提高人口數據精準度基于算法的位置數據增強 如何用算法提高人口數據精準度未經深度處理的人口數據經過深度處理的人口數據基于算法的位置數據增強 綜合性數據平臺整合整合打通三層核心數據,數據驅動量化決策打通三層核心數據,數據驅動量化決策品牌信息客流指數居住人口小區數據門店門址就業人口商圈圍欄房價地理底圖企業信息行政圍欄街道圍欄交通設施
9、年齡區段性別收入級別消費等級娛樂設施興趣消費偏好教育情況教育設施醫療設施路網信息職業信息區域內人跡行為信息基礎地理信息城市商業區域信息目錄一三零售行業的發展現狀和需求新一代位置智能-基于智能的位置數據四新一代位置智能-基于智能的應用工具五下一代商業智能的暢想二傳統位置智能的現狀和局限基于智能的應用工具-整體架構數字化選址決策輔助柵格化數據TD數據(TD Data)TD合作伙伴數據(3P Data)聚類算法分類算法回歸算法決策樹算法隨機森林算法機器學習業務數據互聯網數據(WWW)人口數據接口客流數據接口畫像數據接口商圈/網格畫像接口商圈/網格評估接口商圈/網格推薦接口多元數據存儲平臺數據增強平臺
10、模型運行平臺數據接口平臺應用工具基于智能的應用工具-算法的平民化 插值和平滑算法的民用化 無監督學習的平民化 交通大數據的平民化 機器學習和深度學習的平民化基于智能的應用工具-如何發現商業價值房價餐飲購物插值平滑算法,以商業思維補充空值 樣條化 高斯平滑 拉格朗日插值基于智能的應用工具-如何定義地塊屬性商業板塊觀測利用TalkingData POI數據,進行空間聚類,完全靠客觀手段對網格進行畫像純商業純住宅純辦公偏辦公純風景偏風景基于智能的應用工具-如何度量交通環境通達性問題利用交通大數據(立德空間),不出門就可以了解道路通達情況、監控現實世界客流變化基于智能的應用工具-如何觀測門前客流場景:
11、GPS采樣信號的質量會嚴重影響地圖匹配結果:采樣頻率的降低、定位誤差的加大、信號的丟失,都會使匹配的不準確性增加。這些情況在實際應用中經常出現??土鲃泳€問題基于智能的應用工具-如何綜合評估流量pk:option1option21.客流:option2店位相對option1店位人流均好性更強;2.交通動線:option2享有北向和西向的地鐵來客,而option1單純依賴于南向的地鐵來客。option1option2商圈生態pk:option2option31.商圈屬性:option2的覆蓋商圈配套構成主要是商業區,而option3的覆蓋商圈除了商業區外,還有大量的商業+住宅和辦公+住宅的復合配套
12、類型,較好地均衡了日間和晚間的客流。2.增益品牌:Option3店位正對著家樂福,還有鼎好商城一堆出口。option1option2option3option3option2基于智能的應用工具-如何加持人工智能根據百勝已經選址的網格,加入TalkingData30個維度的特征,學習出方程,落地區域選擇關鍵因子,找出城市中可選擇最集中的區域,并進行排序,推薦出最值得關注,最優先進入的區域,鎖定重點區塊目錄一三零售行業的發展現狀和需求新一代位置智能-基于智能的位置數據四新一代位置智能-基于智能的應用工具五下一代商業智能的暢想二傳統位置智能的現狀和局限下一代商業智能的暢想下一代商業智能的暢想站點選址
13、通過對地址的縱向與橫向多指標評估,衡量潛在的業務情況,給出指導建議與發展目標降低庫存通過銷售預測來指導進貨與庫存,在保證供給的前提下,進一步降低庫存金額,降低成本評估銷售目標通過對當前累計銷售額與未來銷售預期的預測分析,評估銷售目標的完成進度與質量。有需要的還可以及時調整銷售目標,做到敏捷運營。指導排產、配送準確的銷售預測,還能夠將預測數據倒推到生產、配送環節,指導排產、物流01020304指導人員排班通過分時段的銷售預測,來指導門店進行更為合理的數據化排班,最大化地利用人力成本,同時保障客戶消費體驗。0506預測顧客需求通過市場調查、專家意見等定性預測或基于市場營銷活動做因果模型預測,來預測客戶需求的產品與需求的量,挖掘客戶消費潛力下一代商業智能的暢想全國總計5000+門店最長提供未來21天SKU級別售賣量預測,平均每個門店接近100個SKU營業時間內30分鐘預測一次當日未來每15分鐘的售賣量,實時指導門店生產計劃最長提供未來90天訂單量與銷售額預測,優化原料供應、人員招募與排班大范圍細粒度準實時長周期機器學習建模實現銷售預測下一代商業智能的暢想少談些主義,多研究些問題大數據算法、模型