《騰訊燈塔&秒針系統:2018廣告反欺詐白皮書(17頁).pdf》由會員分享,可在線閱讀,更多相關《騰訊燈塔&秒針系統:2018廣告反欺詐白皮書(17頁).pdf(17頁珍藏版)》請在三個皮匠報告上搜索。
1、廣告反欺詐白皮書 2018 騰訊燈塔 / 秒針系統 聯合發布 2018廣告反欺詐白皮書 01 根據CNNIC統計,截至2018年6月,中國手機網民規模達7.88億,網民通過手機接入互聯網的 比例高達98.3%,同比增長3.2%。目前,中國每個手機網民下載使用的手機應用數量平均超過十個。 手機應用種類不斷增長,用戶規模不斷上升,使用場景愈加豐富。 以手機為代表的移動端設備已成為品牌和廣告主開展營銷、與消費者溝通的主要渠道。未來,品牌 和廣告主在移動廣告上投入的預算也將不斷加大。但與此同時,由于信息不對稱和數據可見性的缺 乏,移動廣告
2、欺詐問題愈加嚴重,甚至已經成為一種業務成本。Forrester最新研究報告表明,43% 的營銷人員表示在過去12月內因廣告欺詐所浪費的廣告預算有所增長,34%的營銷人員稱其移動廣告 預算約有超過一半被移動網站廣告欺詐和應用內廣告欺詐所浪費。 為凈化互聯網廣告市場、促進行業健康發展,騰訊燈塔、秒針系統和AdMaster于2017年4月攜手 成立了國內首個廣告反欺詐大數據實驗室,并于2017年10月聯合發布2017廣告反欺詐白皮書。 基于過去一年移動廣告欺詐的新情況和新變化,以及作弊方式和反作弊技術的變遷,騰訊燈塔和 秒針系統再度攜手,向行業推出
3、2018廣告反欺詐白皮書,旨在厘清當前國內移動營銷市場的廣告 欺詐情況、攻防技術及對策,以期推動移動廣告行業的透明度和規范化發展。 黑產的從業人員,既包括廣告作弊技術及服務的提供者,也包括廣告作弊方案的購買者。在廣告 投放領域長長的鏈條上,每一個角色都有可能成為黑產的相關者。黑產的作弊方式詳見2017年廣告 反欺詐白皮書。從2018年看,黑產流量總體比例與2017年基本持平,維持在15%左右。 1.1 行業大盤黑產趨勢 第一章 2018年數字廣告行業黑產概述 圖1 2018年黑產趨勢圖 / 數據出處:騰訊燈塔、秒針系統廣告反欺詐大數據實驗室 黑產比例 1月 18% 1
4、4% 10% 6% 2% 0% 2月3月4月5月6月7月8月9月10月11月12月 2018年數字廣告行業黑產概述 02 圖2 黑產響應速度 時間(小時) 0020406081012141618202224 調用量黑產量 1.2 黑產新趨勢 由于業界正義力量的不斷努力,黑產無節制擴張的勢頭一定程度上得到了遏制,黑產作弊門檻明 顯提高。2018年,黑產份子中“散戶”基本被消滅,集團化趨勢愈發明顯。集團化的黑產有明確的上 下游分工,有完善的技術服務配套保障體系,因此表現出更強大的戰斗力。 由于黑產有發達完善的情報、監控體系,和合理的軟
5、件架構,一般在運營活動上線當天,就會有 相應刷量軟件出現。黑產軟件架構較為合理,把底層基礎服務和上層應用相剝離,只需要修改上層應 用部份,就可以實現刷量。如圖所示,某業務2018世界杯活動上線四個小時內,就有大量黑產用戶開 始刷量。 黑產刷量軟件非常靈活,適用性極強,可對短信接收、線程、帶寬、頻率、開始時間、打碼方式 等進行設置。本文隨后將對黑灰產產業鏈從技術角度進行剖析。 2018廣告反欺詐白皮書 03 第二章 互聯網黑灰產業鏈技術剖析 基于上述對互聯網行業的分析,刷粉、刷量、工具軟件銷售等以及平臺相關的牟利方式已經形成 了環環
6、相扣的產業鏈。根據需求,服務一應俱全,從賬號商人、工具開發者到代理IP平臺、手機卡商、 接碼平臺等,每一層都有成熟的利潤獲取方式。本章將會從技術手段剖析黑產產業鏈的構成形式。 黑產盈利直接模式有三種:引流變現、搬運工薅羊毛以及刷量作弊。 引流變現:將用戶(目標消費群體)引至微信、直播等其它平臺,再以微商、詐騙等方式 深度變現。 搬運工薅羊毛:例如,當平臺有補貼等鼓勵活動時,采集其它平臺優惠/活動信息,修改 上傳;有時搭配作弊沖擊平臺的各項指標,騙取現金獎勵。 &
7、nbsp; 刷量作弊:虛假新增、激活用戶、刷粉、刷點贊、刷播放量等數據賺取現金。 如下圖所示,這三種盈利方式都處于整個產業鏈的最下游。上游環節的開發者、卡商、代理等 高度重合。這說明了黑產上、中游的技術提供商具備平臺化的開發和銷售能力,能夠為花樣繁多的 作弊手段提供通用化的解決方案。下文將會就黑產產業鏈的技術形態進行詳細說明。 圖3 黑產產業鏈 2018廣告反欺詐白皮書 代理IP群控平臺注冊機接碼平臺 開發者手機卡商 卡源卡商貓池 跳轉號盜號掃號養號 引流 詐騙、吸粉 微商等 薅羊毛 平臺補貼 刷量 播放量、點贊 評論、收藏等 互聯網黑灰產業鏈
8、技術剖析 04 2.1 手機卡商 手機卡商,能夠為接碼平臺和黑灰產從業者提供大量手機號,用以各種虛假注冊、認證業務。這些 手機卡被稱為黑卡。其上游主要是卡源卡商及貓池為其提供服務。 2.1.1 卡源卡商 1、卡源卡商通過各種渠道(如:開皮包公司、與代理商打通關系等)從運營商或代理商那里辦 理大量的手機卡,然后加價轉賣給下游卡商賺取差價,他們掌握著手機黑卡貨源。根據反向追蹤調 查,卡源主要有: 物聯網卡: 無須實名認證,主要用于工業、交通、物流等領域。物聯網卡需要以企業名義辦理,卡 商以千元左右的價格可輕易購得“營業執
9、照”進行辦理,且一張營業執照幾乎對辦理數量不做限制。 實名卡: 這種卡多為從網上收集大量身份證信息批量認證得來。 海外卡: 由于實名制的原因,16年下半年開始,大量緬甸、越南、印尼等東南亞卡開始進入國內 手機黑卡產業。這些卡支持GSM網絡,國內可直接使用,無需實名認證,基本是0月租,收短信免費, 非常切合黑產利益。 2、貓池廠家 貓池廠家負責生產貓池設備,并將設備賣給手機卡商使用。貓池是一種插上手機卡就可以模擬手 機進行收發短信、接打電話、上網等功能的設備,在正常行業也有廣泛應用,如郵電局、
10、銀行、證券 商、各類交易所、各類信息呼叫中心等。貓池設備可以實現對多張手機卡的管理。 圖4 貓池 2018廣告反欺詐白皮書 05 黑灰產從業者為了隱藏自己的真實IP,同時也為了繞過甲方的IP風控策略,需要大量的IP資源 (比如代理IP)作為跳板,進而發動作弊。用于作弊的IP,即指黑IP。 全球IPv4總數約為43億,美國擁有30%以上,美國的黑IP數量占比36.39%,遙遙領先其他國 家。發達國家的黑IP數量要多于發展中國家,可以簡單理解為,發達國家擁有更多的互聯網設備,也 就擁有更多的IP資源,所以黑IP的數量與
11、互聯網設備的數量成正比。 從黑IP來源城市數據看來,上榜的城市都是經濟較為發達的城市。 圖5 全球黑IP來源國家TOP20 圖6 全球黑IP來源城市TOP 10 2.2 黑IP 2018廣告反欺詐白皮書 美 國 中 國 日 本 英 國 德 國 韓 國 法 國 巴 西 加 拿 大 意 大 利 澳 大 利 亞 荷 蘭 俄 羅 斯 印 度 西 班 牙 南 非 墨 西 哥 瑞 典 埃 及 波 蘭 35.39% 9.07% 4.83% 2.93% 2.89% 2.62% 2.24% 1.98% 1.54% 1.28% 1.20% 1.19%1.07% 1.00%0.77% 0.
12、74%0.68% 0.65% 0.53%0.49% 北京 休斯頓 亞特蘭大 圣地亞哥 洛杉磯 上海 劍橋 阿什本 紐約 印第安納波利斯 0.73% 0.56% 0.54% 0.45% 0.39% 0.37% 0.32% 0.29% 0.28% 0.25% 互聯網黑灰產業鏈技術剖析 06 2.3 接碼平臺 接碼平臺負責連接卡商和羊毛黨、號商等有手機驗證碼需求的群體,提供軟件支持、業務結算等 平臺服務,通過業務分成獲利。接碼平臺很多,活躍的有數十家,部份接碼平臺可以接語音驗證碼。 2016年11月,當時最大的接碼平臺被警方查處后,很多平臺轉入地下。平臺一般會提
13、供客戶端和API 接口,接口可以用來對接自動化的工具。根據使用項目的不同(如一些項目只需要識別短信中的驗證 碼,一些卻需要發送短信進行驗證),平臺會合理安排手機卡的使用,用戶也可以選擇在平臺上對接 專屬卡商,既能節省成本,又能提高自己使用黑卡的質量。 接碼平臺上的項目數量和單價,可以側面體現平臺賬號批量注冊的嚴重程度以及繞過手機號驗證 的成本。 圖7 接碼平臺 圖8 接碼平臺報價 2018廣告反欺詐白皮書 07 群控系統的使用是為了避過平臺對設備的檢測。即采用電腦來控制多部移動設備,如下圖為針對 iPhone的群控系統,能夠讓連接
14、的多部手機根據既定腳本批量執行操作。對于賬號注冊部分,系統集 合了過滑動驗證、自動獲取填寫驗證碼、修改資料等功能。 每臺設備會存在注冊賬號數量的限制,這時會結合改機軟件來解決。改機軟件通過劫持系統函數, 修改UDID、IMEI、SSID、定位等設備信息的,使平臺檢測認為是新的手機。 上述平臺結合了一鍵新機工具,該工具除了修改設備信息,還提供一鍵新機、多開、全息備份等 功能。只對勾選的app更新設備參數,能夠導出參數備份信息,為跨機共享和恢復某賬號設備環境提 供便利。 使用群控系統時,每部手機都會安裝既定的Lua腳
15、本去執行觸摸,滑動,輸入文本等操作,使用 者可以根據不同目的找開發人定制專門的腳本。群控系統、腳本和改機工具結合使用,再接入接碼平 臺和代理IP,就可以高效的產出質量過硬的號碼。這種方式完全模仿真實用戶,較難分辨。廠商可以 從“虛假號碼”、黑IP、用戶行為及進入app后的操作順序等角度著手判斷。 圖9 群控系統 2.4 群控系統 2018廣告反欺詐白皮書 互聯網黑灰產業鏈技術剖析 08 2.5 注冊機 注冊機多是自動化批量注冊的工具,多是采用易語言進行開發,在Windows下運行,技術手法有 兩種: 模擬操作類:通過控件操作瀏覽器
16、元素實現,真實加載注冊頁面,模擬用戶操作。 協議破解類:通過HTTPS協議實現,破解注冊接口協議,直接帶參數調用注冊接口實現注冊。 手機號資源自然是從接碼平臺獲取,IP資源使用ADSL撥號(使用VPS掛機操作等),這背后也 有一條完整的產業鏈支撐。大多注冊機的速度可達到幾十秒注冊一個賬號,為下游的各個細分產業提 供大量的小號。 有些平臺的策略會對這類賬號造成影響,即有些注冊機出來的號碼,幾天內會失效,但仍可以 對接“直接用量懟的項目”,一般會采用預定方式售賣賬號,隨買隨用。 圖10 注冊機 2018廣告反欺詐白皮書
17、 09 除了直登號外,跳轉號也是常見的號碼。指使用QQ號、微信號、微博號等快捷登錄后,激活綁定 而轉化而成的平臺賬號。這里使用的賬號并非正常賬號,而是稱為授權號的特殊賬號,這種賬號在原有 平臺質量很低,無法進行大部分業務。所以只用作授權其他平臺,購買成本僅幾分錢。 在互聯網灰產領域,許多工作室依賴注冊和販賣各種賬號生存,這些賬號已經成為了具有廣泛銷 量的基礎資源,再流入各個細分產業鏈。小號雖小,卻要在風控戰場上引起大的重視。 老號指有一定注冊時間、自身帶有權重的號碼,有的還帶有一定的粉絲與作品。這類號碼被認
18、為 不易封號,在市場上受歡迎。老號和帶有一定權限等級的號碼,一般是采用這三種方式得到的: 盜號:主要方式是釣魚。如發布二次打包的軟件將某些軟件打包加入自己需要的功能,當用戶使用 這些動過手腳的軟件時,黑客就會收到他們的賬戶名、密碼 。 掃號:方法有兩種:1、用接碼平臺的手機號作為用戶名,遇到注冊過的直接修改密碼,這種屬于 黑吃黑,拿走了別人批量注冊的號碼。2、使用其他手段獲取大量賬號名,加上弱密碼,去逐一驗證, 這種賬號一般是真實用戶,對平臺傷害較大。 養號:號商注冊后模仿真實用戶進行一些操作,將號碼養老的行為。大多
19、是為了提高賬號的權重, 以方便之后的黑產項目,對平臺傷害較大。 圖11 跳轉號 2.6 跳轉號 2.7 盜號、掃號和養號 2018廣告反欺詐白皮書 第三章 黑產具體案例 黑產團隊的行為動作都和經濟利益息息相關。黑產往往會從成本最低、阻力最小的方式切入,碰 到阻力時,就會升級為成本更高的方式。 當業務的產品邏輯出現漏洞時,黑產往往會傾向于優先利用產品邏輯漏洞得利。這種方式成本最 小,甚至法理上也占優。如,業務如果沒有限定一臺手機一個賬號只能參加一次抽獎活動,黑產可能 會利用這一漏洞,反復在一臺手機上用多個賬號登錄。不需要基本的技術、
20、硬件門檻,這種方式對于 黑產而言成本最低。由于有一定的技術門檻,而又不需要真實設備的投入,模擬器的報價往往高于利 用業務漏洞,而低于真機假用戶。由于有實際手機的占有成本,真機假用戶的成本會高于模擬器。作 弊成本最高的方式是人肉作弊。據騰訊燈塔情報部門分析可知,當個人獲利小于3元時,人肉眾包的方 式很難持續下去。(模擬器、真機假用戶的定義可見2017年廣告反欺詐白皮書) 下面以某產品在某次運營活動當中所經歷的攻防對抗來對黑產活動進行分析。 如圖13所示,在本例中,由于產品邏輯沒有明顯漏洞,黑產直接跳過第一步,進入模擬器的形式。 燈塔反作弊模式相
21、應啟動,對模擬器作弊形為進行了打擊。 在模擬器的作弊形式受到打擊之后,黑產一邊向該業務客服發起惡意投訴,試圖通過大量投訴的 方式迫使該業務放棄打擊;一邊將作弊方式轉移到成本更高的真機假用戶,試圖躲避打擊。真機假用 戶同樣是在騰訊燈塔的打擊范圍內,黑產份子沒有得逞。同時,騰訊燈塔利用大數據對投訴進行畫像 分析,發現大量投訴都源自于黑產團伙的惡意投訴。 黑產份子沒有死心,仍然一邊惡意投訴,一邊試圖用人肉的方式進行作弊。騰訊燈塔同樣利用多 業務交叉分析、畫像分析,準確判斷出惡意份子。由于人肉的方式成本過高,黑產份子受到打擊后, 發現沒有太多的利益可
22、圖,就自行退卻了。 圖12 黑產攻防對抗演化 圖13 黑產演化實例 黑產具體案例 10 3.1 和黑產在經濟層面、技術層面上的雙重博弈 2018廣告反欺詐白皮書 業務漏洞模擬器真機假用戶人肉 作弊量 6/126/136/146/156/166/176/186/196/206/21 模擬器真機假用戶人肉 某日用消費品廣告主投放在A媒體上的視頻貼片廣告代碼,在B媒體的新聞頁面后臺進行刷量。 經排查發現,B媒體后臺添加了A媒體的貼片廣告代碼。當用戶打開B媒體頁面時,就后觸發多條A媒 體視頻貼片播放代碼,但不會出現視頻貼片播放。 通過這樣的形式,黑產用劣質流量替換了優質流量
23、,實現了超額的收益。 3.2 偷天換日,劣質流量替換優質流量 圖14 某媒體用劣質流量替換優質流量 11 2018廣告反欺詐白皮書 用戶自然屬性 LBS屬性 終端屬性 興趣愛好 瀏覽興趣 APP興趣 IP興趣 游戲興趣 關鍵詞 數據整合/校驗小號/養號庫黑設備庫黑IP庫 軟硬環境異常 稽核反饋 虛假設備 非法賬號 惡意篡改 系統劫持 群控刷量 硬件特性通用模型 系統劫持檢測模型 群控檢測模型 模擬器檢測模型 眾包檢測模型 內容檢測模型 非法引流識別模型 話術模式識別模型 違規文本/圖像識別 業務特性模型 賬號非法共享/交易檢測模型 用戶行為序列異常檢測 賬號關系模型 內嵌燈塔SDK
24、 業務策略后臺 燈塔稽核服務接口 燈塔基礎數據 數據轉換海量欺詐信息庫 集市數據 基 礎 屬 性 用 戶 標 簽 業務自定義上報數據 情報數據 公司內外部反欺詐數據共享 業務移動 客戶端 業務策略命中 TAF接口 啟動事件數據 數據清洗/加工黑白樣本基準庫 用戶業務特性數據 黑產探測 LS接口 行為相關數據 燈塔策略命中 HTTP接口 稽核事件數據 業務消費流水 產業動向信息爬取 離線接口 軟硬環境數據 Android SDK 查特征集合殺特征集合驗特征集合 iOS SDK JS SDK 燈塔反作弊體系構架 第四章 應對方法及安全建議 燈塔智能反作弊框架是一套基于終端
25、識別技術與+云端交叉驗證,利用AI技術建立查模型、殺模 型、驗模型三管齊下的實時反作弊體系。燈塔智能反作弊引擎擁有燈塔積累10億終端用戶畫像,占國 內活躍終端的90%以上,占新增終端80%,在此基礎建立六大緯度1000+異常特征圖譜,積累了億級 山寨機和黑IMEI庫,同時結合獨有終端防偽技術和業界首創的查、殺、驗技術架構,最大限度提升覆 蓋率、及時性、準確性,有效提高反作弊防范強度和識別精度。 4.1 燈塔反作弊解決方案 圖15 燈塔反作弊解決方案 創新性技術探索 4.1.1 提出獨有終端指紋識別方案 1、不同于市場上單一產品終端身份生成方案,終端指紋技術基于騰訊移動
26、領域積累多年的產品大 數據,100+頭部App數據,以及涵蓋社交、游戲付費、垂直領域的業務數據交叉驗證,有效解決反作 弊的冷啟動問題。 2、與業界僅依賴終端應用層信息相比,燈塔智能反作弊的終端指紋,深度覆蓋了硬件層、系統核 心和系統調用庫層、應用框架層3個層面,配合云端離線分析、終端實時身份請求系統,保持終端指紋 的高度一致性; 應對方法及安全建議 12 2018廣告反欺詐白皮書 3、結合文件系統識別、指令逃逸檢測、內存反饋式檢測和系統關鍵函數字節碼檢測等技術,終端指紋 識別方案有效覆蓋模擬器、偽造/篡改設備信息、系統劫持以及虛
27、假激活等作弊場景的篡改用戶身份的 作弊行為。 4.1.2 業內首創的查殺驗技術架構 與業界常規的基于規則的反作弊方案不同,燈塔反作弊提供查-殺-驗一體的綜合解決方案,能夠 從作弊發現、作弊稽核/取證以及作弊驗證三個環節實施全程監控,并且查-殺-驗模型之間的交叉驗證 形成新作弊場景探測與學習,完成作弊強特征發現與利用以及打擊效果驗證之間的閉環。 1、查模型:作為燈塔反作弊解決方案的第一層保障機制,查模型涵蓋內核/網絡層、系統層、應 用層以及用戶行為層4個層次的異常檢測,能夠快速全方位地捕抓到用戶的異常情況。 2、殺模型
28、:作為燈塔反作弊解決方案的核心環節,殺模型基于規則模型和多項專利反作弊算法模 型為業務提供作弊識別和作弊舉證服務,輸出按惡意等級區分的用戶粒度識別結果。同時,殺模型輸 出高質量的用戶標注數據,為實時反作弊系統與離線反作弊的融合提供基礎。此外,查模型和殺模型 之間交叉驗證,為殺模型的準確度和覆蓋度評估提供依據。 3、驗模型:驗模型作為反作弊系統的效果評估體系,直接與業務運營系統打通,抽取業務的關鍵 指標,分別抽樣評估查模型的異常覆蓋能力以及殺模型識別準確度。此外,驗模型還提供異常用戶打 擊前后業務關鍵指標的波動檢測。 4.1.3 反作弊模型海量數據處理能力
29、 反作弊模型每天處理涉及用戶使用行為、付費應用、社交應用、商品數據等10大領域的數據,每 天處理5億活躍終端,30億+App啟動數據,40億+廣告數據,500億+的App行為數據。 4.1.4 適用于內外部的平臺化數據服務接口 燈塔反作弊解決方案普適性強,基于SDK+API的通用解決方案,接入成本小,可覆蓋渠道推廣反 作弊、運營數據統計質量優化、業務反垃圾、營銷活動防刷、廣告反作弊等場景。 13 4.2 業內反作弊技術最新動態 4.2.1 深度神經網絡與圖的結合 近十年,深度學習成為人工智能和機器學習的研究熱點,在聲學
30、、圖像和自然語言處理領域展示 了頂尖的性能。深度學習提取數據底層復雜模型的表達能力收到廣泛認可。著名的卷積神經網絡 (CNN)是一種常用的深度學習模型,其研究對象限制在Euclidean data。最顯著的特征就是有規則 的空間結構,例如,圖片是規則的正方形柵格,語音是規則的一維序列。這些數據結構能夠用一維、 二維的矩陣標識,CNN對這些數據的處理效率很高。 但是,現實生活中有很多數據并不具備規則的空間結構,稱為Non Euclidean data。比如推薦 系統、電子交易、計算幾何、腦信號、分子結構等抽象出的圖譜。這些圖譜結構中的每個節點連接都 不盡相同,有的節點有
31、三個連接,有的節點有兩個連接,是不規則的數據結構。 所以,如何利用深度神經網絡進行圖數據分析的問題吸引了眾多研究人員的關注。將傳統深度學 習架構應用于圖結構存在如下挑戰: 1、不規則領域:圖像、音頻和文本具備清晰的網絡結構,而圖結構則屬于不規則領域,這使得一 2018廣告反欺詐白皮書 隱藏層 輸入 ReLUReLU 輸出 隱藏層 些基礎數學運算無法泛化至圖。例如,為圖數據定義的卷積和池化操作并不是直接的,而這些CNN中 的基礎操作。 2、多變的結構和任務:圖具備多樣化的結構。例
32、如,圖可以是同質的,也可以是異質的;可以加 權,也可以不加權;可以有符號,也可以無符號。此外,圖任務也有很多種,節點問題包含節點分類 和連接預測,圖問題包含圖分類和圖生成。 3、可擴展性和并行化:在大數據時代,實際的圖數據很容易擴展成數百萬的節點和邊,如社交網 絡或電商網絡。因此,如何設計可擴展模型并最好使其具有線性時間復雜度,成為了研究的關鍵。此 外,由于圖中的節點和邊是互連的,通常需要作為一個整體來建模,因此如何實施并行化計算是另一 個關鍵問題。 4、跨學科:圖通常與其他學科有關,如生物學、化學或社會科學。這種跨學科的性質為圖的應用 提供
33、了機會和挑戰。領域知識可用于解決特定問題,但集成領域知識可能提高模型設計的難度。 深度神經網絡應用于圖數據的方法主要分為半監督方法和無監督方法:GNN和GCN是半監督方 法,它們利用節點屬性和節點標簽端到端地訓練模型參數,GAE是無監督方法。模型的輸入是將要學 習的圖G=(V,E),經過一層一層的計算而發生變化,最后輸出一個圖結構,該圖結構是一個節點 級別的特征參數矩陣。 應對方法及安全建議 14 圖16 帶有一階濾波器的多層GCN示意圖 示例:眾包作弊用戶檢測場景下深度神經網絡與圖的應用 下面結合眾包作弊用戶檢測場
34、景來說明圖的建模和深度學習在圖方面的應用。 結合問題進行圖建模:以用戶為圖中的節點,用戶的特征為節點的屬性,評論過相同App的用戶 之間建立邊關系,如圖16所示。 根據圖結構的特點選擇模型:GCN模型能夠同時對圖中的節點特征信息和結構信息進行端到端學 習,因此是當前場景下對圖結構學習任務的最佳選擇。 2018廣告反欺詐白皮書 圖17 基于圖的眾包作弊用戶檢測建模示意圖 15 4.2.1 區塊鏈技術在流量反作弊中的應用 從2016年開始,業界對如何利用各公司在不同場景中反作弊的優勢共建通用的無效流量過濾方案
35、 進行深入的研究。騰訊燈塔與MMA中國共同關注區塊鏈技術在廣告行業反作弊中的應用,在多次洽談 和交流過后,形成了該技術在廣告反作弊的落地方案。在此背景下,2018年7月,由MMA中國GIVT LIST工作組發起DIF(Distributed Invalid Traffic Filter)項目,騰訊燈塔作為DIF項目黑庫的最大 貢獻方參與到DIF項目的共建工作中。 黑名單 私鑰簽署 companyA 黑名單 私鑰簽署 companyB 黑名單 私鑰簽署 companyC 全網達成共識的 黑名單 公鑰簽署 companyD 加入/移除 智能合約自動運行 提交提議 提交提議 提交提議 下載 Fabr
36、ic & IPFS 圖18 DIF示意圖 2018廣告反欺詐白皮書 定位可疑用戶 APP可疑正常 定位可疑APP擴散可疑用戶 從圖18可以看出,每個成員企業作為一個節點可以隨時增量提交自己的黑產相關的數據并觸發智 能合約,成員可獲取自身和全網合并后的GIVT LIST。例如,某成員企業提交了黑設備號并通過了合約 中的背書閾值N,就可以影響聯盟中其他成員企業節點獲取到的GIVT LIST,DIF系統在區塊鏈上實時 記錄共識、實時合并,再也無須管理員手動執行合并。同理,如果要將某個黑設備號進行撤銷,同樣可 以由各個成員企業節點提交,觸發智能合約,獲得至少M個節點
37、背書同意,全網節點將自動更新。 結語 16 第五章 結語 在中國數字廣告市場,無效流量的攻防戰是一場持久戰,隨著制造無效流量的手段和技術的不斷升 級,打擊無效流量的技術和措施也在不斷更新。為了維護行業的健康發展,廣告主、媒體、代理公司、 第三方、行業組織等各方在防止和打擊無效流量上逐步形成共識。在行業組織、行業各方積極努力下, 中國無效流量監測向更加規范化、標準化的方向發展。2018年,互動廣告國家標準頒布,其中包含了 投放驗證要求;在中國廣告協會領導下,一般無效流量行業名單(GIVT list)正在制定中。騰訊燈塔和秒 針系統堅持遵循MRC、CMAC和MMA等公認的行業標準,并積極倡導行業標準的實施落地。雖然應 對虛假流量的“戰爭”還會繼續,但有了行業標準、行業各方的共同努力,2019年中國數字營銷生態 一定會更加透明、更加健康! 2018廣告反欺詐白皮書