1、20222022 年度虛假流量白皮書2022 Annual Fake Traffic report此白皮書基于極驗十年來覆蓋全球區域的行業數據,及相關行業報告信息,通過分享極驗多年來對抗黑灰產的行業了解與實踐,以及極驗作為虛假流量對抗領域先驅者的獨家經驗,與行業共勉。虛假流量定義及分布01虛假流量對各行業造成的欺詐風險05虛假機器流量常見偽裝及攻擊形式19極驗的對抗形式21虛假流量對抗實戰案例25行業預測及虛假流量未來趨勢29目錄2022 年度虛假流量白皮書完整版 掃描右邊二維碼 即可下載12022 年度虛假流量白皮書12022 年度虛假流量白皮書虛假流量定義及分布虛假流量定義虛假流量指的是黑
2、產團隊為獲得利益,在未經站點允許的情況下,通過自動化腳本,虛擬 IP,虛擬設備等途徑,在互聯網中模擬真實流量,高效執行大量的簡單化任務,來非法獲取數據信息利益的機器流量,其中最常見的是網絡爬蟲機器人。其對網站主的負面影響主要包括:占用網絡帶寬資源,攻擊網站獲取商業信息內容,盜刷短信轟炸攻擊,模擬真實用戶進行流量欺詐等。阻止機器流量主要通過全自動人機圖靈測試“驗證碼”技術來識別用戶。虛假流量已經成為互聯網時代信息化數字資產最大的威脅之一,據極驗最新行業數據統計,各個行業都有較高比例的虛假流量存在,機器流量最為泛濫的區塊鏈行業,某企業機器流量驗證比例高達 85.85%,全網機器流量占比 64.05
3、%,機器流量占比超半數,這一現象對于企業的運營決策和風險預估有著重大的影響,忽視流量欺詐問題可能會對企業造成間接的運營失誤困境以及直接的經濟效益損失問題?;凇叭藱C對抗”的產品理念,極驗搭建了一次真實的活動營銷場景發福利引流,吸引羊毛黨與真人同時搶奪用戶福利,以體現機器流量在真實活動中的欺詐場景。此活動只通過公眾號渠道發布,通過社交裂變的方式進行傳播。最初黑產只占極少部分,幾乎所有的福利都發放到了真人手中,等到黑產注意到此次活動,絕大部分獎勵都被黑產拿走。10 月 25 日,參與抽卡的黑產數量只占抽卡總數的 2.36%,但被黑產領取的獎勵卻占獎勵總數的 63.2%??梢姾诋a擁有極高的攻擊效率。
4、而在 10 月 27 日增加防護手段后,黑產領獎的比例驟降。以該活動數據估算,忽視機器流量欺詐至少會造成 60%以上的業務運營損失。22022 年度虛假流量白皮書22022 年度虛假流量白皮書虛假流量地域分布虛假機器流量在不同區域省市中,占所有流量的比例也存在一定差異,與當地互聯網發展水平,經濟發展水平等因素有一定的關聯性,從極驗近半年的機器攻防中得到以下數據。此數據為機器流量總量排名 TOP 10 的省市。數據顯示,機器流量占比最高的地區在北京,占比接近百分之 70%,其次是上海。北京作為重要的經濟、政治中心,其地區所屬互聯網平臺的流量中虛假流量占比極高,一方面是因為黑產的趨利性,會自動流向
5、互聯網行業發展比較成熟的地區,北京作為國內互聯網行業最發達的城市,自然首當其沖。而上海地區作為又一重要的經濟樞紐城市,具備發達的互聯網行業基礎,有著虛假流量滋生的天然土壤,此外作為重要的金融中心,數字金融欺詐問題也屢屢發生。2022 年 4 月 3 日最高法中國司法大數據研究院發布的金融詐騙司法大數據專題報告中,廣東福建由于制造業寒冬導致電信欺詐高發,穩居榜首,上海緊隨其后成為金融詐騙的高發地區,因此上海也是虛假流量占比極高的城市之一。32022 年度虛假流量白皮書32022 年度虛假流量白皮書常見黑產業務攻擊場景一、惡意機器流量欺詐機器流量指的是互聯網中爬蟲程序、自動化腳本程序、模擬器等非真
6、實用戶帶來的流量,通常分為正常機器流量(Good Bot)或惡意機器流量(Bad Bot)。危害互聯網業務安全的主要是惡意機器流量,這部分流量會通過偽造真實流量對一些網站,程序進行內容截取、業務攻擊以及流量灌水等操作。極驗基于十年來多行業,全渠道覆蓋的數據,得出以上市場流量占比。機器流量占比共 64.05%,其中大部分為惡意的欺詐機器流量,占比 52.12%,這部分流量會無效占用網站帶寬,并且侵占平臺的用戶資源,影響正常的運營環境。而真實用戶流量占比 35.05%,在所有流量中不足一半,僅占 3 分之 1 左右。在網站不加防護的情況下,訪問流量中真人的比例將遠低于機器流量,網站更像是在為黑產提
7、供“服務”,被欺詐流量操控平臺環境。42022 年度虛假流量白皮書42022 年度虛假流量白皮書二、撞庫攻擊“撞庫”指的是黑客通過收集互聯網已經泄露的用戶和密碼信息,生成對應的字典表,嘗試批量登錄其他網站,得到一系列對應可以登錄的賬號。數據隱私泄露問題一直是互聯網安全的一個焦點問題,基于賬號信息泄露,黑產可以通過“撞庫”攻擊高效獲取有價值的平臺賬號,進而奪取賬號內數字資產,通常各站點會設置風險操作二次驗證的方式來核實用戶身份。撞庫攻擊基礎就在于“拖庫”,拖庫原指數據庫中的術語,從數據庫中導出數據。在網絡安全領域專指的是黑產黑客利用 Web 應用漏洞、Web 服務器漏洞、木馬攻擊、XSS 劫持等
8、方式竊取用戶數據,然后通過自動化程序來進行撞庫攻擊。此外也有黑客將通過入侵網站獲得的賬戶信息,通過技術手段將這些賬戶信息分類,然后通過“洗庫”的方式售賣變現,形成黑產的一種交易鏈條?;ヂ摼W數字資產已經與許多人的真實資產進行了深度綁定,賬戶安全也不止威脅到了企業的運營安全,也威脅到了各個平臺上用戶的資產安全,如不進行有效防護,會極大地影響到用戶信任度與安全感。三、短信轟炸短信轟炸指的是,一般不以直接獲取利益為目的,而是基于攻擊競爭對手的目的,批量盜刷短信?;蛘呃酶鱾€平臺獲取大量驗證碼對用戶發送重復的垃圾短信,進行騷擾。主要存在兩種場景,一種是針對普通 C 端用戶,黑產通過搜集互聯網上多個未經防
9、護的網站短信接口,設定要轟炸的用戶手機號進行模仿,頻繁向后臺發送短信驗證碼發送請求,該用戶會受到持續頻繁的大量短信驗證碼。另一種是針對網站方,在某個新模塊上線,或者未設防護的網站,黑產通過惡意調用短信接口,大量請求訪問造成短信驗證碼的發送,短信發送量急劇增長,而運營方也難以區分真實用戶或是黑產,不能夠直接關閉接口,直接造成大量資源浪費與經濟損失。這種攻擊通常通過安裝人機識驗證碼 CAPTCHA(中文全稱是全自動區分計算機和人類的圖靈測試)來實現防護,阻礙短信接口被頻繁盜刷。52022 年度虛假流量白皮書52022 年度虛假流量白皮書虛假流量對各行業造成的欺詐風險信息時代,數據即價值,線上數據與
10、線下業務的深度結合,同樣也給黑產創造了許多可攫取利益的場景,面對這些利益黑產會伺機而動,以下將以各行業線上交互場景為例,列舉虛假流量對于各行業的欺詐風險。金融證券類行業:在金融信息化的大環境下,金融證券類行業的服務及資產逐漸從線下轉移到線上,金融行業自帶的高收益屬性逐漸吸引了更多黑產的注意力,金融行業所面臨的安全威脅日趨復雜和嚴重。據全球反詐騙聯盟(GASA)與 ScamAdviser 聯合發布2022年全球詐騙狀況報告數據,21 年金融詐騙增加了 10.2%,詐騙損失的金額也增長了 15%以上,從 2020 年的 478 億美元增加到 2021 年的 553 億美元。金融欺詐問題依然嚴重,而
11、其核心隱私泄露問題與虛假流量息息相關。金融行業主要存在以下四個行業安全問題:一、撞庫攻擊導致信息泄露金融行業,尤其是銀行,其強資產屬性和高風險性綁定,用戶數據信息關系到數字資產的安全,其登錄場景是安全防護的第一道關卡,撞庫攻擊高發于此場景,互聯網社會信息泄漏嚴重,許多用戶安全意識薄弱,賬戶密碼都設定為同一套使用,黑產在暗網購買或者其他平臺盜取而來的用戶資料數據,進行數據庫關聯匹配社工庫,從而刻畫出精準的用戶畫像,針對特定人群進行犯罪活動騙貸、不良貸款、套現等危害。二、消費爬蟲爬取用戶信息第三方理財平臺,理財產品爬蟲,或競爭對手的爬蟲,竊取用戶的余額,消費數據,信貸數據等敏感數據,進行惡意競爭。
12、敏感信息泄露會危及企業的信息數據安全,而這些高風險行為背后則是黑產團伙的利益交換,企業重點客戶敏感信息得不到保障。62022 年度虛假流量白皮書62022 年度虛假流量白皮書三、黑產營銷欺詐薅羊毛銀行商家會不定時發布各類運營優惠活動,黑產通過批量注冊賬號,占據運營資源,薅企業羊毛,讓企業直接損失運營資金,并且由于黑產賬號可以通過數百倍于真人的速度搶占活動資源,導致運營活動引來的流量幾乎都是機器流量,真實用戶無法獲得活動福利,達不到實際的引流效果,在增加成本和降低引流兩個維度,大大降低運營轉化比。四、關鍵接口被劫持濫用金融行業線上與用戶的交互場景多為登錄、查詢、交易等高風險場景,同時也意味著用戶
13、需要多次進行交互校驗。關鍵交互接口被濫用可能會嚴重影響到企業的運營與客戶信任。不加防護的交互界面容易被黑產劫持濫用,關鍵接口被劫持后,用戶的二要素,三要素等信息則會有泄露的風險,如用戶遭遇短信轟炸,會極大影響對品牌的信任與觀感。此外黑產同樣通過這些交互場景,不斷請求網站短信服務,也會增加公司的校驗成本,黑產占據短信接口的數量遠比正常用戶的請求量大,增加運營成本的同時,增加系統負載,影響正常用戶的體驗。72022 年度虛假流量白皮書72022 年度虛假流量白皮書電商類交易行業:電商行業作為高用戶請求,高交易交互的代表行業之一,也是虛假機器流量欺詐的重災區。疫情為“宅經濟”創造了新的增長機遇,各大
14、電商平臺抓住機遇,在眾多競爭對手中拋出自己的營銷手段,擴大促銷的活動力度,而在交易的繁榮現象背后,電商行業面臨的業務風險也在不斷增加。以網絡釣魚、羊毛黨為主的黑色產業正向著專業化、產業化的方向發展。從營銷拉新到注冊登錄,從下單支付到售后評論,各個環節都充斥著業務風險,包括虛假引流、垃圾注冊、賬號盜用、薅羊毛、信息泄露等,形形色色的黑產攻擊手段讓電商業務防不勝防。業務安全損失動輒上億,企業資源成本消耗嚴重,活動運營數據失真,無法達到良好的引流效果。場景一:薅羊毛電商行業是羊毛黨聚集最多的地方,借由各個 QQ 群、微信群、微博等社群平臺組織,數十萬羊毛黨共同圍獵電商巨頭,今年(2022)雙十一截止
15、 11 號晚,各平臺銷售額占比分別為:天貓占比 62.6%,京東占比 27.1%,拼多多占比 6.7%,其他占比 3.6%。據星圖數據顯示,今年雙十一 GMV(Gross Merchandise Volume 成交總額)達 11154 億元,同比去年增長 15.57%,同時新型電商占比增長,綜合電商自去年占比 83%下降至 72%,而這期間會有 70%-80%的優惠券,促銷優惠被羊毛黨薅去,從而賺取其中優惠差價,商家用于引流的營銷投入,大都被羊毛黨薅去。場景二:刷單電商展示基于商家購買交易量、好評量等數據,根據平臺的賽馬機制,只有表現比較好的商家才能展示在前列,所以電商平臺中商家為了能夠獲得前
16、列展示,將刷單作為了搶位置的主要手段。據央視新聞報道,2022 年 7 月,雞西市公安局網安部門發現一些平臺以“兼職刷單”等幌子招攬網民為商家刷單,進而誤導消費者,影響電商平臺運營。8月,專案組一舉摧毀黑產集團,抓獲主要違法犯罪嫌疑人 46 人,現場扣押電子設備 135 個,涉案金額 2.2 億余元,8.4 萬余名“刷手”遍及全國。而這可能只是冰山一角。刷單本質上是對平臺展示機制漏洞與監管困難共同導致的,競爭機制的出發點在于給予質量高評價好的商家更多的展示機會,優化流量資源分配,實現商家質量導向競爭,刷單行為致使平臺賽馬機制難以發揮效果,危害正常的平臺競爭,以及嚴重影響平臺的用戶體驗與信譽。8
17、2022 年度虛假流量白皮書82022 年度虛假流量白皮書場景三:套現套現也是電商行業黑產的常見手段,黑產中最為成熟的是利用刷單和“發空包”的方法進行平臺套現,因此也催生了不少打碼平臺、空包網等黑產公司。由于套現往往與刷單綁定,不少黑灰產通常同時操作兩種獲利模式,有賣家分飾兩角進行交易套現,也有買賣雙方合謀虛假交易套現,更有甚至會有一些黑灰產搜集線下商戶注冊信息,通過群內“刷手”套現,或向付款人按比例收取手續費等方式獲利。場景四:信息泄露電商行業信息泄露問題也頻頻發生。除交易中身份信息,銀行卡信息,支付數據信息等敏感資產數據之外,購買行為也會將個人住址,購買習慣等個人隱私數據公開,不法分子通過
18、批量交易個人信息獲利,不僅危害消費者資產安全,更有甚者還會危害到消費者人身安全。10 月 14 日,新加坡電商平臺 Carousell 向用戶公布了發生在本月 14 日的數據泄露事件,約有 195 萬用戶受到影響,占該平臺在新加坡總用戶數的 39%,據發言人稱,泄露的數據包括用戶電子郵件地址、手機號碼和出生日期等。而國內信息泄露問題也層出不窮,今年多家電商平臺個人信息泄露,據央廣網記者暗訪報道,眾多電商平臺個人信息以 0.35 元一條的價格批量打包售出,其信息包括聯系方式,住址,購物信息,身份信息等敏感信息,由信息泄露導致的營銷騷擾,電信詐騙問題嚴重影響消費者體驗。場景五:電商黃牛電商行業黃牛
19、也十分猖獗,相比于傳統黃牛產業,線上黃牛不再只靠人力或渠道關系搶占資源,而是利用自動化腳本等技術工具以遠高于正常人類效率的方式搶奪資源,例如在電商重要營銷節點上,網絡黃牛利用低價囤貨,而后轉手賣出,正常用戶難以搶到優惠產品,嚴重影響商家運營。此外,由于難以辨別流量的屬性,區分機器流量的成本較高,通過“暴力封號”的方式遏制黃牛的發展,極大可能影響到正常用戶,出現“誤封”、“錯封”問題。通常黃牛的賬號成本遠遠低于正常用戶,這種封號方式不僅無法有效解決黃牛問題,還有引來大量正常用戶的反饋與投訴。92022 年度虛假流量白皮書92022 年度虛假流量白皮書場景六:支付漏洞電商支付漏洞包括:商城惡意虛開
20、發票,黑產篡改數據大量購買商品造成資產損失,以及平臺不規范導致商家跑路等。2019 年“凈網專項行動”中,重慶警方破獲一起利用電商平臺支付漏洞獲利的案件。嫌疑人通過兩個賬號之間轉賬時抓包的相關數據,修改轉賬數值參數,不斷重復操作,累計可變現的積分,然后通過第三方交易平臺通過消費變現,為了“炫耀”自己的技術,將方式共享給其他成員共同實施非法獲利,涉案套現 140 余元。據2022 上半年小程序互聯網發展白皮書顯示,微信、支付寶、抖音、快手等多個平臺小程序數量超過 750 萬,日活躍用戶數量超過 7.8 億。雖然傳統電商平臺通常會設置平臺方賬戶托管機制,但電子商務法等相關法規并未明確要求電商平臺建
21、立第三方資金監管制度,許多平臺小程序仍未明確設定相關保障制度,在交易額與活躍量日增的情況下,風險也隨之增長。102022 年度虛假流量白皮書102022 年度虛假流量白皮書直播視頻類互動型行業:直播行業早在短視頻平臺興起前,08 年至 15 年就有比較興盛的發展,從娛樂化到專業化的發展,直播行業逐漸形成了比較穩固的標準與規則,直播平臺流量快速增長,除傳統的直播平臺外,許多短視頻平臺也開始開拓直播板塊,例如當前抖音,快手,bilibili 等視頻平臺,并形成以直播電商為主的直播行業商業變現新道路。據中國演出協會中國網絡表演(直播)行業發展報告顯示,2021 年直播行業市場規模達 1844.42
22、億元,但限于流量成本趨高及行業競爭加劇,資本布局趨于穩定,投融資放緩,但產業鏈逐漸深化細化發展,開辟出行業新態勢,行業從快速增長到趨于成本,不少平臺目標也將流量增長轉到存量開發。直播行業中存在的問題主要為以下幾項。問題一:帶寬成本較高直播資本市場萎縮,但不代表直播流量減少,自 17 年到 21 年底,直播用戶規模從 4.22 億人增長至 7.03 億人,并且直播行業由于實時互動,以及不定時的直播高峰,會經常面對巨大流量帶來的帶寬成本。按直播平臺日峰值達到 100 萬人,碼率按 800K 計算,則其帶寬費至少要達到 2400 萬/月(月峰值帶寬 30 元/Mbps,100 萬*800K=8 億
23、K80 萬 Mbps,2400 萬 RMB/月),真實直播日峰值遠不至于百萬/天,甚至可以達千萬,每月僅帶寬成本上億。以 61.5%的機器流量比例來說(直播平臺機器流量比例會更高),直播平臺帶寬成本能有將近三分之二的損失,每月損失數千萬的帶寬成本。問題二:機器流量虛高增加主播工資成本直播主播人氣虛高以及購買人氣已經不是圈內的隱秘,逐漸成為主播圈內的共識,由于高人氣帶來的熱度,以及推薦機制,會影響到主播的展出及簽約金額。以某平臺為例,主播申請開通直播間后,兩月內所獲魚丸超過 500kg,可簽約以魚丸換取人民幣,其有效直播時長,績效工資都取決于直播人數,而主播在流量上操作主要有通過淘寶平臺掛直播人
24、氣協議,或者直接購買直播人氣軟件程序等方式,控制直播人數,這些大量虛高的流量,多數都為虛假機器流量,增加了主播的工資成本。問題三:水軍刷屏彈幕嚴重影響正常運營機器人水軍除了增加“量”上面的運營成本,還會影響直播環境中“質”的問題。只是為了增加人氣的虛假流量在所有虛假流量中,危害程度還是最小的。大批量的水軍會通過帶節奏的方式影響直播間正常運營,許多水軍為了某些目的,刻意攻擊主播,引導主播間惡性競爭關系,通過批量的同質化負面信息直接影響主播正常運營,污染直播環境,造成觀眾數量驟減,嚴重一些會直接影響整個平臺的環境。此外,水軍彈幕也會出現一些第三方機構的違規信息,違禁敏感內容的廣告推廣,此類機器流量
25、并不與直播生態中的主播,平臺相關聯,而是純粹的第三方引導信息,目前相關法規并不完善,但并不排除以后平臺要為這些違規信息負責。112022 年度虛假流量白皮書112022 年度虛假流量白皮書游戲類內容行業:中國游戲市場的發展,基于游戲代理的開端,從端游開始發展,逐漸從代理轉為自研。國內游戲發展有幾個關鍵節點,分別是:自智能手機導入市場,手游開始萌芽;2010 年-2012 年,國內游戲逐漸從代理模式轉為自研,手游開始快速發展;2016 年手游市場超過端游,逐漸成為游戲市場主力。十年間,中國游戲市場增長 6 倍有余,從 2011 年的 446 億元逐漸發展至 2021 年的 2965 億元,形成了
26、騰訊,網易兩家游戲巨頭,以及以米哈游,莉莉絲,疊紙,鷹角網絡等一些新興的游戲大廠,中國游戲市場逐漸增長,并以騰訊,網易,米哈游,莉莉絲等游戲大廠為首,形成了中國游戲出海的海外商業版圖。雖然目前仍然面臨版號問題,游戲市場增長放緩,但如今的市場存量與市場活力仍然居高,同時游戲企業的各種問題也充斥于整個行業。問題一:賬號安全問題得不到保障,攻擊已成產業鏈游戲數字資產是游戲玩家最重視的游戲內容之一,賬號安全問題也主要存在于各個網游中,由于游戲內的資產通常需要玩家通過大量的時間精力,甚至是真實的貨幣充值換取,游戲中的“裝備”,“裝扮”都屬于玩家十分重要的數字資產,甚至根據游戲的版本,材料的稀缺性,也會形
27、成相當龐大的二級交易市場,所以許多黑灰產在這其中嗅到了商機。黑產主要通過三種方式來竊取游戲賬號資產?通過卡商,接碼平臺,進行批量注冊小號,作為轉移資產的中介?通過網站,通訊軟件等泄露的賬號密碼,或者直接從暗網黑市購買賬號,然后批量撞庫,登錄玩家賬號,篩選分類有價值的賬號?或者通過社工、打包,一些釣魚的木馬,進行第三方登錄,來轉移玩家的游戲資產。問題二:買量成本與日俱增,渠道假量充塞市場游戲買量指的是游戲研發的一方通過渠道投放廣告,獲得用戶量的形式,主要有 CPS(按成交流水結算),CPA(按注冊量計算),CPM(按展示計算),CPC(按點擊計算),CPT(按展示市場計算)等,大部分是按照 CP
28、A 形式付費,根據用戶的注冊量來付費。約翰沃納梅克認為“我知道在廣告上的投資有一半是無用的,但問題是我不知道是哪一半?!倍聦嵤窃S多廣告投放出去可能效果連一半都不到。在所有廠商都知道投放廣告難以獲得預計的收益時,互聯網廣告中的效果廣告,逐漸占據了廣告市場。但效果廣告就一定有效果嗎?廣告渠道注冊量的大小直接與渠道的收入相關,那么就產生了可以鉆的空子。虛假流量問題同時也存在于效果廣告中,買量游戲的效果投放獲得的注冊賬號,可能連一半的真實注冊都沒有,這剛好依然印證了那句話,廣告上一半投資是無效的,而卻不得不去投,因為不知道到底哪一半是無效的(無法從注冊上區分出真實或虛假流量)。一方面買量的廣告成本一
29、直在增加,另一方面大量機器賬號,虛假注冊,無效注冊充斥市場,進一步導致了買量成本的增加,轉化率逐漸減少。122022 年度虛假流量白皮書122022 年度虛假流量白皮書問題三:為防御黑產增加登錄交互難度,影響運營接入互聯網行業重視用戶交互體驗,而游戲行業更是其中的佼佼者,大批美術,關卡,數值,劇情,系統策劃,其策劃核心都是增強用戶各個方面的游戲體驗,增加玩家留存。許多游戲都會設置多層驗證環節以對抗黑產用戶,而過多繁瑣的驗證的“防”的環節卻影響了正常用戶的交互體驗。曾經各類網游都沒有設置相關的安全驗證環節,導致一段時間內盜號洗號猖獗,嚴重影響游戲運營,游戲運營方為了增加安全性,也一直在大力查封賬
30、號與增加驗證,“堵”的方式雖然減少了許多風險,但也增加了游戲玩家的體驗難度,不少用戶抱怨誤封錯封,驗證繁瑣,比如許多游戲中增加的“二級密碼”校驗。正如網絡安全行業中安全與體驗的長久博弈,游戲行業也一直存在著“用戶體驗和賬戶風險難兩全”的問題,多次校驗以及密碼校驗困難,都嚴重影響玩家體驗。問題四:大量違規黑產小號,誤封賬號情況頻發游戲賬號的所有權通常都屬于游戲運營方或游戲開發方,玩家只有使用權。所以游戲廠商可以直接通過封號處理一些違規賬號,這是最快見效的方式,但通常會誤封,錯封正常玩家的賬號。由于游戲賬號具備一定的交易屬性,賬號下的游戲資產與數值,也有一定的價值,價值越高的賬號封號成本越高,獲得
31、成本也高,黑產不同通過高價值賬號進行風險動作,以免直接被封號?;谫~號的交易價值,黑產會通過批量注冊,養號的方式,例如云手機,軟件多開,離線托管等方式快速養成大量具備一定資源的小號,以及第三方購買渠道進行小號的購買或售賣進行獲利,這是其中的一種獲利方式。另一種是借由低價值小號進行風險或違規操作,比如轉移通過不正當渠道獲得的游戲資產。由于封號具備一定遲滯性,封號之前黑產已經將游戲資產轉移或售賣,封停的小號沒有多少成本?;蛘咄ㄟ^游戲外掛破壞游戲平衡,篡改數據,直接進行牟利。我國外掛產業鏈規模巨大,每年甚至超過 20 億。132022 年度虛假流量白皮書132022 年度虛假流量白皮書通訊社交類行業
32、:如今,人們的社交從線下大批量轉移到線上,而線下社交往往也伴隨著線上的社交,線上社交降低了交流的成本,壓縮了交流的時空,但同樣也擴大了風險,通訊社交行業面對的最主要的幾個問題就是虛假信息,引流風險與詐騙風險。麻省理工學院教授錫南阿拉爾(Sinan Aral)所著的炒作機器:社交時代的群體盲區指出,1%虛假信息轉發鏈可以輕松地擴散到 10 萬人的群體中,這遠比真實信息的傳播能力要強,另外將真實信息傳播給 1500 人所需要的時間大概是虛假信息傳播到同樣數量的人時間的 6 倍。并且虛假信息由于其煽動性和信息處理層的“炒作環節”虛假流量機器人通過參與到每層傳播鏈條的多級傳播中,就可以快速擴大傳播范圍
33、?;谏缃痪W絡多級傳播的屬性,虛假新聞信息會快速跨越圈層傳播,參照疫情發生時各種謠言的快速傳播,即便許多媒體平臺采取相關措施阻止謠言的擴散,但謠言也會從社交軟件上快速傳播。由此衍生出的風險主要為以下四點。風險一:賬號風險社交媒體賬號的注冊并非需要全部實名認證,且注冊接入比較簡單,基本上有一個手機號碼或者郵箱就可以完成注冊,這就造成了許多社交媒體中充斥著大量的虛假流量,例如國內微博以及國外推特,社交機器人問題層出不窮,此外由于信息泄露導致的賬號風險,也給了黑產在社交媒體上滋長的土壤。黑產通過接碼平臺,掃號腳本,拖庫撞庫等方式,注冊或者使用一些社交媒體賬號,偽裝為真實社交用戶,進行進一步獲利。風險
34、二:內容風險機器人賬戶通過模擬真實用戶,會不定期于社交媒體上,不少社交媒體用戶甚至不會更改用戶名,馬甲,所以機器用戶的真實性非常難以判斷,當批量機器人虛假賬號進行同一信息的不同描述時,極易造成信息的“回聲室”,造成多級多層擴散,讓真實用戶成為散播虛假信息的幫兇。此外不良信息違規信息大范圍擴散,也會影響用戶對于平臺的信任,一方面是對平臺管控能力的不信任,另一方面是對平臺內容的不信任,信息質量參差不齊,最終造成用戶流失。142022 年度虛假流量白皮書142022 年度虛假流量白皮書風險三:引流欺詐風險社交媒體上還有另一種最直接危及用戶安全的風險引流欺詐風險,營銷欺詐黑產團伙以及競品同行會通過批量
35、注冊,或者購買賬號,制作引流腳本,將社交平臺上的用戶引誘至其他平臺。前者多使用極具引誘性的話術進行引流,往往鏈接會到違規違法詐騙平臺,同時通過購買大量的僵尸賬號,增加粉絲/訂閱,以增加詐騙賬號的可信度,進一步對用戶進行欺詐誘導行為,用戶在誘導內容上所遭受的經濟損失,也會嚴重影響到平臺內容的信任程度和法律風險。而后者作為競品同行,十分了解平臺和用戶的屬性,直接利用平臺自身的傳播能量進行引流,或者進行一些破壞性的信息攻擊以及內容污染,造成用戶的流失。152022 年度虛假流量白皮書152022 年度虛假流量白皮書航司行業:航司已作為我國出行的重要交通平臺,航司在風控方面面臨著重大挑戰,每年形形色色
36、的數字黑產攻擊都讓航司防不勝防,給航空旅游行業帶來了巨大的損失。公開數據顯示,2018-2020 年,每年在線機票交易的規模增長率達到 20%左右,航旅平均欺詐率在 0.37%,每年欺詐總損失高達 10 億元?,F有風控策略無法有效識別流量請求,存在識別效率低,處置方式單一的問題。據IATA:2022 年年度全球航空業回顧報告,航空業自 2020 由于疫情導致的巨大虧損之后,正在逐漸復蘇,與 20 年虧損 1377 億美元相比,預計 22 年將減少至 97 美元,在未來防控政策逐步穩固,經濟復蘇之后,航空業將會有巨大的反彈空間,在國際形式瞬息萬變的情況下,背后的黑產也蠢蠢欲動,航司要預備好“黑五
37、類”的侵襲。一類為垃圾注冊黑產鏈接卡商卡池,擁有大量的號碼用以注冊各個平臺的賬號,編寫自動化腳本以遠高于正常人類的速度搶票搶座,由于旅游旺季或出行高峰期的航票比較有限,根據市場的供需變化,票價會出現比較大的浮動,黑產搶票不支付,然后等待到期后再進行搶票,占據著許多航票,再通過高價轉賣變現,或者一直占據座票,導致正常用戶難以訂票,影響正常的售賣。二類為查詢占用購票前的查詢量十分龐大,中航信對所有航司要求訂票查詢比為:1/200,超過部分收費,已經足夠覆蓋正常訂票的查詢需求,但有著大量第三方代理平臺以及黑產的大量垃圾查詢,造成查詢負擔,航司調用中航信的接口費用十分昂貴,也造成了很大的損失,此類查詢
38、大部分都是黑產造成的無效查詢占用,除了調用接口的費用以外,還嚴重影響正常用戶的查詢。在訂票高峰期經常出現查詢失敗,窗口崩潰的情況,也嚴重影響到了用戶對于航司的正常需求。三類為營銷作弊黑產擁有的批量賬號成為其肆虐損害營銷資源最有力的工具,大批黑產賬號的涌入,對于航空公司網站,小程序等端口的承應能力具備一定的挑戰,在一些關鍵訂票時間節點,會出現大批量的用戶訪問請求,黑產占用的帶寬資源會直接導致正常用戶接入困難,此外黑產也會通過占用的帶寬資源直接進行營銷資源倒賣,薅取航司羊毛。162022 年度虛假流量白皮書162022 年度虛假流量白皮書四類為優惠盜刷航空公司為了促進消費,經常會下發一些優惠福利給
39、到注冊用戶,以此拉高票務訂購以及用戶黏度,并且飛機票的優惠值往往比較大,基于航票基礎價格較高的情況,優惠值,優惠券等營銷活動也會被黑產盯上。黑產或者競爭對手可以直接通過人工打碼繞過驗證環節套取優惠券,竊取本用以發給用戶的優惠資源,再進行二次售賣變現盈利,這些竊取的優惠也讓航空公司的許多營銷活動起不到預計的效果。五類為虛假占座黑產在航空公司的許多操作都會通過占座的前置動作來為后續的獲利變現作準備。其團伙通過爬蟲爬取剩余座位,創建訂單而不支付,導致虛假占座的狀況。這種虛假占座并非一次性操作,黑產會通過反復的占座操作導致座位一直被虛假訂單所限制,損害航司和旅客雙方利益。航票黃牛的占座操作不僅僅抬高了
40、價格,可能還會導致真實用戶難以購票,一定程度上也會限制用戶的消費,使得用戶選擇其他公司或者不出行。172022 年度虛假流量白皮書172022 年度虛假流量白皮書酒店住宿行業:目前酒店住宿行業發展與線上交易平臺的業務深度綁定,出行、購票、查詢、入住、咨詢等業務可以借助線上服務實現的同時,不僅為商家帶來的更大的客流量與曝光,也為黑產欺詐獲利提供了可乘之機,注冊、登錄、購票、提交訂單、接口查詢、信息查詢等多個場景欺詐風險劇增。對于用戶而言,出行住宿的隱私數據難以得到有效的安全保證,黑產借由線上平臺批量獲取用戶信息進而售賣,此外用戶泄露的隱私數據還會為黑產提供進一步撞庫攻擊的材料,對于平臺與商家而言
41、,營銷欺詐也時有發生,運營成本不斷增加的同時,還會影響到核心業務的正常運作,其主要風險有以下六點:風險一:短信接口盜刷現在幾乎所有的平臺的訪問接入都需要賬號或者 ID,綁定用戶身份,通常最廣泛的注冊手段都是通過手機號進行注冊的,除了注冊以外,每次登錄都需要短信接口校驗,且校驗沒有太多限制。許多黑產賬號會頻繁刷去調用短信接口,大批量的短信請求會直接導致平臺的資源損失。風險二:薅羊毛薅羊毛行為同樣也存在于住宿行業,住宿行業作為直接面向 C 端消費者的行業,并且大多數情況下沒有十分堅固的行業壁壘,行業門檻較低,所以在部分情況下會導致同一區域的商家同質化競爭較多。而在這種競爭之下,商家會發放許多優惠券
42、或者相似活動來吸引消費者,但這種優惠券也會吸引黑產的目光,有限的福利會被高效率的黑產賬號搶占,無法讓利到真實的用戶,影響平臺的營銷公平。風險三:垃圾注冊平臺運營往往基于龐大的用戶數據,根據用戶的行為數據來預測活動的創辦預期,但都是基于真實的用戶數據,如果用戶數據造假或者水分較大,預測的動作將會在錯誤的數據上進行,會導致活動預期數據有比較大的偏差,影響活動的運營。此外,大量的垃圾注冊由于與真實用戶的行為可能相同也可能不同,區分難度較大,無法直接對垃圾注冊進行有效打擊,會放任這些賬號長久地生存在平臺上,持續地竊取利益。182022 年度虛假流量白皮書182022 年度虛假流量白皮書風險四:撞庫登錄
43、黑產團隊除了自身擁有的賬號之外,還會通過拖庫,暗網交易等方式獲取真實用戶的信息,進行撞庫登錄,操縱這些真實用戶的賬號進行交易,訂票等風險操作。所以黑產風險不僅源于黑產的賬號,還可能源于這些真實的賬號。撞庫風險存在于平臺上,為了對抗這些風險,平臺會在許多風險場景中設置校驗環節,以減少風險動作的進行,由于黑產操作往往都是大批量進行,無法進行很精細的動作,簡單的短信驗證只能進行賬號的校驗,無法實現風險校驗,所以進一步驗證校驗是這些平臺對抗黑產的必要工具,復雜的驗證形式可以有效過濾掉一部分的黑產賬號。風險五:批量搶票酒店注冊的票價通常都會以一定的規律浮動,票價不會一直穩定,不同平臺,不同商家會采取不同
44、的定價策略,以及不同的優惠活動,基本上不會出現在哪個平臺訂票就一定優惠,哪個商家就一定比其他商家票價低的情況,這種信息差就會產生一定可操作的利益空間。黑產通過爬蟲爬取不同平臺的票價信息,再經由儲備的大量賬號搶到相較低價的售票,進行二次加價售出,進行獲利,損害平臺商家信譽。風險六:數據泄露由于住宿行業都要求登記個人身份信息,賬戶信息等敏感信息,相關平臺有著龐大的用戶信息庫,來進行交易及校驗,這些數據是交易所必要的,無法避免。欺詐團伙應用自動化腳本工具對平臺個人信息進行非法爬取,進行信息的售賣或詐騙,眾所周知互聯網沒有隱私,用戶只要在某個站點平臺上填寫過個人信息,隱私數據就有被泄露的風險,而這些信
45、息的泄露,會嚴重危害用戶的財產甚至人身安全。192022 年度虛假流量白皮書192022 年度虛假流量白皮書虛假機器流量常見偽裝及攻擊形式黑灰產通常通過偽裝正式真實用戶流量以獲得數據信息和利益,安全市場上針對黑產常見的偽裝形式有著對應的風控策略,例如黑產偽裝真實設備,正常IP,真實用戶行為及賬號等要素,通過風控策略組合能夠識別出大部分的虛假流量,但只通過一些要素無法準確的判定流量屬性,所以在異常流量對抗策略之外,驗證碼是一個比較重要且常見的兜底手段。在驗證破解的對抗過程中,黑產會通過技術手段和人工手段對驗證各個環節進行破解和攻擊,主要以兩種模式,一種是模擬成真實用戶完成驗證操作,一種是通過破解
46、接口處的程序對驗證關鍵環節的參數,從而逆向還原。這兩種分別為模擬器破解與接口破解,但破解之后還需回到驗證本身,給予驗證答案才能通過校驗。模擬器破解通過各種自動化測試工具,例如 Selenium 操作 chromium 內核實現自動化的拖動、點擊等操作,模擬一個真實用戶者的操作環境,其基礎破解步驟為?調用無頭瀏覽器接口,啟動模擬?獲取問題,解出答?調用接口控制鼠標交?過程自動化 破解模擬器破解類似自動化測試運行原理,技術門檻與實現成本比較低;但由于模擬器破解需要進行 UI 交互,性能瓶頸明顯,效率較低。并且模擬器破解為了模擬環境,會根據模擬需求更改適應模擬環境版本內容,但在驗證后臺可以看出同一
47、IP 的變化,雖然經過了環境校驗,但已經被標識為了可疑用戶。202022 年度虛假流量白皮書202022 年度虛假流量白皮書接口破解利用接口程序破解正確的關鍵參數,從而對驗證碼進行破解。其基礎破解步驟為?逆向 JS/SDK,破解參數邏?獲取問題,解出答?偽造參數進行封?過程自動化 破解由于接口破解需要對前端 JS 進行逆向還原,同時需要完全理清參數生成的邏輯,相對模擬器破解的技術門檻與實現成本都更高。同樣它的優勢在于不需要進行前端的 UI 交互,因此破解效率也很高。窮舉破解模擬器破解和接口破解是進行破解過程自動化的兩種技術路徑,但是無論使用哪一種,都還必須通過人工、窮舉圖片、AI 識別等方式獲
48、得驗證答案,然后生成盡可能真實的行為軌跡。軌跡的自動化生成方式包括:函數生成:通過編寫函數,自動生成具有特定行為模式的軌跡數據,機器特征相對明顯。軌跡重放:通過各種途徑,積累不同類型、長度的真實軌跡樣本,根據答案適配進行軌跡數據的重復投遞。計算機視覺與深度學習黑產無論使用哪種方式進行破解過程自動化,最終都必須面對驗證給出的答卷,答案匹配才能通過驗證,除了窮舉法之外,還有一種比較復雜的方法實現驗證答案破解,就是通過計算機視覺識別技術和自然語言處理(Natural Language Processing,NLP)結合的方式來識別圖像答案。以最常見的圖片點選的驗證形式為例,通過計算機視覺識別技術掃描
49、像素點,只能識別出不同的圖像,并不能結合驗證問題,相當于只是識別出了答案所在的區間。如果需要解答驗證問題,還需要自然語言處理技術解釋驗證問題,結合兩者的識別結果給出驗證答案,但這種方式攻擊難度與成本很高,不是一種成熟的破解技術。212022 年度虛假流量白皮書212022 年度虛假流量白皮書極驗的對抗形式極驗對于虛假流量,會基于其攻擊形式進行層層防御。首先會對其設備屬性,IP以及行為模型進行異常識別處理,包括設備指紋,風險標記等策略。極驗在線上有著多重模型和關卡,在不同的環節給使用不同技術手段的黑產團伙施加不同的影響,打斷其自動化過程,提高其成本,降低其ROI。OCR 圖像識別對抗OCR(Op
50、tical Character Recognition)識別是一種常見的對驗證碼圖片中字符識別破解的手段,計算機通過掃描圖像上的像素點,根據光學特征識別出圖像中的文字,進行分析處理,獲取圖片中文字版面的信息,然后以文本的形式返回。文字點選驗證碼的主流破解流程如下圖,首先利用 YOLO 或者 RPN 網絡,定位出 obj 的位置(bbox),并判斷該位置的 obj 是文字還是提示詞,根據預測的 bbox 將文字或提示詞裁剪下來,文字輸入 CNN 文字識別模型,識別出文字的內容。提示詞進入 CRNN 模型,識別出提示詞的內容和語序。針對圖像識別的對象檢測,驗證碼會在圖像(cv)上去針對性的處理圖像
51、背景,使得破解者的對象的檢測模型失效,無法從圖像中定位關鍵答案選項。針對圖像識別類別識別,針對破解者的識別方法:樣本搜集,打標記,訓練。極驗驗證碼技術團隊注意到只要讓黑客重新進入這個樣本搜集,打標記,訓練循環,就可以極大的破壞黑客的破解成果,提高黑客的運營成本,等到黑客準備好識別模型,極驗驗證碼團隊又會去更換圖集的制作方式。極驗運用驗證碼多年的運營對抗經驗來訓練制作反分類模型,反饋給公司的其他業務場景,持續在業界定義驗證碼服務標準。222022 年度虛假流量白皮書222022 年度虛假流量白皮書PoW 工作量證明計算工作量證明(Proof-of-Work,以下簡稱“PoW”)在百科的介紹中指一
52、般要求用戶進行一些耗時適當的復雜運算,并且答案能被服務方快速驗算,以此耗用的時間、設備與能源做為擔保成本,以確保服務與資源是被真正的需求所使用。通俗來講,就是證明你所做過的工作。當應用在驗證碼中時,它指的是驗證碼廠商的服務端向用戶的客戶端調取計算機完成指定量工作的證明,該證明一般為提交了正確的哈希算法的字符串答案。在這一過程中,驗證碼服務端除了可以迅速驗證客戶端的答案外,工作量證明的數量多少也有且僅有它可以規定。極驗在驗證碼的應用中,主要采用 Hash 運算的方式用作 PoW 工作量證明,利用 Hash 運算的復雜度,給定一個初始值,通過復雜的值遞增,利用 Hash 碰撞原理,直到找到特定的碰
53、值,可以通過調節碰撞值的長度,實現對于工作量的調節(碰撞值越長,所需要的運算量越大)。在目前的認知中,黑產除了窮舉嘗試,無法很快的找到滿足條件的簽名串。黑產在發送請求時就需要進行 N 次遞增生成新的簽名串,直到生成了符合極驗服務端要求的簽名串,即可完成工作量證明。以下列實際應用為例:圖:14:00 各項數據以某網站為例,該網站請求交互量于 14:00 達到峰值,244,785。對比網站過往數據,我們監測到數據異常后,以過往大量的攻防數據經驗判斷,這是黑灰產在使用計算機腳本大批量進入網站并進行了高頻次的交互驗證,于 14:52 分開啟了 PoW 防御機制。232022 年度虛假流量白皮書2320
54、22 年度虛假流量白皮書圖:15:00 各項數據8 分鐘后,于 15:00 時,從數據變化可以看出,雖然驗證請求量與交互量仍然處在較高的水平,但驗證通過量大大降低,驗證通過率從 84.7%降低至 0.0657%,對比凌晨時的正常請求數據,可以看出此時的驗證通過量趨于正常用戶數據,將大量的“請求轟炸”攔截于驗證之外。PoW 工作量證明計算的作用在于不增加前端用戶校驗的成本,將計算校驗的內容交由計算機處理,如果請求的來源是單一的,用戶計算校驗的成本就不會很高,但如果請求來源于多次頻繁攻擊的黑產,那么該黑產服務器將需要強制經過大量的復雜運算,極大地增加請求的成本,以此降低異常的高頻詞交互請求。242
55、022 年度虛假流量白皮書242022 年度虛假流量白皮書識別可疑流量建立黑產庫黑產庫的作用是補足實時防御的一環,由于業務安全的攻防始終是動態對抗的,沒有百分百成功的防御,也沒有百分百成功的攻擊,因此我們可以通過不同防御組合進行攔截,即對那些可以通過的黑產 IP 進行一層身份驗證,挖掘驗證端規則,構建邏輯陷阱,通過對異常行為的標記,經過多次驗證后加入到可疑流量黑產庫,進而對驗證攔截進行復盤,以及保存對可疑流量的攔截權力。例如黑產通過掃描值的不同組合進行窮舉破解,最終雖然有可能獲得答案,但已經體現出與正常用戶的差異。例如圖片點選中給定點選圖案的幾個 x 軸,y 軸,z 軸坐標,驗證碼會設定一定的
56、誤差值,以保證正常用戶的驗證體驗,幾乎都能夠一次通過,而用戶前端操作傳回的數據是以驗證后臺給定的方式進行排列的,如果是正常用戶,只會是在給定值的誤差范圍內波動,但黑產破解則是從數據側進行窮舉。最終雖然能夠通過驗證,但黑產給出的固定值進行多組不同排列的行為,就可以將其認定為可疑流量,建立到黑產庫中。同時通過大量行業數據的處理經驗,早已擁有了龐大的黑產數據庫,也就是說黑產在破解驗證邏輯后,最終不得不交給人工打碼平臺進行破解,但通過可疑流量建立的黑產數據庫,也可以識別到這些打碼平臺,進而對該流量進行封弊。252022 年度虛假流量白皮書252022 年度虛假流量白皮書虛假流量對抗實戰案例?數字藏品平
57、臺遭受攻擊,用戶數字資產不翼而飛數字藏品自 2021 年下半年在國內爆火起來,其熱度就一直居高不下。2022 年,數字藏品產業更是吸引了海內外眾多企業的參與。從國內每月發行的數字藏品數量來看,從 2022 年 2 月開始,單月的發行數量突破百萬級別。其中,5 月發行數量最高達到 496.9 萬件。已發行數字藏品平均單價呈上升趨勢,2022 年 5 月達到最高。由于數字藏品具有可溯源、唯一性的特殊性,相當于一種更安全、不會丟失的數字資產,擁有收藏價值,因此吸引了黑產的注意力。同時,數字藏品平臺作為新興發展的數字經濟產品,會推出各種營銷活動以助力企業運營、讓利客戶,如新品首發優先購、低價秒殺搶購,
58、黑產對于此類福利活動的攻擊熱度也持續高漲。其中“科學家”使用機器腳本外掛惡意搶購,破壞平臺規則,擾亂平臺秩序等情況最為常見。國內排行前列的某 NFT 平臺,就曾遭受黑產通過高并發請求刷取平臺短信接口,給平臺業務經營造成了巨大的損失。同時,黑產通過高效率搶奪發售的數字藏品,在營銷搶購活動中惡意搶購,用于轉賣獲利,擾亂平臺公共交易秩序。極驗方案1)行為驗攔截機器腳本:根據該平臺出現的惡意搶購和短信接口盜刷問題,極驗采取在注冊、登錄、秒殺搶購場景部署最新一代的行為式驗證碼,通過七層動態防御能力遏制機器批量操作行為,確保平臺安全,攔截作弊機器腳本。2)PoW 共識算法防御,遏制高頻次交互:該平臺網站通
59、過發送短信驗證的方式登錄,此時黑產會通過大量盜刷短信接口進行批量登錄操作。當收到來自黑產計算機的高頻次驗證碼請求時,PoW 就會發揮作用。PoW 這項技術通過加大電腦 CPU 的計算量、延長計算時間遏制黑產高頻次的交互,若黑產執意破解便會提高作弊成本。3)標記異常用戶數據:對作弊搶購、批量登錄的異常數據的記錄分析形成黑產 IP 庫、軌跡庫和設備標識庫,極驗后臺將數據庫結合前端的蜜罐、JS 混淆等技術實現對異常數據實時標記功能。即使在遭受黑產打碼平臺攻擊的極端情況下,標記數據仍然可以以接口形式傳輸給平臺,由其根據接口標記進一步做業務風控處理。262022 年度虛假流量白皮書262022 年度虛假
60、流量白皮書極驗成效1)有效阻止機器作弊行為,使平臺內用戶數字藏品資產得到有力保障,平臺交易秩序得到公平維護。2)PoW 共識算法機制可實現攔截 95%以上的機器流量,減少了短信接口盜刷,節省了業務運營開支。3)不僅保證了網站和用戶安全還兼顧了平臺用戶的體驗感受,滑動拼圖的驗證形式提升了驗證速度,將驗證時間降至 1.4 秒。減少平臺 30%以上的用戶流失,提高了留存率與轉化率,同時增加業務收益。2.直播平臺面臨黑產流量的安全性挑戰視頻直播平臺是互聯時代的產物,受到年輕人的關注與追捧。據 TalkingData 2022 中國游戲直播行業白皮書統計,截至 2021 年,中國游戲直播的市場規模達 9
61、48 億元,同比增長 11.8%;而 2022 年預計市場規模將達 1108 億元,用戶數將達 3.82 億,保持快速增長勢頭。2022 年,游戲版號重啟發放,占據游戲行業超三成的游戲直播市場規模穩步增加。直播商業化加快的同時,行業下涌動的黑產也逐漸形成不容小視的規?;a業。直播平臺在運營過程中完全依靠網絡通信,而網絡通信數據易受到黑產的攔截與篡改,影響正常業務的運作。攻擊者通常運用批量注冊、屯號、自動化腳本等手段,惡意制造虛假流量,浪費平臺帶寬,造成平臺的資源被大量浪費。同時,由于視頻直播門檻低,抄襲、低俗內容現象泛濫,破壞平臺環境;平臺眾多的運營活動也容易被羊毛黨盯上,造成平臺財產流失。國
62、內某游戲直播平臺,運營成本中的帶寬成本與主播費用支出占比超50%,而這兩項支出都會直接受到黑產的影響,無需注冊就能觀看導致大量黑產機器導入耗費高額帶寬成本。黑產賬戶還會通過注冊、登錄、做任務等方式薅取大量虛擬資產與福利,給平臺造成巨額損失。此外,由于主播工資直接與流量掛鉤,各種明碼交易的刷量會導致平臺支出額外的主播費用,增加寬帶成本及綜合運營成本。272022 年度虛假流量白皮書272022 年度虛假流量白皮書極驗方案極驗為該平臺提供定制化解決方案,從風格,安全,服務,體驗四個維度切入使用場景。包括:1)皮膚定制:定制專屬驗證圖片,驗證風格貼合平臺主色調;2)智能驗證:生物特征驗證識別以及黑卡
63、庫接入封殺,最大程度識別防御黑產;3)服務定制:最高響應級別,驗證碼服務高度穩定;4)風控融合:一鍵通過校驗,輸錯三次才會彈出驗證,降低用戶接入打擾。以下為測試數據結果:risk_level!=0risk_level=5risk_level=9準確率(%)95.5079395.47781694.64465覆蓋率(%)91.1891.1289.37誤殺率(%)0.1309960.1309960.040306極驗成效1)平均每小時為該平臺防御近30萬次惡意請求,智能封禁大量惡意攻擊,每小時為平臺減少3萬元損失。2)一點即過的良好驗證形式為該平臺的近20萬注冊登錄用戶節省了90個小時,減少五分之一的
64、可能用戶流失。3)極驗后臺為該平臺提供多維度業務數據分析,從根本解決高風險場景中的黑產攻擊,薅羊毛等損失。282022 年度虛假流量白皮書282022 年度虛假流量白皮書3.零售行業遭遇羊毛黨圍攻,短信成本增加各類品牌手機商城的出現是互聯網發展帶來的必然產物,各品牌皆希望依托自營電商平臺實現三個目標:一是線上線下聯合布局,打造跨渠道消費者體驗;二是以客戶為中心,深耕服務生態;最后依托電子商務,結合手機等終端產品的銷售,逐步完善自己的互聯網建設。目前各大手機品牌商城已實現搜索、推薦、資訊推送、商品詳情、分類、購物車、下單、客服等多種電商需要的基礎功能。為了提高用戶活躍度與留存率,進而提高客單價或
65、 GMV,一些手機商城會推出限時購、以舊換新、拼團等營銷活動,也因此會引來“羊毛黨”的關注,致使品牌業務安全受到威脅,危險四伏。國內某電商平臺,積分兌換和商品滿減優惠券領取環節易出現薅羊毛問題,直接給平臺造成損失;榮耀社區中心存在惡意評論,垃圾發帖現象,影響忠實用戶體驗。同時,該平臺面臨批量賬號注冊導致短信消耗量大,增加業務運營成本負擔。極驗方案1)行為驗有效攔截:針對該商城內出現的垃圾注冊、優惠券作弊領取和惡意評論的問題,極驗在注冊、登錄、找回密碼等場景部署了行為驗,行為驗可以對人類用戶和機器用戶進行有效區分并對機器用戶予以攔截。2)更換驗證碼形式,提高黑產的攻擊成本:在更加容易受黑產攻擊的
66、商場場景設置圖文點選式驗證碼,這種形式的驗證碼由底圖和文字、圖標等元素組合而成,通過對底圖進行風格化處理,改變圖片色值和像素。在單圖片上,極驗采用了自研的混淆算法,以高幾率繞過現有的“以圖搜圖”圖片引擎的檢索。提高驗證碼的破解難度對應地會增加黑產破解成本,致使羊毛黨放棄領取優惠券或積分兌獎。極驗成效1)從源頭大幅降低該商城內虛假用戶數量,大大減少短信成本惡意消耗。2)降低羊毛黨領取優惠券及惡意搶購成功率,有效降低了運營直接損失。292022 年度虛假流量白皮書292022 年度虛假流量白皮書行業預測及虛假流量未來趨勢?技術上,攻擊形式多樣化,驗證攻防會長時間繼續存在于虛假流量對抗中黑產從業者已
67、超 40 萬人,每年企業因黑產而涉及損失超千億。交互安全守護者與黑灰產間的對抗愈演愈烈。傳統的字符驗證碼雖然早已過時,但仍未消失于互聯網中,黑產與交互安全的動態對抗也一直推動著技術的進步。圖像處理,機器視覺,自動化程序能做到的越來越多,而攔截機器的本質在于區分來源是人類還是機器,驗證碼作為一種圖靈測試工具,作用在于機器程序行為在互聯網上無限接近于真人行為時,能夠找到識別真人用戶的規則對流量加以區分。而過往靜態的驗證碼已經無法應對復雜多變的黑產攻擊形式,而應對多樣化的攻擊形式,只有實現動態防御才能抵御無所不在的攻擊。2.政策上,企業將逐漸被強制要求治理虛假流量問題政策法規上,往往預示了企業大環境
68、的發展趨勢。一方面對于某些行業會進行扶持與放開;另一方面也會對現有行業法規進一步完善。今年國外關于虛假流量的兩大政策,分別從黑產及企業兩方面規定了下一步的環境政策。(1)爬蟲合法化判決使得網絡爬蟲問題置于明面面對 LinkedIn 發起的長期訴訟,美國第九巡回上訴法院重申了其最初的決定網絡爬蟲是合法的,這個判決明確了爬蟲的合規問題。此前,爬蟲一直是一個灰色的問題,爬蟲的本質就是按照一定的方法與規則,自動爬取網站信息的程序腳本,而這個工具的性質取決于利益相關的主題是誰,是使用爬蟲的人還是被爬取信息的網站主。爬蟲是一種非常有效的網絡抓取工具,對于沒有雄厚資本的小公司/創業公司而言,爬蟲是一種非常有
69、效的信息獲取工具,同時大公司也會為了信息博弈,使用爬蟲,但同時又不希望對手使用爬蟲爬取自己網站的內容。技術本身是沒有善惡的。302022 年度虛假流量白皮書302022 年度虛假流量白皮書爬蟲肆虐,內容安全無法保障據 Akamai 統計,全球互聯網流量近 40%為爬蟲流量,在 2021 年第二季度,全球遭遇的賬戶濫用攻擊達到了 700 億次,同比增長 15%,更讓人擔心的是,日峰值超過 10 億次的惡意登錄行為變得逐漸頻繁。據 Check Point Research 數據顯示,相較于 2020 年,2021 年黑產每周對企業的網絡攻擊數量增加了 50%。圖源:Check Point Rese
70、arch爬蟲合法化帶來的將會帶來網絡爬蟲群體的進一步擴張與活躍,隨著數字資產的比重逐漸增加,誰掌握信息差,誰就掌握了定價權。以電商平臺為例,商品的定價,詳情,評論都是能夠直接影響消費者決策的重要信息,當競爭對手通過爬蟲工具搜集網站的絕大部分信息,即掌握了信息差,在消費決策中就占據了話語權。此外,爬蟲除了搜集網站信息可以獲利,還可以通過損害對方服務器資源來進行不正當競爭,黑產發起的萬億級爬蟲攻擊,作為一種惡意流量,對于被攻擊網站是一種資源的災難,造成大量的帶寬消耗,與此同時,如果網站并沒有儲備足夠的業務并發能力,將會影響到正常業務的進行。312022 年度虛假流量白皮書312022 年度虛假流量
71、白皮書法律不再是企業對爬蟲的最后一道防線技術對抗與法律訴訟是企業對爬蟲的兩道關鍵防線。據 2022 年 2 月檢查日報明確越界網絡爬蟲行為的刑事處罰邊界內容,規定了一般情形下對于爬蟲問題的處罰范圍,除侵入敏感系統,隱私信息,嚴重破壞性訪問幾種客觀認定行為下的爬蟲行為,都無法入罪,限縮了爬蟲處罰范圍??梢钥闯?,對于公開信息,以及不違反公共利益的情況下,為保護數據開放共享,許多爬蟲行為是不禁止的。如今網絡爬蟲已經成為一種常見的工具,即便非互聯網從業者也對爬蟲略知一二,可能也會利用爬蟲來獲取大量的信息。爬蟲一直以來都沒有明確的禁令,但它經常與侵害商業利益,損害隱私權利等內容有關,爬蟲合法化后,法律訴
72、訟已經不再是解決爬蟲問題的最后一道防線,技術攻防將成為爬蟲問題最重要的一環。驗證碼作為一種最常見的反爬手段,簡單而又有效。通常爬蟲來源于自動化的機器腳本程序,并且爬蟲程序的門檻并不高,可以說是任何擁有互聯網工具的人,都可以使用爬蟲程序,這就為爬蟲的溯源截斷造成了阻礙,所以在訪問端建立反爬手段,驗證碼是作為識別人機流量的一道圖靈測試程序,在許多低門檻的爬蟲程序中,并無破解驗證碼的手段,也就為網站構筑了第一道反爬防線。(2)歐盟新版準則:企業嚴格限制虛假流量問題,否則將面臨巨額罰款歐盟出臺的新版準則歐盟反虛假信息行為準則,規定減少傳播虛假信息的機器人數量,消除虛假新聞網站的廣告收入,保障安全訪問,
73、核實來源等方面。虛假流量與假新聞等問題在互聯網上的泛濫滋生了許多問題,群體輿論兩極分化,網絡暴力,極端主義言論和負面情緒感染,都嚴重污染線上環境。早在18年這一準則就已經發布,是全球首個行業內自愿通過自我監管來打擊虛假信息的倡議。322022 年度虛假流量白皮書322022 年度虛假流量白皮書新的反虛假信息準則將指導全球各巨頭互聯網科技公司采取真正有力的行動來遏制虛假信息。目的是在關鍵領域變得更加有效,從理解算法到幫助用戶批判性地評估他們看到的信息,再到消除虛假信息帶來的經濟收益,并確保不忽視以較少人使用的語言提供的虛假信息。強化后的實務守則包含以下方面的 44 項承諾和 128 項具體措施?
74、為政治廣告創建可搜索的圖書?通過消除虛假新聞網站的廣告收入來使虛假新聞網站失?減少用于傳播虛假信息的機器人網絡和虛假賬戶的數?為用戶提供標記虛假信息和訪問“權威來源”的工?讓研究人員“更好、更廣泛地訪問平臺數據?與獨立的事實核查人員密切合作,核實信息來源簽署以上準則的公司將有六個月的時間來踐行承諾,并在 2023 年初提交進度報告。虛假流量的治理刻不容緩。據悉,該行為準則將通過數字服務法強制執行,迫使大型科技公司更積極地監管其平臺以防止非法內容。違反規定的團體將面臨高達全球營業額 6%的罰款。(已知谷歌 2021 年全年營業收入 2375 億美元)當虛假流量治理在政策中體現,通過法規強制實施,
75、這將直接與企業效益掛鉤,虛假流量帶來的損害將不止是滯后和隱性的。332022 年度虛假流量白皮書332022 年度虛假流量白皮書3.經濟上,虛假流量問題可能對企業造成直接與間接損失政策法規上,往往預示了企業大環境的發展趨勢。一方面對于某些行業會進行扶持與放開;另一方面也會對現有行業法規進一步完善。今年國外關于虛假流量的兩大政策,分別從黑產及企業兩方面規定了下一步的環境政策。(1)爬蟲合法化以及虛假流量問題處罰從經濟角度討論,虛假流量已經成為互聯網企業不得不面對的營收問題?;ヂ摼W企業的本質是對用戶信息數據的二次售賣,通過互聯網的平臺吸引大量用戶進入到社區,再將這些信息,或者用戶的注意力售賣給廣告
76、商,實現利益共享。據中國互聯網協會日前發布的中國互聯網發展報告2021 年中國網絡資本發展狀況,2021 年我國上市互聯網企業營收規模為 4.23 萬億元,同比增長 24.4%,過去三年復合增長率處于 20%左右的中高速增長區間?;ヂ摼W的高速增長基于一定程度上線下經濟的線上轉型,而當虛假流量問題擺到臺面上,企業將不得不考慮限制虛假流量問題,否則平臺信任度與價值將會被大大降低。(2)國外互聯網企業因虛假流量問題影響公司估值,流量治理將成為未來重點之一以推特為例,10 月 27 日,馬斯克完成了以 440 億美元將推特私有化的交易,并已掌管公司。馬斯克上任推特后,除了大張旗鼓的裁員外,就是對于虛假
77、流量的處理。推特上虛假流量問題十分嚴重,前迪士尼前任首席執行官鮑勃艾格(BobIger)表示,早在 2016 年迪士尼就已經發現,推特(TWTR.US)的很大一部分用戶是“不真實的”。這也影響了迪士尼公司對推特公司的收購談判,由于虛假用戶問題而低估了該公司價值。虛假賬號對于平臺的影響是多方面的。例如推特的主要收入來源廣告,也是基于其龐大的用戶價值。而虛假賬號的比例將嚴重影響其廣告價值,如果廣告帶來的曝光多是虛假的,那么其主要營收就會受到嚴重的影響。此外,推特剛推出的藍 V 認證收費,每個用戶可以通過每月 8 美元的費用認證藍 V,這又為虛假賬號問題留下了一個漏洞,虛假賬號可以通過每月 8 美元
78、的代價獲取用戶信任,可能會造成更加嚴重的虛假信息問題。342022 年度虛假流量白皮書342022 年度虛假流量白皮書4.Web3.0,數字貨幣及元宇宙發展趨勢(1)區塊鏈技術及數字貨幣未來趨勢區塊鏈,是由一個個區塊組成的數據鏈條。其分為保存信息的區塊與按照各自產生時間順序連接的鏈條,其核心特點為去中心化與難以篡改。區塊被保存在所有被稱作節點的服務器中,只要系統中有一臺機器可以工作,那么整條區塊鏈就可以安全運行。而區塊鏈的信息修改需要征得半數以上節點的同意,而節點又掌握在不同的主體手中。因此區塊鏈的信息更加真實可靠,并可以溯源,能夠解決互聯網上數據不信任的問題。區塊鏈相關法規的出臺和完善將助推
79、行業積極發展自 2019 年中國在區塊鏈領域的高位階立法中華人民共和國密碼法出臺,于 2020 年 1 月 1 日生效,區塊鏈相關的法律法規不斷在完善。根據 Cointelegraph Research 數據,Web3 投資自 2012 年發展至今規模逐漸擴大,2021 年相關領域投資金額達 304.9 億美元,VC 投資及并購活動數量達 1349 項。資本市場對區塊鏈行業的看好,代表了數字經濟在全球背景下的逆趨勢化發展。技術助力數字信任,數字貨幣未來發展迅猛Web3.0 具備了 Web2.0 所不具備的去中心化的能力。Web2.0 時代,即現在的互聯網,用戶的數據信息儲存在不同社區所屬的服務
80、器中,這個服務器對用戶數據有著“生殺大權”,雖然互聯網用戶可以修改編輯自己的信息,但實質上這個權力最終還是歸服務方所有,用戶只具備使用權。Web3.0 應用的區塊鏈技術,能夠降低數字不信任帶來的交往危機,用戶可以通過基于區塊鏈技術的“數字貨幣”在互聯網上進行連接,這代表著用戶擁有了數字資產,直接削弱互聯網的中介性質,能夠讓內容的擁有者直接獲利,從經濟角度,這代表著用戶開始真正參與互聯網的建設。數字貨幣將有望成為 Web3.0 時代的新型代幣。352022 年度虛假流量白皮書352022 年度虛假流量白皮書(2)Web3.0 的發展未來,“智械危機”可能會首先出現于互聯網互聯網是一直在更新迭代的
81、,Web1.0 時代用戶依賴 web 瀏覽器連接全世界,能夠獲得許多從前不可能獲得的信息,但是編輯內容的權限只掌握在少數人手中,用戶被視作受眾只能閱讀;Web2.0 時代用戶能夠參與內容的讀寫與創建,并且獲得了更為多樣的交流方式與手段,更容易進行及時的通信,在縮短空間的基礎上壓縮了時間;而 Web3.0 是基于去中心化的區塊鏈技術,信息分布式地存儲于各個節點上,難以篡改,并且使得數據得以溯源。從互聯網的發展可以看出,每一個新技術都是基于原有技術的基礎上進行了突破,并且解決了現有的問題。目前我們將互聯網視作重要的信息來源,某種意義上信息與數據成為了新的生產要素,當能夠解決數據不信任的問題,互聯網
82、共識機制可能成為一種新的社會交往規則,進而與現實進行深度結合。但同樣的,智能的進步代表著機器越來越接近于我們,目前我們培養的對于區塊鏈技術的信任,也可能成為助長機器流量的推手。目前國內機器流量占比超 61.5%,在未來可能會更高,智能 AI 擁有比人類更龐大的數據庫與信息處理能力,不得不警惕重視虛假流量帶來的影響。關于極驗極驗,成立于 2012 年,是一家利用創新技術,幫助企業鑒別異常流量,同時洞察價值數據,將數據價值最大化的服務商。目前,極驗在 20 個細分行業的頭部企業覆蓋率達到 52.4%,涵蓋航空、電商、游戲、金融、地產、教育、政務等多個領域。與 Airbnb、華為、小米、微博、東方航
83、空、平安等全球 32 萬家企業達成合作,每天提供超過 14 億次的安全防護。先后獲得包括天使灣創投、IDG 資本、紅杉資本、火山石資本、博威資本在內的國內外知名風險投資機構的共同投資。目前,極驗已在北京、上海、廣州、深圳、杭州、西安、成都成立分部。聲明本報告的輸出基于極驗的數據觀察和風控實踐積累。報告中涉及的數據來自網上公開數據、極驗自身積累的數據以及深度調查等方式獲取的數據。由于數據來源、統計的方法、觀察視角和維度不同,與市場實情可能存在一定誤差。本報告僅從學術探討角度做分析研究,任何非法行為都將受到法律嚴懲。極驗交互安全平臺為企業提供一站式交互安全解決方案:訪問極驗官網,了解更多產品詳情3.0人機驗證 3.0 通用型解決方案全方位智能過濾惡意爬蟲全新 4.0極驗可信流量治理身份驗方案全新 4.0人機驗證 4.0 通用型解決方案幫助企業完善風控體系全新 4.0極驗短信服務解決方案關于極驗2022 年度虛假流量白皮書2022 Annual Fake Traffic report關注極驗公眾號極驗官網:https:/客服:400-8521-816郵箱: