您的當前位置: 首頁 > 新聞中心 > 行業知識 > 聯邦學習啥意思?算法原理是怎樣的?

聯邦學習啥意思?算法原理是怎樣的?

1、聯邦學習

傳統的機器學習算法需要用戶將源數據上傳到高算力的云服務器上集中訓練,這種方式導致了數據流向的不可控和敏感數據泄露問題。Mcmahan等在2016年提出聯邦學習技術,允許用戶在機器學習過程中既可以保護用戶隱私,又能夠無須源數據聚合形成訓練數據共享。聯邦學習本質上是一種分布式的機器學習技術,其流程如圖1所示。

聯邦學習

客戶端(如平板電腦、手機、物聯網設備)在中心服務器(如服務提供商)的協調下共同訓練模型,其中客戶端負責訓練本地數據得到本地模型(local model)。中心服務器負責加權聚合本地模型,得到全局模型(global model),經過多輪迭代后最終得到一個趨近于集中式機器學習結果的模型w,有效地降低了傳統機器學習源數據聚合帶來的許多隱私風險。

聯邦學習技術特點

(1)參與聯邦學習的原始數據都保留在本地客戶端,與中心服務器交互的只是模型更新信息;

(2)聯邦學習的參與方聯合訓練出的模型w將被各方共享;

(3)聯邦學習最終的模型精度與集中式機器學習相似;

(4)聯邦學習參與方的訓練數據質量越高,全局模型精度越高。

2、聯邦學習算法原理

典型的聯邦學習場景是在本地客戶端設備負責存儲和處理數據的約束下,只上傳模型更新的梯度信息,在數千萬到數百萬個客戶端設備上訓練單個全局模型w。中心服務器的目標函數F(w) 通常表現為:

聯邦學習算法原理

其中,m是參與訓練的客戶端設備總數,n是所有客戶端數據量總和,kn是第k個客戶端的數據量,Fk(w) 是第K個設備的本地目標函數。

聯邦學習

其中,dk是第k個客戶端的本地數據集,fi(w) =α(xi,yi,w) 是具有參數w的模型對數據集dk中的實例(xi,yi)產生的損失函數。dk中所有實例產生的損失函數之和除以客戶端k的總數據量就是本地客戶端的平均損失函數,損失函數與模型精度成反比,因此,機器學習的目標函數優化通常是讓損失函數達到最小值。

聯邦學習的目標函數優化算法中,通常采用大批量隨機梯度下降(SGD)算法,即通過本地客戶端模型訓練的損失函數,乘以固定的學習率η ,計算出新一輪的權重更新。因此,本地客戶端的模型權重更新如下:

聯邦學習

第t輪通信中心服務器的模型聚合更新如下:

聯邦學習

本文由作者-YANYI發布,版權歸原作者所有,禁止轉載。本文僅代表作者個人觀點,與本網無關。本文文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

相關報告

清華大學:智譜AI&amp2021聯邦學習全球研究與應用趨勢報告(95頁).pdf
清華大學:智譜AI&amp2021聯邦學習全球研究與應用趨勢報告(95頁).pdf

論文摘要:現代移動設備可以訪問大量適合學習模型的數據,這反過來又可以大大改善設備上的用戶體驗。例如,語言模型可以改進語音識別和文本輸入,圖像模型可以自動選擇好的照片。然而,這些豐富的數據通常是隱私敏感的、數量龐大的,或者兩者兼而有之,這可能會妨礙使用傳統方法登錄到數據中心并在那里進行訓練。由此,學者們提出一

Wordpay:2017全球支付報告(57頁)(57頁).pdf
Wordpay:2017全球支付報告(57頁)(57頁).pdf

在線支付的權威指南 全球 支付報告 2017年11月 研究方法 全球支付趨勢 核心洞見 市場指南 支付方式定義 目錄 本報告基于一級和次級數據來源撰寫而成。一級(一手)數據來源,是指Worldpay自 身的調查研究;次級數據來源,是指權威第三方供應商數據或其他公共數據資源。本報 告也總結了Worldpay幾

中國移動:移動通信網絡中的聯邦學習白皮書(24頁).pdf
中國移動:移動通信網絡中的聯邦學習白皮書(24頁).pdf

隨著5G應用日趨多樣化,網絡的業務識別能力面臨多重挑戰:加密應用越來越多,人工分析識別率下降;業務類型越來越多,人工分析成本越來越高;應用更新越來越頻繁,人工分析響應速度無法及時識別;異廠家UPF數據無法集中、2B數據不出廠、不同UPF業務分布不均等原因,導致依靠單一UPF上的業務樣本數據進行業務識別模型訓

垃圾分類影響下的固廢大格局-熱話題與冷思考.pdf
垃圾分類影響下的固廢大格局-熱話題與冷思考.pdf

TongjiTongji UniversityUniversity1907-2019何品晶二級教授、博士生導師同濟大學 固體廢物處理與資源化研究所 所長Waste Management(Elsevier) 主編環境衛生工程主編Email: ; Http:/垃圾分類影響下的固廢大格局垃圾分類影響下的固廢大格局

中國信通院:聯邦學習場景應用研究報告(2022年)(69頁).pdf
中國信通院:聯邦學習場景應用研究報告(2022年)(69頁).pdf

聯邦學習聯邦學習場景應用場景應用研究報告研究報告 (2022 年)年)中國信息通信研究院泰爾終端實驗室中國信息通信研究院泰爾終端實驗室 2022022 2 年年 2 2 月月前前 言言數據作為數字經濟和信息社會的核心資源,被認為是繼土地、勞動力、資本、技術之后的又一個重要生產要素,其在企業數字化轉型中發揮

北京金融科技產業聯盟:聯邦學習技術金融應用白皮書(124頁).pdf
北京金融科技產業聯盟:聯邦學習技術金融應用白皮書(124頁).pdf

年來,數字經濟蓬勃發展,已經成為帶動中國經濟增長的核心動力。 

IBM:使聯邦機構以證據為基礎:學習議程的關鍵作用(英文版)(55頁).pdf
IBM:使聯邦機構以證據為基礎:學習議程的關鍵作用(英文版)(55頁).pdf

學習議程提供了一種工具,可作為組織戰略規劃的一個方面,特別側重于為決策者、組織領導者和利益相關者生成相關知識。學習議程有時被描述為聯邦機構研究和評估活動的戰略證據構建計劃。然而,在實踐中可能遠不止這些。一個具有包容性和戰略性的學習議程提供了一系列重要問題和解決問題的計劃,這些問題平衡了不同組織決策者的興趣、

中國人工智能產業發展聯盟:2021電信領域聯邦學習技術應用白皮書(37頁).pdf
中國人工智能產業發展聯盟:2021電信領域聯邦學習技術應用白皮書(37頁).pdf

電信網絡利用先進的人工智能技術通過及時有效地收集、傳輸、并隨時隨地學習數據,用于大量創新應用和智能服務。

客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站