1 聯邦學習的定義
聯邦學習最初的定義是一種借助多方客戶端的私有數據集來訓練全局共享模型的分布式機器學習算法框架。從廣義上來說,聯邦學習指數據所有者不需要上傳私有數據集即可結合多方數據來訓練全局共享模型的方法,得到的模型的效果和直接整合數據到數據中心或一臺機器上進行訓練得到的模型的效果相近,同時也保護了數據的安全,避免泄露數據隱私。
2 聯邦學習的典型工作流程

(1) 問題確定:模型開發者需要明確使用聯邦學習來解決的問題。
(2)客戶端配置:客戶端(例如,在手機上運行的應用程序)將被部署配置來收集本地模型訓練所必需的數據集。在一般情況下,應用程序可能已經存儲了數據(例如,短信應用程序存儲文本消息,照片管理應用程序存儲照片)。在某些情況下,可能需要維護其他數據,例如用戶交互數據,為監督學習任務提供標簽。
(3)仿真原型(可選):模型開發者使用輔助數據集在聯邦學習仿真環境中對模型的體系結構進行原型設計并測試學習模型超參數。
(4)聯合模型訓練:開始執行多個聯邦訓練任務以訓練多個模型結構或具有不同優化超參數的模型。
(5)(聯合)模型評估:在模型經過充分訓練之后,將對模型進行分析和評估,挑選出較好的模型。對模型的分析可能包括在數據中心的標準數據集上計算度量標準,或者進行聯合評估——將模型推送給受約束的一些客戶端,用他們的本地客戶端私有數據集進行評估。
(6)部署:最后,一旦選擇好模型后,它將經歷一個標準模型啟動過程。包括人工的質量檢測,實時A/B測試(通常通過在某些設備上使用新模型以及在其他設備上使用上一代模型來比較它們的內部性能)和分階段推出(以便在影響太多用戶之前可以發現存在的問題并回滾)。模型的特定啟動過程由應用程序的所有者設置,通常與模型的訓練方式無關。此步驟也同等地應用于通過聯邦學習和傳統數據中心方法訓練的模型。
3 聯邦學習的分類
Qiang Yang等人根據參與方數據分布的不同,將聯邦學習分為三類,分別是橫向聯邦學習(Horizontal Federated
Learning,HFL)、縱向聯邦學習(Vertical Federated Learning,VFL)、遷移聯邦學習(Transfer Federated
Learning,TFL)。

(1)橫向聯邦學習,又稱基于樣本的聯邦學習。一般用于實體間用戶特征重疊較多,而用戶重疊較少的情況下。
(2)縱向聯邦學習,又稱基于特征的聯邦學習。一般適用于企業間具備相同或者類似的用戶空間,但是卻擁有不同的特征空間。
(3)聯邦遷移學習則適用于參與方不僅樣本維度而且擁有完全不同的特征空間,例如一個在中國的電商公司和一個在印度的社交網絡公司。
4 聯邦學習技術的應用
聯邦學習技術的行業應用最早出現在2018年,主要應用于包括IT科技、安全防護、金融、智慧城市、醫療健康、智慧零售、電信、教育等領域。
例如:
IT行業應用:用戶數據保護、隱私數據安全流轉、可擴展分布式數據協作、聯合學習、聯合計算、數據共享、模型訓練、面向產業應用的工具組件、數據脫敏及去標識化、加密算法支持、DMZ區建設、大數據安全等;
電信業應用:車聯網通信、智能手機、聯邦節點管理、邊緣節點管理、數據采集、模型訓練、推理判斷及智能預測、識別業務流量后的帶寬控制、阻塞控制、業務保障,用戶信用評估、用戶滿意度提升等;
金融領域:金融風險管理、數據安全、隱私保護、小微信貸、深度聯合建信用模型、客服、偵測欺詐、高性能分布式異構計算技術、軟硬件解決方案、提升金融服務質量、安全深入地挖掘數據價值等等.
推薦閱讀:《智譜AI&清華大學:2021聯邦學習全球研究與應用趨勢報告(95頁).pdf》