久久精品国产精品,中文在线最新版天堂8

隨著機器學(xué)習、隱私計算、高性能計算、深度學(xué)習訓(xùn)練、差分隱私的快速發(fā)展，如今的人工智能仍然面臨兩大挑戰(zhàn)。一是在大多數(shù)行業(yè)中，數(shù)據(jù)以孤島的形式存在；另一個是加強數(shù)據(jù)隱私和安全。為這些挑戰(zhàn)提出了一個可能的解決方案：安全聯(lián)邦學(xué)習。其中包括橫向聯(lián)邦學(xué)習、縱向聯(lián)邦學(xué)習和聯(lián)邦遷移學(xué)習。

聯(lián)邦學(xué)習（Federated Learning）是一種分布式機器學(xué)習技術(shù)，其核心思想是通過在多個擁有本地數(shù)據(jù)的數(shù)據(jù)源之間進行分布式模型訓(xùn)練，在不需要交換本地個體或樣本數(shù)據(jù)的前提下，僅通過交換模型參數(shù)或中間結(jié)果的方式，構(gòu)建基于虛擬融合數(shù)據(jù)下的全局模型，從而實現(xiàn)數(shù)據(jù)隱私保護和數(shù)據(jù)共享計算的平衡，即“數(shù)據(jù)可用不可見”、“數(shù)據(jù)不動模型動”的應(yīng)用新范式。許多客戶端（例如移動設(shè)備或整個組織）在中央服務(wù)器（例如服務(wù)提供商）的編排下協(xié)同訓(xùn)練一個模型，同時保持訓(xùn)練數(shù)據(jù)的分散。聯(lián)邦學(xué)習體現(xiàn)了集中數(shù)據(jù)收集和最小化的原則，可以減輕許多由傳統(tǒng)的、集中的機器學(xué)習和數(shù)據(jù)科學(xué)方法造成的系統(tǒng)性隱私風險和成本。

聯(lián)邦學(xué)習涉及在大規(guī)模分布式網(wǎng)絡(luò)中訓(xùn)練機器學(xué)習模型。雖然聯(lián)合平均（fedavg）是在此設(shè)置中訓(xùn)練非凸模型的主要優(yōu)化方法，但在跨統(tǒng)計異構(gòu)設(shè)備（即每個設(shè)備以非相同的時尚。眾所周知的 fedprox 框架來解決統(tǒng)計異質(zhì)性，它包含了 fedavg 作為一個特例。通過一種新穎的設(shè)備相異性假設(shè)為 fedprox 提供收斂保證，能夠表征網(wǎng)絡(luò)中的異質(zhì)性，最后，對一套聯(lián)合數(shù)據(jù)集進行了詳細的實證評估，證明了廣義 fedprox 框架相對于 fedavg 在異構(gòu)網(wǎng)絡(luò)中學(xué)習的魯棒性和穩(wěn)定性有所提高。

聯(lián)邦學(xué)習科研論文成果現(xiàn)狀

一、論文發(fā)表量復(fù)合年增長率為 40%

基于 AMiner 系統(tǒng)，通過關(guān)鍵詞組在標題和摘要中檢索 2016 年至 2021 年論文數(shù)據(jù)。結(jié)果顯示，研究時段內(nèi)聯(lián)邦學(xué)習相關(guān)論文共計 4576 篇，自 2016 年被提出以來，研究論文數(shù)量逐年增多，到 2021 年的復(fù)合年增長率為 40.78%，相關(guān)論文趨勢如下圖所示。

聯(lián)邦學(xué)習研究論文趨勢（2016-2021 年）

二、論文發(fā)布量以中美兩國為引領(lǐng)

根據(jù)論文作者所在機構(gòu)所屬國家進行排序分析，發(fā)現(xiàn)近年來聯(lián)邦學(xué)習論文發(fā)布量 TOP 10 國家依次是中國、美國、英國、俄羅斯、德國、印度、澳大利亞、加拿大、日本和法國。相關(guān)論文量較突出的國家是中國（1245 篇）和美國（1175 篇）詳細信息如下圖所示。

聯(lián)邦學(xué)習論文發(fā)表量 TOP 10 國家（2016-2021 年）

三、研究熱點涵蓋應(yīng)用、系統(tǒng)和模型設(shè)計、安全隱私三個領(lǐng)域

1、總體研究熱點

總體來看，基于 AMiner 系統(tǒng)的論文熱詞分析，發(fā)現(xiàn) 2016-2021 年聯(lián)邦學(xué)習領(lǐng)域的研究熱點 TOP 10 按熱度遞減依次包括：Internet of Things（物聯(lián)網(wǎng)）、blockchain（區(qū)塊鏈）、edge computing （邊緣計算）、optimization （優(yōu)化）、deep network（深度網(wǎng)絡(luò)）、aggregation（聚合）、differential privacy（差分隱私）、healthcare（醫(yī)療保?。?、Multiparty Computation（多方計算）、reinforcement learning（強化學(xué)習）等，如圖所示。可見，在研究時段內(nèi)，聯(lián)邦學(xué)習的主要研究熱點是關(guān)于應(yīng)用及相關(guān)算法模型。

2016-2021 年聯(lián)邦學(xué)習領(lǐng)域研究熱點詞云圖

2、主題熱點趨勢

通過 TF-IDF 算法對所研究時段內(nèi)每一年的聯(lián)邦學(xué)習主題相關(guān)論文數(shù)量進行計算，獲取論文數(shù)量 TOP 30 的熱點詞，然后聚合成聯(lián)邦學(xué)習的應(yīng)用（application）、系統(tǒng)和模型設(shè)計（system and model design ）和安全隱私（ secure and privacy）三個主題領(lǐng)域的研究熱點集。這三個細分主題的研究趨勢呈現(xiàn)出如下特征。

在應(yīng)用研究領(lǐng)域，聯(lián)邦學(xué)習的研究熱點按照總熱度由高到低依次包括物聯(lián)網(wǎng)（Internet of things）、邊緣計算（ edge computing ）、醫(yī)療保健（healthcare）、車輛交互（vehicle）、無線通信（ wireless communication ）、數(shù)據(jù)庫（database）、以及推薦（recommendation），詳細信息如圖所示。

聯(lián)邦學(xué)習在應(yīng)用方面的研究熱點趨勢（2016-2021 年）

關(guān)于聯(lián)邦學(xué)習在系統(tǒng)和模型設(shè)計方面的研究熱點趨勢情況如圖所示。由圖可見，截止目前，在系統(tǒng)和模型設(shè)計方面研究熱點依照熱度遞減分別是優(yōu)化（optimization）、聚合（aggregation）、魯棒性（ robustness ）、通信效率（ communication efficiency ）、異構(gòu) （heterogeneity）、公平性（fairness）、資源效率（resource efficiency）和激勵機制（incentive mechanism）。優(yōu)化主題曾經(jīng)在 2016 和 2017 年研究熱度最高，經(jīng)過 2018-2020 年的熱度相對弱化后，在 2021 年再度成為最熱門的研究主題。

2017 年，資源效率和公平性相關(guān)主題研究開始嶄露頭角

2018 年，通信效率相關(guān)研究占據(jù)熱度榜第一

2019 年，熱度最高的是與安全聚合相關(guān)研究，同時，對聯(lián)邦學(xué)習（數(shù)據(jù)和系統(tǒng)）異構(gòu)的研究大幅提升

2020 年，與異構(gòu)相關(guān)研究上升為最熱門，和激勵機制相關(guān)的研究數(shù)量大幅提升

2021 年，與優(yōu)化和聚合相關(guān)主題研究上升幅度顯著。

從熱度持續(xù)性看，聚合、優(yōu)化、魯棒性、激勵機制和公平性的相關(guān)研究在研究時段內(nèi)一直保持著不同程度的熱度上揚

聯(lián)邦學(xué)習系統(tǒng)和模型設(shè)計方面的研究熱點趨勢（2016-2021 年）

在安全隱私方面，聯(lián)邦學(xué)習研究主題依據(jù)總熱度遞減依次包括區(qū)塊鏈（blockchain）、差分隱私（differential privacy）、安全多方計算（multiparty computation）、惡意攻擊（malicious attack）、隱私泄露（privacy leakage）、同態(tài)加密（homomorphic encryption）、網(wǎng)絡(luò)安全（cyber security）以及容錯（fault tolerance），具體熱度趨勢情況如圖所示。在研究時段內(nèi)，區(qū)塊鏈、差分隱私、多方計算、惡意攻擊、隱私泄露和同態(tài)加密的研究熱度總體持續(xù)逐年上漲。

2016 年，研究最熱的是對聯(lián)邦學(xué)習中惡意攻擊的研究

2017 年，研究最熱的是差分隱私

2018 年，研究最熱的是安全多方計算所涉及數(shù)據(jù)安全和隱私保護技術(shù)，與區(qū)塊鏈結(jié)合的相關(guān)研究雖然于 2018 年出現(xiàn)但快速成為 2019 年至 2021 年最熱的研究主題

聯(lián)邦學(xué)習安全隱私方面的研究熱點趨勢（2016-2021 年）

四、高被引論文分析

根據(jù)聯(lián)邦學(xué)習領(lǐng)域論文被引用量進行排序，選取了排名前 3%的論文作為具有重大學(xué)術(shù)影響的高被引論文進行相關(guān)的作者及其所隸屬機構(gòu)與國家等特征分析。數(shù)據(jù)顯示，本年度聯(lián)邦學(xué)習領(lǐng)域高被引論文的最低被引次數(shù)是 120 次，是去年高被引論文最低被引次數(shù)的 3 倍，反映出該領(lǐng)域論文的整體學(xué)術(shù)影響力大幅提升。

1、六成以上高被引論文來自中美兩國

根據(jù)論文第一作者所在機構(gòu)的所屬國家進行統(tǒng)計分析，發(fā)現(xiàn)聯(lián)邦學(xué)習的近年來高被引論文發(fā)表主要是來自于美國和中國。其中，美國的高被引論文占 39.2%，雖然較上期下降了 1 個百分點，但仍為全球最多；中國的高被引論文占 26.4%，雖仍居于全球第二位，但數(shù)量比上期增加了近 10 個百分點；德國、英國、澳大利亞與新加坡也擁有一定數(shù)量的高被引論文；其余國家所發(fā)表高被引論文的占比均低于 4%，詳細信息如圖所示。

聯(lián)邦學(xué)習高被論文國家分布（2016-2021 年）

2、美國的論文被引用量全球顯著領(lǐng)先

聯(lián)邦學(xué)習相關(guān)論文總引用量 TOP 10 國家是美國、中國、澳大利亞、德國、新加坡、英國、印度、日本、以色列和波蘭，具體信息如圖所示。其中，美國的論文總被引用量明顯高于其他國家，其較上期增長 1.6 倍，仍占據(jù)榜首；中國的論文被引用量較上期增長近 3 倍，保持第二位置。印度、以色列和波蘭是本期新進入前十的國家，上期居于前十的沙特阿拉伯、韓國和瑞士本期未能進入前十。

聯(lián)邦學(xué)習論文引用量 TOP 10 國家（2016-2021 年）

從領(lǐng)先國家來看，美國聯(lián)邦學(xué)習被引用量最高的論文是谷歌公司研究科學(xué)家 H. Brendan Mcmahan 作為一作發(fā)表的論文 Communication-efficient learning of deep networks from decentralized data，該論文于 2016 年發(fā)表于 ArXiv e-prints (2016): arXiv- 1602，并在2017年收錄于AISTATS (International Conference on Artificial Intelligence and Statistics)，目前其被引用 4534 次。中國聯(lián)邦學(xué)習總體論文引用量居于第二，其中被引用最高的論文是香港科技大學(xué)計算機科學(xué)與工程學(xué)系教授楊強為第一作者、與微眾銀行 AI 部門、北京航空航天大學(xué)計算機學(xué)院的研究人員聯(lián)合發(fā)表的 Federated Machine Learning: Concept and Applications，該文被引用量 1936 次。

多開源聯(lián)邦學(xué)習系統(tǒng)框架詳細介紹

一、OpenMined——PySyft

PySyft 是開源社區(qū) OpenMined 推出的一個用于安全和私有深度學(xué)習的 Python 庫。它使用聯(lián)邦學(xué)習、差分隱私和加密計算來解耦私人和敏感數(shù)據(jù)，可以在主要的深度學(xué)習框架中使用，例如 TensorFlow 和 PyTorch。PySyft 代表在深度學(xué)習程序中啟用可靠的隱私模型的首批嘗試之一。 PySyft 的核心組件是稱為 SyftTensor 的抽象。

SyftTensors 旨在表示數(shù)據(jù)的狀態(tài)或轉(zhuǎn)換，并且可以鏈接在一起。鏈結(jié)構(gòu)始終在其頭部具有 PyTorch 張量，并且使用 child 屬性向下訪問由 SyftTensor 體現(xiàn)的變換或狀態(tài)，而使用 parent 屬性向上訪問由 SyftTensor 體現(xiàn)的變換或狀態(tài)。

二、微眾銀行——FATE

微眾銀行 AI 部門研發(fā)了FATE（Federated AI Technology Enabler）聯(lián)邦學(xué)習開源項目，是首個開源的聯(lián)邦學(xué)習工業(yè)級框架。目前 FATE 開源社區(qū)已匯聚了 700 多家企業(yè)、300 余所高校等科研機構(gòu)的開發(fā)者，是國內(nèi)最大的聯(lián)邦學(xué)習開源社區(qū)。

FATE 項目使用多方安全計算 (MPC) 以及同態(tài)加密 (HE) 技術(shù)構(gòu)建底層安全計算協(xié)議，以此支持不同種類的機器學(xué)習的安全計算，包括邏輯回歸、樹算法、深度學(xué)習（人工神經(jīng)網(wǎng)絡(luò)）和遷移學(xué)習等。FATE 目前支持三種類型聯(lián)邦學(xué)習算法：橫向聯(lián)邦學(xué)習、縱向聯(lián)邦學(xué)習以及遷移學(xué)習。

FATE 整體架構(gòu)如圖所示。FATE 主倉庫包含 FederatedML 核心聯(lián)邦算法庫和多方聯(lián)邦建模 Pipeline 調(diào)度模塊 FATE-Flow，F(xiàn)ATE 擁抱大數(shù)據(jù)生態(tài)圈，底層引擎支持使用微眾銀行自主研發(fā)的 EGGROLL 或者 Spark 進行高性能的計算。圍繞 FATE 聯(lián)邦學(xué)習生態(tài)，F(xiàn)ATE 還提供了完整的聯(lián)邦學(xué)習生態(tài)鏈，如聯(lián)邦可視化模塊 FATE-Board、聯(lián)邦在線推理模塊 FATE-Serving、聯(lián)邦多云管理 FATECloud 等。

微眾銀行 FATE 系統(tǒng)架構(gòu)

FederatedML 是 FATE 的聯(lián)邦學(xué)習算法庫模塊，提供了 20+種聯(lián)邦學(xué)習算法，支持縱向聯(lián)邦學(xué)習、橫向聯(lián)邦學(xué)習、聯(lián)邦遷移學(xué)習三種聯(lián)邦建模場景，覆蓋了工業(yè)建模的數(shù)據(jù)處理、特征變換、訓(xùn)練、預(yù)測、評估的全建模流程。另外，封裝了眾多的多方安全計算協(xié)議以提供給上層算法的調(diào)度和支持聯(lián)邦學(xué)習開發(fā)者的聯(lián)邦算法開發(fā)。

FATE-Flow 為 FATE 提供了端到端聯(lián)邦建模 Pipeline 調(diào)度和管理，主要包括 DAG 定義聯(lián)邦建模 pipeline、聯(lián)邦任務(wù)生命周期管理、聯(lián)邦任務(wù)協(xié)同調(diào)度、聯(lián)邦任務(wù)追蹤、聯(lián)邦模型管理等功能，實現(xiàn)了聯(lián)邦建模到生產(chǎn)服務(wù)一體化。 FATE-Board 聯(lián)邦學(xué)習建模的可視化工具，為終端用戶提供可視化和度量模型訓(xùn)練的全過程。

三、谷歌——TensorFlow Federated（TFF）

TensorFlow Federated project (TFF) 由谷歌公司開發(fā)和維護，是一個為聯(lián)邦機器學(xué)習和其他計算方法在去中心化數(shù)據(jù)集上進行實驗的開源框架。TFF 讓開發(fā)者能在自己的模型和數(shù)據(jù)上模擬實驗現(xiàn)有的聯(lián)邦學(xué)習算法，以及其他新穎的算法。TFF 提供的建造塊也能夠應(yīng)用于去中心化數(shù)據(jù)集上，來實現(xiàn)非學(xué)習化的計算，例如聚合分析。

TFF 的接口有兩層構(gòu)成：聯(lián)邦層（FL）應(yīng)用程序接口（API）和聯(lián)邦核心（FC）API。TFF 使得開發(fā)者能夠聲明和表達聯(lián)邦計算，從而能夠?qū)⑵洳渴鹩诟黝愡\行環(huán)境。 TFF 中包含的是一個單機的實驗運行過程模擬器。該聯(lián)邦學(xué)習的框架如圖所示。

不同于分布式訓(xùn)練理念，TFF 框架設(shè)計理念是以數(shù)據(jù)為主，而不是代碼分離上。在編寫模型、訓(xùn)練代碼的時候，將 clients 和 server 看作一個整體，同一個文件里不需要分割開 Server 端（S 端）和 Clients 端（C 端）的代碼，C 端和 S 端的區(qū)分是在代碼邏輯層面的。也就是說，用戶在編寫 TFF 代碼時，不需要指明某段代碼是應(yīng)該運行在 C 端還是 S 端）僅需要指出每個數(shù)據(jù)是儲存在C 端/S 端、是全局唯一的還是有多份拷貝的即可。類似 TF 的 non-eager 模式，當用戶編寫完模型代碼和訓(xùn)練代碼后，TFF 會自動地將代碼分別放置到 clients 和 server 設(shè)備上。用戶只要關(guān)注模型架構(gòu)、C&S 端交互的數(shù)據(jù)格式、聚合多 clients 模型的方式即可。

四、字節(jié)跳動——Fedlearner

字節(jié)跳動聯(lián)邦學(xué)習平臺 Fedlearner 基于字節(jié)跳動在推薦和廣告領(lǐng)域積累的機器學(xué)習建模技術(shù)和個性化推薦算法，可以支持多類聯(lián)邦學(xué)習模式，已經(jīng)在電商、金融、教育等行業(yè)多個落地場景實際應(yīng)用。

Fedlearner 聯(lián)邦學(xué)習平臺整個系統(tǒng)包括控制臺、訓(xùn)練器、數(shù)據(jù)處理、數(shù)據(jù)存儲等模塊，各模塊對稱部署在參與聯(lián)邦的雙方的集群上，透過代理互相通信，實現(xiàn)訓(xùn)練。

五、百度——PaddleFL

PaddleFL 是一個基于百度飛槳（PaddlePaddle）的開源聯(lián)邦學(xué)習框架。PaddleFL 提供很多聯(lián)邦學(xué)習策略及其在計算機視覺、自然語言處理、推薦算法等領(lǐng)域的應(yīng)用，例如，橫向聯(lián)邦學(xué)習（聯(lián)邦平均、差分隱私、安全聚合）和縱向聯(lián)邦學(xué)習（帶 privc 的邏輯回歸，帶 ABY3 的神經(jīng)網(wǎng)絡(luò)）。研究人員可以用 PaddleFL 復(fù)制和比較不同的聯(lián)邦學(xué)習算法。

此外，PaddleFL 還提供傳統(tǒng)機器學(xué)習訓(xùn)練策略的應(yīng)用，例如多任務(wù)學(xué)習、聯(lián)邦學(xué)習環(huán)境下的遷移學(xué)習、主動學(xué)習。依靠 PaddlePaddle 的大規(guī)模分布式訓(xùn)練和 Kubernetes 對訓(xùn)練任務(wù)的彈性調(diào)度能力，PaddleFL 可以基于全棧開源軟件輕松地部署。

PaddleFL 中主要提供兩種解決方案：Data Parallel 以及 Federated Learning with MPC (PFM)。通過 Data Parallel，各數(shù)據(jù)方可以基于經(jīng)典的橫向聯(lián)邦學(xué)習策略（如 FedAvg，DPSGD等）完成模型訓(xùn)練。此外，PFM 是基于多方安全計算（MPC）實現(xiàn)的聯(lián)邦學(xué)習方案。作為 PaddleFL 的一個重要組成部分，PFM 可以很好地支持聯(lián)邦學(xué)習，包括橫向、縱向及聯(lián)邦遷移學(xué)習等多個場景。

六、京東——九數(shù)聯(lián)邦學(xué)習 9NFL

京東自研的九數(shù)聯(lián)邦學(xué)習平臺（9NFL）于2020 年初正式上線。9NFL 平臺基于京東商業(yè)提升事業(yè)部 9N 機器學(xué)習平臺進行開發(fā)，在 9N 平臺離線訓(xùn)練、離線預(yù)估、線上推斷（inference）、模型的發(fā)版等功能的基礎(chǔ)上，增加了多任務(wù)跨域調(diào)度、跨域高性能網(wǎng)絡(luò)、大規(guī)模樣本匹配、大規(guī)?？缬蚵?lián)合訓(xùn)練、模型分層級加密等功能。整個平臺可以支持百億級/百 T 級超大規(guī)模的樣本匹配、聯(lián)合訓(xùn)練，并且針對跨域與跨公網(wǎng)的復(fù)雜環(huán)境，對可用性與容災(zāi)設(shè)計了一系列的機制與策略，保障整個系統(tǒng)的高吞吐、高可用、高性能。

七、FedML.AI——FedML

FedML 是一個以研究為導(dǎo)向的聯(lián)邦學(xué)習圖書館，支持分布式計算、移動/物聯(lián)網(wǎng)設(shè)備上訓(xùn)練和獨立模擬，可促進新的聯(lián)合學(xué)習算法的開發(fā)和公平的性能比較。支持分布式計算、移動/物聯(lián)網(wǎng)設(shè)備上訓(xùn)練和獨立模擬。

FedML 還通過靈活且通用的 API 設(shè)計和參考基準實現(xiàn)和促進了各種算法研究。針對非 I.I.D 設(shè)置的精選且全面的基準數(shù)據(jù)集旨在進行公平比較。 FedML 可以為聯(lián)合學(xué)習研究社區(qū)提供開發(fā)和評估算法的有效且可重復(fù)的手段。

八、臺灣人工智能實驗室——Harmonia

臺灣人工智能實驗室（AI Labs）開發(fā)了一個開源項目 Harmonia，旨在開發(fā)系統(tǒng)/基礎(chǔ)設(shè)施和圖書館，以簡化聯(lián)合學(xué)習的研究和生產(chǎn)用途。Harmonia 使用工程師熟悉的環(huán)境和語言，比如熱門的開源工具 Kubernetes、Git Large File Storage 和 GitOps 等。Harmonia 利用 Git 進行訪問控制、模型版本控制和服務(wù)器和聯(lián)合培訓(xùn) （FL）運行參與者之間的同步。FL 訓(xùn)練策略、全局模型和本地模型/漸變保存在 Git 存儲庫中。這些 Git respoitroies 的更新會觸發(fā) FL 系統(tǒng)狀態(tài)轉(zhuǎn)換。這將自動化 FL 培訓(xùn)過程。

FL 參與者被激活為由操作員和應(yīng)用容器組成的 K8S 吊艙。操作容器負責維護 FL 系統(tǒng)狀態(tài)，并通過 gRPC 與應(yīng)用程序容器通信。本地訓(xùn)練和聚合函數(shù)封裝在應(yīng)用程序容器中。此設(shè)計可在 Kubernetes 群集環(huán)境中輕松部署，并快速插件現(xiàn)有機器學(xué)習（ML）工作流。

非開源聯(lián)邦學(xué)習系統(tǒng)框架詳細介紹

一、騰訊——Angel PowerFL

Angel Power FL（原名 AngelFL）安全聯(lián)合計算是基于騰訊自研的多數(shù)據(jù)源聯(lián)合計算技術(shù)，提供安全、易用、穩(wěn)定、高性能的聯(lián)邦機器學(xué)習、聯(lián)合數(shù)據(jù)分析解決方案，助力數(shù)據(jù)融合應(yīng)用。它構(gòu)建在 Angel 機器學(xué)習平臺上，利用 Angel--PS 支持萬億級模型訓(xùn)練的能力，將很多在 Worker 上的計算提升到 PS（參數(shù)服務(wù)器）端；Angel PowerFL 為聯(lián)邦學(xué)習算法提供了計算、加密、存儲、狀態(tài)同步等基本操作接口，通過流程調(diào)度模塊協(xié)調(diào)參與方任務(wù)執(zhí)行狀態(tài)，而通信模塊完成了任務(wù)訓(xùn)練過程中所有數(shù)據(jù)的傳輸。

采用去中心的架構(gòu)設(shè)計，全自動化流程，算法支持 LR、XGBoost、PCA、用戶自定義神經(jīng)網(wǎng)絡(luò)模型（如 MLP、CNN、RNN、 Wide&Deep，DeepFM, DSSM 等）。Angel PowerFL 聯(lián)邦學(xué)習已經(jīng)在騰訊金融云、騰訊廣告聯(lián)合建模等業(yè)務(wù)中開始落地。目前主要應(yīng)用產(chǎn)品是騰訊云安全隱私計算。

二、京東科技——Fedlearn

京東數(shù)字科技集團（簡稱：京東數(shù)科，現(xiàn)名：京東科技）于 2020 年 10 月推出自主研發(fā)的聯(lián)邦學(xué)習平臺 Fedlearn。Fedlearn 平臺具有“六位一體”核心能力：多自研聯(lián)邦學(xué)習算法、多方同態(tài)加密、輕量級分布式架構(gòu)、區(qū)塊鏈與聯(lián)邦學(xué)習融合、數(shù)據(jù)安全容器、一站式操作平臺。

京東科技 Fedlearn 平臺具有三大特點：

1、數(shù)據(jù)和模型隱私方面

不同參與方之間沒有直接交換本地數(shù)據(jù)和模型參數(shù)，而是交換更新參數(shù)所需的中間數(shù)值。為了避免從這些中間數(shù)值中恢復(fù)數(shù)據(jù)信息，采用增加擾動對這些數(shù)值進行保護，確保了數(shù)據(jù)和模型的隱私安全

2、通訊方面

引入中心化數(shù)據(jù)交換的概念，使得數(shù)據(jù)的交換獨立于參與方

3、計算架構(gòu)

采用異步計算框架，提高模型訓(xùn)練的速度

三、富數(shù)科技——FMPC

富數(shù)多方安全計算平臺（FMPC）是上海富數(shù)科技旗下產(chǎn)品，目前未開源，主要通過體驗或者服務(wù)購買方式使用。

FMPC 架構(gòu)具有以下特點：

1、聯(lián)邦學(xué)習

原始數(shù)據(jù)不出門，參與各方本地建模；沒有敏感數(shù)據(jù)流通，只交互中間計算結(jié)果；整個模型被保護，參與各方只有自己模型參數(shù)；私有化部署；開放 API 快速開發(fā)；支持主流機器學(xué)習算法，如 LR, DT, RF, Xgboost 等；建模速度快 3 倍；密文訓(xùn)練精度誤差<1%。?

2、多方安全計算

落地應(yīng)用計算量 1.1 萬+次 /天；支持多方數(shù)據(jù)安全求交；支持一次多項式；支持多方歸因統(tǒng)計分析；支持多方多維數(shù)據(jù)鉆取分析；私有化部署。

3、匿蹤查詢

支持 100 億+條記錄；秒級響應(yīng)時間；查詢授權(quán)存證；甲方查詢信息不泄露；加密隧道避免中間留存；私有化部署。

隱私計算(聯(lián)邦學(xué)習)液冷GPU服務(wù)器

藍海大腦隱私計算（聯(lián)邦學(xué)習）大數(shù)據(jù)液冷GPU服務(wù)器基于數(shù)據(jù)隱私保護的安全建模過程提供豐富的可視化呈現(xiàn)，為終端用戶可視化和度量模型訓(xùn)練的全過程，支持模型訓(xùn)練過程全流程的跟蹤、統(tǒng)計和監(jiān)控等，幫助模型開發(fā)人員快速搭建聯(lián)邦學(xué)習任務(wù)，可根據(jù)客戶需求深度定制開發(fā)。是一款具備高性能、高可靠、高靈活及高擴展特性的深度學(xué)習操作系統(tǒng)，由高性能計算加速中間件、深度學(xué)習訓(xùn)練平臺及數(shù)據(jù)推理平臺三個子系統(tǒng)構(gòu)成，為用戶提供數(shù)據(jù)處理、模型訓(xùn)練、推理服務(wù)應(yīng)用等完整的 AI 解決方案。

一、用戶現(xiàn)狀

1、數(shù)據(jù)產(chǎn)品相互分離

同一業(yè)務(wù)可能隨著業(yè)務(wù)發(fā)展和需求變化，同時部署不同的數(shù)據(jù)庫和數(shù)據(jù)平臺產(chǎn)品；此外，為了保證企業(yè)的核心競爭力，企業(yè)不斷部署新的數(shù)據(jù)庫和數(shù)據(jù)平臺產(chǎn)品，不斷建設(shè)、合并和遷移業(yè)務(wù)。然而，豎井建設(shè)模式使得數(shù)據(jù)產(chǎn)品相互分離，導(dǎo)致數(shù)據(jù)孤島問題，最終降低了企業(yè)的數(shù)據(jù)共享能力。

2、系統(tǒng)復(fù)雜性劇增

傳統(tǒng)的解決方案需要經(jīng)過復(fù)雜耗時的ETL，將數(shù)據(jù)反復(fù)存儲在同一個存儲介質(zhì)中，然后重新開發(fā)業(yè)務(wù)獲得數(shù)據(jù)計算結(jié)果。數(shù)據(jù)分散存儲在不同的數(shù)據(jù)產(chǎn)品中，數(shù)據(jù)結(jié)構(gòu)存在差異，給跨產(chǎn)品數(shù)據(jù)間的關(guān)聯(lián)計算帶來了一定的難度。

3、開發(fā)運維困難

系統(tǒng)集成一段時間后，業(yè)務(wù)部門會推出新的業(yè)務(wù)數(shù)據(jù)庫，ETL流程需要改造。底層數(shù)據(jù)庫頻繁的業(yè)務(wù)架構(gòu)調(diào)整和數(shù)據(jù)變換也會導(dǎo)致集成系統(tǒng)的失敗。面對集成系統(tǒng)的開發(fā)和運維難題，企業(yè)自身的技術(shù)開發(fā)能力顯然難以應(yīng)對，最終集成系統(tǒng)的響應(yīng)速度無法滿足業(yè)務(wù)的時效性需求。

二、方案優(yōu)勢

1、統(tǒng)一平臺架構(gòu)

連接企業(yè)內(nèi)部各類數(shù)據(jù)源，滿足各種多樣復(fù)雜的業(yè)務(wù)需求，為企業(yè)提供平臺數(shù)據(jù)計算能力

2、極致性能

自主研發(fā)的統(tǒng)一分布式計算引擎可以根據(jù)不同的查詢對象，通過各種優(yōu)化技術(shù)自動優(yōu)化查詢，并實現(xiàn)毫秒級延遲

3、多數(shù)據(jù)源支持

支持傳統(tǒng)關(guān)系型數(shù)據(jù)庫、Nosql數(shù)據(jù)庫、MPP數(shù)據(jù)庫和大數(shù)據(jù)平臺產(chǎn)品

4、統(tǒng)一的SQL查詢

自主研發(fā)統(tǒng)一的SQL編譯器，通過一個標準的SQL就可以實現(xiàn)各個數(shù)據(jù)庫之間的關(guān)聯(lián)查詢

5、數(shù)據(jù)獨立性

實現(xiàn)跨數(shù)據(jù)庫、跨平臺的數(shù)據(jù)集成的同時，滿足底層數(shù)據(jù)庫的自治需求

6、安全合規(guī)

提供統(tǒng)一的權(quán)限體系、用戶行為審計與溯源，提供數(shù)據(jù)安全與合規(guī)保障

三、客戶收益

1、建設(shè)統(tǒng)一計算平臺，簡化IT系統(tǒng)架構(gòu)，降低IT成本

2、提升企業(yè)數(shù)據(jù)共享能力，快速響應(yīng)業(yè)務(wù)需求

3、提升企業(yè)信息技術(shù)架構(gòu)的敏捷程度，助力企業(yè)數(shù)據(jù)數(shù)字轉(zhuǎn)型

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31493

瀏覽量
270049
分布式

分布式

+關(guān)注

關(guān)注
1

文章
923

瀏覽量
74586
機器學(xué)習

機器學(xué)習

+關(guān)注

關(guān)注
66

文章
8438

瀏覽量
132972
網(wǎng)絡(luò)訓(xùn)練

網(wǎng)絡(luò)訓(xùn)練

+關(guān)注

關(guān)注
0

文章
3

瀏覽量
1512

百度文心大模型日均調(diào)用量超15億

近日，百度在上海世博中心舉辦了主題為“應(yīng)用來了”的百度世界2024大會。會上，百度董事長李彥宏分享了關(guān)于大模型行業(yè)的最新動態(tài)和百度文心大模型

發(fā)表于 11-12 15:28 ?343次閱讀

李彥宏宣布：百度文心大模型日調(diào)用量超15億

在百度世界2024大會上，百度公司創(chuàng)始人李彥宏宣布了一項令人矚目的數(shù)據(jù)：百度文心大模型的日調(diào)用量

發(fā)表于 11-12 10:40 ?249次閱讀

分布式光纖測溫解決方案

分布式光纖測溫解決方案

發(fā)表于 11-12 01:02 ?215次閱讀

<b class='flag-5'>分布式</b>光纖測溫<b class='flag-5'>解決方案</b>

智慧公交是什么？一文帶你詳解智慧公交的解決方案！

智慧公交是什么？一文帶你詳解智慧公交的解決方案！

發(fā)表于 11-05 12:26 ?388次閱讀

智慧公交是什么？<b class='flag-5'>一</b><b class='flag-5'>文</b>帶你<b class='flag-5'>詳解</b>智慧公交的<b class='flag-5'>解決方案</b>！

基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

發(fā)表于 09-14 09:53 ?369次閱讀

基于<b class='flag-5'>分布式</b>存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲<b class='flag-5'>解決方案</b>

百度文心一言APP升級為文小言

百度宣布其文心一言APP正式升級為文小言，標志著百度在智能搜索領(lǐng)域邁出了重要一步。

發(fā)表于 09-04 16:06 ?554次閱讀

醫(yī)療PACS影像數(shù)據(jù)的極速分布式塊存儲解決方案

醫(yī)療PACS影像數(shù)據(jù)的極速分布式塊存儲解決方案

發(fā)表于 08-23 10:13 ?395次閱讀

醫(yī)療PACS影像數(shù)據(jù)的極速<b class='flag-5'>分布式</b>塊存儲<b class='flag-5'>解決方案</b>

百度發(fā)布智能代碼助手“文心快碼”

在近日舉辦的WAVE SUMMIT大會上，百度公司震撼發(fā)布了全新的智能代碼助手——“文心快碼”。這款基于百度文心大模型的強大工具，結(jié)合了海量

發(fā)表于 07-01 11:20 ?958次閱讀

黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

發(fā)表于 07-01 09:54 ?422次閱讀

黑龍江電力高性能WDS<b class='flag-5'>分布式</b>存儲系統(tǒng)<b class='flag-5'>解決方案</b>

百度推出全新智能代碼助手文心快碼,引領(lǐng)編碼效率新革命

在6月28日的百度WAVE SUMMIT深度學(xué)習開發(fā)者大會上，百度公司宣布了其旗下備受矚目的智能代碼助手Baidu Comate的正式中文名稱——“

發(fā)表于 06-29 16:26 ?957次閱讀

百度WAVE SUMMIT深度學(xué)習開發(fā)者大會,文心大模型4.0 Turbo震撼發(fā)布

及應(yīng)用國家工程研究中心主任王海峰正式發(fā)布了文心大模型4.0 Turbo，標志著百度在人工智能領(lǐng)域的又一重大突破。

發(fā)表于 06-28 16:30 ?522次閱讀

百度申請文小言商標

近日，百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司在知識產(chǎn)權(quán)領(lǐng)域有了新動作。據(jù)天眼查知識產(chǎn)權(quán)信息顯示，百度已申請多枚“文小言”商標，這些商標將涵蓋廣告銷

發(fā)表于 06-19 09:20 ?519次閱讀

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成今天2024百度移動生態(tài)萬象大會在江蘇蘇州舉辦，特別是AI搜索與百度文心

發(fā)表于 05-30 18:58 ?441次閱讀

百度文心大模型擴展合作領(lǐng)域

百度創(chuàng)始人兼CEO李彥宏在2024年第一季度財報電話會上宣布，文心大模型API在繼與中國三星、榮耀成功合作后，本季度再度實現(xiàn)重要突破。小米、

發(fā)表于 05-17 11:17 ?618次閱讀

日產(chǎn)汽車將搭載百度AI解決方案

日產(chǎn)汽車與百度達成戰(zhàn)略合作，雙方正式簽署諒解備忘錄，共同探索智能技術(shù)在汽車領(lǐng)域的應(yīng)用。根據(jù)協(xié)議，日產(chǎn)將在中國市場的車型上搭載百度的AI解決方案，進一

發(fā)表于 05-06 14:14 ?473次閱讀

搜索歷史

一文詳解百度、谷歌、京東、騰訊在分布式網(wǎng)絡(luò)訓(xùn)練下的聯(lián)邦學(xué)習解決方案

評論

百度文心大模型日均調(diào)用量超15億

李彥宏宣布：百度文心大模型日調(diào)用量超15億

分布式光纖測溫解決方案

智慧公交是什么？一文帶你詳解智慧公交的解決方案！

基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

百度文心一言APP升級為文小言

醫(yī)療PACS影像數(shù)據(jù)的極速分布式塊存儲解決方案

百度發(fā)布智能代碼助手“文心快碼”

黑龍江電力高性能WDS分布式存儲系統(tǒng)解決方案

百度推出全新智能代碼助手文心快碼,引領(lǐng)編碼效率新革命

百度WAVE SUMMIT深度學(xué)習開發(fā)者大會,文心大模型4.0 Turbo震撼發(fā)布

百度申請文小言商標

2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成

百度文心大模型擴展合作領(lǐng)域

日產(chǎn)汽車將搭載百度AI解決方案

搜索歷史

一文詳解百度、谷歌、京東、騰訊在分布式網(wǎng)絡(luò)訓(xùn)練下的聯(lián)邦學(xué)習解決方案

評論

一文詳解百度、谷歌、京東、騰訊在分布式網(wǎng)絡(luò)訓(xùn)練下的聯(lián)邦學(xué)習解決方案