0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

LinkedIn圖數(shù)據(jù)庫 LIquid:為9.3億會員提供實時數(shù)據(jù)訪問

jf_WZTOguxH ? 來源:AI前線 ? 2023-07-13 14:22 ? 次閱讀

最近,LinkedIn 分享了其圖數(shù)據(jù)庫 LIquid 是如何自動索引和實時訪問會員、學(xué)校、技能、公司、職位、工作、事件等之間的關(guān)系數(shù)據(jù)的。這個知識圖譜被稱為 LinkedIn 的“Economic Graph”,有 2700 億條邊,并且還在不斷增長,目前每秒處理 200 萬次查詢。

LinkedIn 將其“你可能認識的人(People You May Know,PYMK)”推薦系統(tǒng)從傳統(tǒng)的 GAIA 系統(tǒng)遷移到了 LIquid。這一變化顯著改善了每秒查詢數(shù)(QPS)、延遲和 CPU 利用率。QPS 從 120 增加到 18000,延遲從超過 15 秒下降到平均 50 毫秒以下,CPU 利用率下降了 3 倍以上。LIquid 還引入了新的數(shù)據(jù)庫索引技術(shù),支持實時數(shù)據(jù)查詢,實現(xiàn)了即時推薦。

3dad1186-213f-11ee-962d-dac502259ad0.jpg

圖片來源:https://engineering.linkedin.com/blog/2023/how-liquid-connects-everything-so-our-members-can-do-anything

上圖是系統(tǒng)的架構(gòu)圖,使用了 LIquid,可以以較小的延遲和可接受的硬件成本來執(zhí)行圖查詢。通過 LIquid 對 Economic Graph 的查詢生成數(shù)百個候選對象,并應(yīng)用第二個排名函數(shù)。這個排名函數(shù)使用 Venice 的機器學(xué)習(xí)功能和 Apache Pinot 的分析見解來評分并選擇最佳候選對象。過濾步驟為呈現(xiàn)和最終評分準備好了這個排名列表。

LIquid 的設(shè)計使其能夠伸縮到當前十倍的規(guī)模,可以支持 LinkedIn 9.3 億多會員的有機增長和新的語義領(lǐng)域。它提供 99.99% 的可用性,并可以自動根據(jù)圖的大小和活動量的增加進行自動伸縮。

圖數(shù)據(jù)庫使用基于 Datalog 的可組合聲明式查詢語言,幫助開發(fā)人員高效地訪問和使用數(shù)據(jù)。可組合語言能夠讓開發(fā)人員在現(xiàn)有的特性(叫作模塊)上進行構(gòu)建,聲明式語言能夠讓開發(fā)人員專注于表達他們想要開發(fā)的東西,而 LIquid 自動化了高效的訪問過程。開發(fā)人員因此可以快速變更數(shù)據(jù)集,大大減少了調(diào)整和更新數(shù)據(jù)庫所需的時間。

LinkedIn 工程總監(jiān) Bogdan Artintescu 描述了 LIquid 的發(fā)展路線圖:

要讓會員能夠做更多的事情,我們需要在回答會員的問題方面提供更加完善的能力。我們可以沿著兩個方向做出改進。首先,復(fù)雜的查詢和添加到 Economic Graph 的數(shù)據(jù)源的多樣性將會驅(qū)動新特性的開發(fā)和呈現(xiàn)。其次,豐富數(shù)據(jù)將提高推理能力。這可以通過創(chuàng)建派生數(shù)據(jù)(通過確定性算法或概率機器學(xué)習(xí)方法)或通過知識圖譜(KG)模式中更豐富的語義改進推理來實現(xiàn)。我們計劃專注于高性能圖形計算和分析,并建立一個 KG 生態(tài)系統(tǒng),讓我們的開發(fā)人員能夠進一步增強會員體驗。

LIquid 的成功激勵了 LinkedIn 的其他團隊和微軟的姐妹團隊將它作為圖數(shù)據(jù)索引。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:LinkedIn 圖數(shù)據(jù)庫 LIquid:為 9.3 億會員提供實時數(shù)據(jù)訪問

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?

    數(shù)據(jù)庫是一種部署在虛擬計算環(huán)境中的數(shù)據(jù)庫,它融合了云計算的彈性和可擴展性,用戶提供高效、靈活的數(shù)據(jù)庫服務(wù)。云
    的頭像 發(fā)表于 01-07 10:22 ?67次閱讀

    數(shù)據(jù)庫加密辦法

    企業(yè)對于數(shù)據(jù)的重視程度不言而喻,也衍生出了數(shù)據(jù)=資產(chǎn)的概念。但是數(shù)據(jù)泄漏的事件頻繁發(fā)生,為了保護數(shù)據(jù)資產(chǎn),企業(yè)有必要對數(shù)據(jù)庫做一些針對性的措
    的頭像 發(fā)表于 12-24 09:47 ?94次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫故障: Mysql數(shù)據(jù)庫表記錄丟失。 Mysql數(shù)據(jù)庫故障表現(xiàn): 1、Mysql數(shù)據(jù)庫表中無任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?179次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—MYSQL數(shù)據(jù)庫ibdata1文件損壞的數(shù)據(jù)恢復(fù)案例

    mysql數(shù)據(jù)庫故障: mysql數(shù)據(jù)庫文件ibdata1、MYI、MYD損壞。 故障表現(xiàn):1、數(shù)據(jù)庫無法進行查詢等操作;2、使用mysqlcheck和myisamchk無法修復(fù)數(shù)據(jù)庫
    的頭像 發(fā)表于 12-09 11:05 ?178次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

    一個運行在存儲上的SQLServer數(shù)據(jù)庫,有1000多個文件,大小幾十TB。數(shù)據(jù)庫每10天生成一個NDF文件,每個NDF幾百GB大小。數(shù)據(jù)庫包含兩個LDF文件。 存儲損壞,數(shù)據(jù)庫
    的頭像 發(fā)表于 10-31 13:21 ?261次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過拼接<b class='flag-5'>數(shù)據(jù)庫</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫</b>

    實時數(shù)據(jù)與數(shù)字孿生的關(guān)系

    、處理和分析的數(shù)據(jù)。這種數(shù)據(jù)的特點是高頻率、高速度和高準確性。在工業(yè)環(huán)境中,實時數(shù)據(jù)可以來自于各種傳感器、設(shè)備、機器和系統(tǒng),它們企業(yè)提供
    的頭像 發(fā)表于 10-25 14:42 ?401次閱讀

    Oracle數(shù)據(jù)恢復(fù)—異常斷電后Oracle數(shù)據(jù)庫報錯的數(shù)據(jù)恢復(fù)案例

    Oracle數(shù)據(jù)庫故障: 機房異常斷電后,Oracle數(shù)據(jù)庫報錯:“system01.dbf需要更多的恢復(fù)來保持一致性,數(shù)據(jù)庫無法打開”。數(shù)據(jù)
    的頭像 發(fā)表于 09-30 13:31 ?320次閱讀
    Oracle<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—異常斷電后Oracle<b class='flag-5'>數(shù)據(jù)庫</b>啟<b class='flag-5'>庫</b>報錯的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—Oracle數(shù)據(jù)庫文件system01.dbf損壞的數(shù)據(jù)恢復(fù)案例

    打開oracle數(shù)據(jù)庫報錯“system01.dbf需要更多的恢復(fù)來保持一致性,數(shù)據(jù)庫無法打開”。
    的頭像 發(fā)表于 09-21 14:25 ?396次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Oracle<b class='flag-5'>數(shù)據(jù)庫</b>文件system01.dbf損壞的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫出現(xiàn)823錯誤的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫故障: SQL Server附加數(shù)據(jù)庫出現(xiàn)錯誤823,附加數(shù)據(jù)庫失敗。數(shù)據(jù)庫沒有備份,無法通過備份恢復(fù)數(shù)據(jù)庫。
    的頭像 發(fā)表于 09-20 11:46 ?370次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SQL Server<b class='flag-5'>數(shù)據(jù)庫</b>出現(xiàn)823錯誤的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SqlServer數(shù)據(jù)庫底層File Record被截斷0的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫數(shù)據(jù)無法被讀取。 經(jīng)過數(shù)據(jù)庫數(shù)據(jù)恢復(fù)工程師的初步檢測,發(fā)現(xiàn)SQL Server數(shù)據(jù)庫文件無法被讀取的原因是底層
    的頭像 發(fā)表于 07-26 11:27 ?407次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—SqlServer<b class='flag-5'>數(shù)據(jù)庫</b>底層File Record被截斷<b class='flag-5'>為</b>0的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—SQL Server數(shù)據(jù)庫所在分區(qū)空間不足報錯的數(shù)據(jù)恢復(fù)案例

    SQL Server數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 某品牌服務(wù)器存儲中有兩組raid5磁盤陣列。操作系統(tǒng)層面跑著SQL Server數(shù)據(jù)庫,SQL Server數(shù)據(jù)庫存放在D盤分區(qū)中。
    的頭像 發(fā)表于 07-10 13:54 ?522次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—raid5陣列上層Sql Server數(shù)據(jù)庫數(shù)據(jù)恢復(fù)案例

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)環(huán)境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統(tǒng)服務(wù)器使用。windows系統(tǒng)服務(wù)器內(nèi)運行了Sql Server數(shù)據(jù)庫,存儲空間在操作系統(tǒng)層面劃分了三個邏輯分區(qū)
    的頭像 發(fā)表于 05-08 11:43 ?523次閱讀
    <b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—raid5陣列上層Sql Server<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    態(tài)勢數(shù)據(jù)如何存儲在數(shù)據(jù)庫里面呢

    、穩(wěn)定的數(shù)據(jù),強調(diào)維護數(shù)據(jù)的完整性、一致性 , 其性能目標是高系統(tǒng)吞吐量和低代價 , 但對處理的定時限制沒有嚴格要求。而實時數(shù)據(jù)庫系統(tǒng)需要結(jié)合實時數(shù)據(jù)處理技術(shù)和
    的頭像 發(fā)表于 04-22 16:46 ?376次閱讀

    數(shù)據(jù)庫數(shù)據(jù)恢復(fù)】Oracle數(shù)據(jù)庫ASM實例無法掛載的數(shù)據(jù)恢復(fù)案例

    oracle數(shù)據(jù)庫ASM磁盤組掉線,ASM實例不能掛載。數(shù)據(jù)庫管理員嘗試修復(fù)數(shù)據(jù)庫,但是沒有成功。
    的頭像 發(fā)表于 02-01 17:39 ?535次閱讀
    【<b class='flag-5'>數(shù)據(jù)庫</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)】Oracle<b class='flag-5'>數(shù)據(jù)庫</b>ASM實例無法掛載的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)案例

    應(yīng)用方案:實時數(shù)據(jù)加密

    應(yīng)用方案:實時數(shù)據(jù)加密 利用CPLD設(shè)計加密電路方便可行,能夠較好地實現(xiàn)加密功能。AG32系列MCU產(chǎn)品,在芯片內(nèi)部內(nèi)置了CPLD邏輯,可以有效地滿足各種數(shù)據(jù)采集需求,降低了客戶的BOM成本。以下
    發(fā)表于 01-15 08:57