0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

騰訊云把向量數(shù)據(jù)庫(kù)“卷”到哪一步了?

腦極體 ? 來(lái)源:腦極體 ? 作者:腦極體 ? 2024-01-15 09:49 ? 次閱讀

“不是我不明白,這世界變化快”,崔健在20世紀(jì)寫下的這句歌詞,放在剛剛過(guò)去的2023年,也同樣適用。技術(shù)風(fēng)向的變化之快,讓不少人感到驚訝,向量數(shù)據(jù)庫(kù)這一年的潮起潮落,就是一個(gè)典型的例子。

2023年初大模型、生成式 AI的起飛,也帶來(lái)了向量數(shù)據(jù)庫(kù)的火爆,投融資項(xiàng)目爆發(fā)式增長(zhǎng),傳統(tǒng)數(shù)據(jù)庫(kù)廠商和公有云廠商都推出了相關(guān)產(chǎn)品。然而一年狂飆之后,市場(chǎng)又開始退潮,前不久全球最著名的 AI 項(xiàng)目之一AutoGPT 宣布,不再使用向量數(shù)據(jù)庫(kù)。

向量數(shù)據(jù)庫(kù)真的是AI革命中的組成部分嗎?這一市場(chǎng)有哪些參與者?騰訊云為代表的公有云廠商,又在這場(chǎng)技術(shù)創(chuàng)新中發(fā)揮了什么作用?

向量數(shù)據(jù)庫(kù),剛剛開始

新技術(shù)的火爆,必然會(huì)伴隨炒作和泡沫,但向量作為大模型理解世界的數(shù)據(jù)形式,向量數(shù)據(jù)庫(kù)作為AI革命重要基建的位置,長(zhǎng)期來(lái)看,是不會(huì)動(dòng)搖的。

為什么這么說(shuō)?

向量數(shù)據(jù)庫(kù)并不是一種特別新的數(shù)據(jù)庫(kù)技術(shù),在AI領(lǐng)域已經(jīng)應(yīng)用了七八年,谷歌在2015年就宣布使用RankBrain語(yǔ)義檢索來(lái)處理搜索任務(wù)。如果說(shuō)數(shù)據(jù)庫(kù)是數(shù)據(jù)的“硬盤”,那么,向量數(shù)據(jù)庫(kù)就是更適合AI體質(zhì)的“硬盤”。

其“AI原生”的體質(zhì),具體表現(xiàn)在幾個(gè)方面:

1.更高的效率。AI算法,要從圖像、音頻和文本等海量的非結(jié)構(gòu)化數(shù)據(jù)中學(xué)習(xí),提取出以向量為表示形式的“特征”,以便模型能夠理解和處理。因此,向量數(shù)據(jù)庫(kù)比傳統(tǒng)基于索引的數(shù)據(jù)庫(kù)有明顯優(yōu)勢(shì)。

2.更低的成本。大模型要從一種新技術(shù)轉(zhuǎn)化為產(chǎn)業(yè)價(jià)值,必須達(dá)到合理的投入產(chǎn)出比,而向量數(shù)據(jù)庫(kù)可以有效減少存儲(chǔ)和計(jì)算成本。一個(gè)公開數(shù)據(jù)是,通過(guò)騰訊云向量數(shù)據(jù)庫(kù),QQ音樂(lè)人均聽歌時(shí)長(zhǎng)提升3.2%、騰訊視頻有效曝光人均時(shí)長(zhǎng)提升1.74%、QQ瀏覽器成本降低37.9%,就在于檢索效率、運(yùn)行穩(wěn)定性、運(yùn)營(yíng)效率、推薦算法等,有了較大的提升。

wKgaomWicmCAXATiAAD_3wEhQ1s318.jpg

(騰訊云數(shù)據(jù)庫(kù)產(chǎn)品架構(gòu))

3.更強(qiáng)的數(shù)據(jù)安全。有個(gè)企業(yè)直言:我沉淀了幾十年的內(nèi)部數(shù)據(jù),是我的的核心競(jìng)爭(zhēng)力,讓我無(wú)償去公開給大模型做訓(xùn)練,我肯定不愿意。想做大模型,還要確保數(shù)據(jù)的隱私安全,就必須與數(shù)據(jù)庫(kù)產(chǎn)品做好配合,這給向量數(shù)據(jù)庫(kù)的本地部署帶來(lái)了廣闊的需求。

4.更大的擴(kuò)展性。隨著大模型走向行業(yè)應(yīng)用,垂直領(lǐng)域的AI用例不斷增多,洶涌的數(shù)據(jù)洪潮和存算任務(wù),會(huì)帶來(lái)大量向量搜索的需求。而向量數(shù)據(jù)庫(kù)嵌入向量的長(zhǎng)度不受限制,具有良好的擴(kuò)展性,可以根據(jù)AI用例和模型而變化,更好地處理大規(guī)模數(shù)據(jù)集。

所以說(shuō),除非大模型技術(shù),在短期內(nèi)發(fā)生顛覆性改變,否則落地應(yīng)用還是需要向量檢索和向量數(shù)據(jù)庫(kù)。而作為大模型技術(shù)標(biāo)桿的OpenAI最近也透露:我們可能已經(jīng)非常接近實(shí)現(xiàn)通用人工智能(AGI),應(yīng)該以通用人工智能的實(shí)現(xiàn)為前提進(jìn)行創(chuàng)業(yè)和技術(shù)開發(fā)。

由此可以肯定,向量數(shù)據(jù)庫(kù)市場(chǎng)必然還會(huì)迎來(lái)一輪增長(zhǎng)。年底趨于冷靜,只是2023年熱情過(guò)度高漲的適當(dāng)回調(diào)。

兩股新勢(shì)力,云是方向

從引爆到飽和,向量數(shù)據(jù)庫(kù)市場(chǎng)的發(fā)展速度迅猛,也吸引了“群雄逐鹿”。

傳統(tǒng)數(shù)據(jù)庫(kù)廠商不必多說(shuō),既有相應(yīng)的能力建設(shè),也有一定的客戶基礎(chǔ),推出相關(guān)產(chǎn)品是必然。一些在AI領(lǐng)域積淀已久的科技大廠,如谷歌、微軟、Meta、百度等大廠,都有向量數(shù)據(jù)庫(kù)的技術(shù)積累,也都可以向外輸出相關(guān)能力和產(chǎn)品。這些我們都比較熟悉了。

而上一年狂飆突進(jìn)的兩股新勢(shì)力,成為市場(chǎng)上的黑馬,分別是創(chuàng)業(yè)公司和公有云。

以上半年爆火的AI創(chuàng)業(yè)新秀Pinecone為代表。Pinecone是閉源的領(lǐng)跑者,憑借良好的開箱即用的產(chǎn)品體驗(yàn),獲得了非常大的增長(zhǎng),B輪估值達(dá)到7.5億美元。其他競(jìng)爭(zhēng)者大多建立在開源項(xiàng)目的基礎(chǔ)上。

總體來(lái)說(shuō),這些創(chuàng)業(yè)“獨(dú)角獸”的向量數(shù)據(jù)庫(kù)公司,固然新銳,但長(zhǎng)期盈利能力還有待驗(yàn)證。原因是,其客戶大多是嘗鮮、實(shí)驗(yàn)性質(zhì)。

一般來(lái)說(shuō),企業(yè)需要先將非結(jié)構(gòu)化的私密數(shù)據(jù),進(jìn)行一個(gè)小的模型,進(jìn)行向量化,產(chǎn)生一個(gè)向量的矩陣,再存儲(chǔ)到向量數(shù)據(jù)庫(kù)里,來(lái)供大模型學(xué)習(xí)和檢索。這個(gè)過(guò)程涉及大量的工程化,會(huì)耗費(fèi)企業(yè)許多開發(fā)人員、時(shí)間成本,一開始可能會(huì)因?yàn)锳I大模型很火而對(duì)向量數(shù)據(jù)庫(kù)產(chǎn)生興趣,但能否真正在業(yè)務(wù)中落地還是個(gè)未知數(shù),因此,長(zhǎng)期付費(fèi)意愿還有較大的不確定性。

另一股“新勢(shì)力”:公有云廠商,也是向量數(shù)據(jù)庫(kù)的積極參與者。

不是所有企業(yè)都有能力自建大模型所需要的基礎(chǔ)設(shè)施,通過(guò)MaaS(模型即服務(wù))業(yè)務(wù)來(lái)訓(xùn)練應(yīng)用大模型,是更靈活的選擇。

此外,上云用數(shù)賦智是大勢(shì)所趨,很多政企客戶往往會(huì)選擇公有云或行業(yè)云來(lái)滿足其業(yè)務(wù)需求,將數(shù)據(jù)遷移到云上,對(duì)云數(shù)據(jù)庫(kù)的關(guān)注度和接受度上升,而這些用戶在探索大模型時(shí),會(huì)傾向于以整體解決方案的形式來(lái)交付,這就給了云廠商參與游戲的機(jī)會(huì),同時(shí)也要求云廠商提供向量數(shù)據(jù)庫(kù)的全棧支持。

以騰訊云為代表,騰訊云的AI 原生(AI Native)向量數(shù)據(jù)庫(kù)Tencent Cloud VectorDB是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫(kù)。

wKgZomWicmGAH1wsAAFY0q-PJAY975.jpg

除了產(chǎn)品之外,騰訊云提供了全面AI化解決方案,覆蓋接入層、計(jì)算層、存儲(chǔ)層,使用戶在使用向量數(shù)據(jù)庫(kù)的全生命周期,都能應(yīng)用到AI能力。有數(shù)據(jù)顯示,企業(yè)原先接入一個(gè)大模型需要花1個(gè)月左右時(shí)間,使用騰訊云向量數(shù)據(jù)庫(kù)后,3天時(shí)間即可完成,極大降低了企業(yè)的接入成本。

此外,騰訊龐大的業(yè)務(wù)集群及智能化應(yīng)用,為騰訊云向量數(shù)據(jù)庫(kù)提供了絕佳的練兵場(chǎng)。騰訊集團(tuán)每日處理千億次檢索的向量引擎(OLAMA),讓騰訊云向量數(shù)據(jù)庫(kù)的基本功能和性能得到了更加充分地檢驗(yàn)與優(yōu)化,從而淬煉出了很多讓人眼前一亮的新能力。

以騰訊視頻的應(yīng)用為例,視頻庫(kù)中的圖片、音頻、標(biāo)題文本等內(nèi)容使用騰訊云向量數(shù)據(jù)庫(kù),月均完成的檢索和計(jì)算量高達(dá)200億次,有效滿足了版權(quán)保護(hù)、原創(chuàng)識(shí)別、相似性檢索等場(chǎng)景需求。

風(fēng)物長(zhǎng)宜放眼量,AI技術(shù)還在快速變化之中,AI Native的騰訊云在這一市場(chǎng)領(lǐng)域的競(jìng)爭(zhēng)力還會(huì)進(jìn)一步擴(kuò)大。

接下來(lái),向量數(shù)據(jù)庫(kù)卷什么?

不難看到,市面上并不缺少向量數(shù)據(jù)庫(kù)產(chǎn)品,缺少的是商業(yè)模式。

據(jù)東北證券預(yù)測(cè),到 2030 年,全球向量數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模有望達(dá)到 500 億美元,國(guó)內(nèi)向量數(shù)據(jù)庫(kù)市場(chǎng)規(guī)模有望超過(guò)600億人民幣。想要吃到這塊巨大的蛋糕,僅僅形成技術(shù)趨勢(shì)是遠(yuǎn)遠(yuǎn)不夠的,成熟的產(chǎn)品化才能說(shuō)服用戶、兌現(xiàn)商業(yè)價(jià)值。

目前來(lái)看,以騰訊云為代表的云廠商有幾重特殊優(yōu)勢(shì),或許會(huì)讓向量數(shù)據(jù)庫(kù)加速走向商業(yè)成功:

1.多元化部署。垂直行業(yè)大模型,數(shù)據(jù)都是私有機(jī)密的,客戶一般不愿意放到公有云上,騰訊云提供私有部署、分布式、混合云等多種方案,打消疑慮。背后需要混合多云的云基礎(chǔ)設(shè)施。

2.一體化AI方案。向量數(shù)據(jù)庫(kù)的火爆,本質(zhì)是AI需求,而AI Native時(shí)代的數(shù)據(jù)工程,還有許多復(fù)雜問(wèn)題尚待解決,騰訊云提供一體化的AI解決方案,從底層算力集群、Maas模型平臺(tái)到全棧工具鏈,通過(guò)軟硬件協(xié)同優(yōu)化AI開發(fā)成本,是企業(yè)和開發(fā)者所期待的。

3.產(chǎn)業(yè)服務(wù)能力。AI技術(shù)革命方興未艾,行業(yè)熱情高漲,但大多處于嘗試探索期,需要結(jié)合自身業(yè)務(wù)、AI應(yīng)用、IT設(shè)施等多種因素試錯(cuò)并迭代,這個(gè)過(guò)程中,隨叫隨到、幫助客戶及時(shí)解決問(wèn)題的ToB服務(wù)能力,也是非??粗氐摹I罡a(chǎn)業(yè)互聯(lián)網(wǎng)的騰訊云,確實(shí)是企業(yè)在這場(chǎng)AI技術(shù)革命中可靠的伙伴。

開放、全面、貼心,才能支持企業(yè)用好向量數(shù)據(jù)庫(kù)、大模型等基礎(chǔ)設(shè)施,弄潮AI。

被大模型“帶飛”的向量數(shù)據(jù)庫(kù),才剛剛開始,將在騰訊云上長(zhǎng)出商業(yè)成功的羽翼,飛向更廣闊的天地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30887

    瀏覽量

    269060
  • 數(shù)據(jù)庫(kù)
    +關(guān)注

    關(guān)注

    7

    文章

    3799

    瀏覽量

    64387
  • 騰訊云
    +關(guān)注

    關(guān)注

    0

    文章

    211

    瀏覽量

    16788
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    251

    瀏覽量

    12261
  • 算力
    +關(guān)注

    關(guān)注

    1

    文章

    977

    瀏覽量

    14808
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2448

    瀏覽量

    2699
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—Mysql數(shù)據(jù)庫(kù)表記錄丟失的數(shù)據(jù)恢復(fù)流程

    Mysql數(shù)據(jù)庫(kù)故障: Mysql數(shù)據(jù)庫(kù)表記錄丟失。 Mysql數(shù)據(jù)庫(kù)故障表現(xiàn): 1、Mysql數(shù)據(jù)庫(kù)表中無(wú)任何數(shù)據(jù)或只有部分
    的頭像 發(fā)表于 12-16 11:05 ?147次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—Mysql<b class='flag-5'>數(shù)據(jù)庫(kù)</b>表記錄丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復(fù)流程

    托管可以操作數(shù)據(jù)庫(kù)嗎?安全性如何

    托管可以操作數(shù)據(jù)庫(kù)。在托管環(huán)境中,開發(fā)者可以通過(guò)使用服務(wù)提供商提供的API或SDK來(lái)連接并操作
    的頭像 發(fā)表于 12-11 13:35 ?71次閱讀

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好點(diǎn)?

    數(shù)據(jù)庫(kù)主機(jī)哪個(gè)好點(diǎn)?主機(jī)和數(shù)據(jù)庫(kù)各有優(yōu)勢(shì)
    的頭像 發(fā)表于 12-04 13:50 ?128次閱讀

    數(shù)據(jù)庫(kù)服務(wù)器哪個(gè)便宜些?

    服務(wù)器的價(jià)格區(qū)間相對(duì)更廣泛,因?yàn)橛脩艨梢愿鶕?jù)實(shí)際需求選擇不同配置和性能的服務(wù)器。而數(shù)據(jù)庫(kù)的價(jià)格則更多地依賴于數(shù)據(jù)庫(kù)類型和規(guī)格。在相同配置下,
    的頭像 發(fā)表于 11-12 10:55 ?187次閱讀

    數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

    個(gè)運(yùn)行在存儲(chǔ)上的SQLServer數(shù)據(jù)庫(kù),有1000多個(gè)文件,大小幾十TB。數(shù)據(jù)庫(kù)每10天生成個(gè)NDF文件,每個(gè)NDF幾百GB大小。數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 10-31 13:21 ?221次閱讀
    <b class='flag-5'>數(shù)據(jù)庫(kù)</b><b class='flag-5'>數(shù)據(jù)</b>恢復(fù)—通過(guò)拼接<b class='flag-5'>數(shù)據(jù)庫(kù)</b>碎片恢復(fù)SQLserver<b class='flag-5'>數(shù)據(jù)庫(kù)</b>

    數(shù)據(jù)庫(kù)可以租用嗎?完整租用流程來(lái)了

    數(shù)據(jù)庫(kù)是可以租用的,這是種合法且便捷的數(shù)據(jù)存儲(chǔ)和管理方式。數(shù)據(jù)庫(kù)
    的頭像 發(fā)表于 10-28 09:54 ?169次閱讀

    科技報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望

    科技報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望
    的頭像 發(fā)表于 10-14 17:18 ?256次閱讀

    文講清什么是分布式數(shù)據(jù)庫(kù)!

    分布式數(shù)據(jù)庫(kù)種先進(jìn)的數(shù)據(jù)管理系統(tǒng),它將傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)與分布式計(jì)算、計(jì)算和大
    的頭像 發(fā)表于 10-14 10:06 ?223次閱讀

    文詳解企業(yè)上數(shù)據(jù)庫(kù)是干嘛的

    業(yè)上數(shù)據(jù)庫(kù)是企業(yè)將其數(shù)據(jù)庫(kù)系統(tǒng)從傳統(tǒng)的本地數(shù)據(jù)中心遷移到由第三方服務(wù)提供商管理的遠(yuǎn)程服務(wù)器上的過(guò)程。這樣做的目的通常是為了提高
    的頭像 發(fā)表于 09-13 11:49 ?335次閱讀

    軟通動(dòng)力數(shù)據(jù)庫(kù)全棧服務(wù),助力企業(yè)數(shù)據(jù)庫(kù)體系全面升級(jí)

    。在企業(yè)節(jié)與"數(shù)博會(huì)"展區(qū),軟通動(dòng)力受邀分享數(shù)據(jù)庫(kù)專業(yè)服務(wù)全棧解決方案,并重點(diǎn)展示以全棧服務(wù)為核心的數(shù)智化能力。 軟通動(dòng)力高級(jí)數(shù)據(jù)庫(kù)服務(wù)專家劉江在開放演講中,分享
    的頭像 發(fā)表于 09-05 15:30 ?332次閱讀
    軟通動(dòng)力<b class='flag-5'>數(shù)據(jù)庫(kù)</b>全棧服務(wù),助力企業(yè)<b class='flag-5'>數(shù)據(jù)庫(kù)</b>體系全面升級(jí)

    DTCC2024前瞻:天翼數(shù)據(jù)庫(kù)專家共話TeleDB發(fā)展藍(lán)圖

    數(shù)據(jù)庫(kù)是IT基礎(chǔ)設(shè)施領(lǐng)域重要的組成部分,天翼緊跟數(shù)據(jù)庫(kù)行業(yè)技術(shù)方向與創(chuàng)新趨勢(shì),強(qiáng)化核心技術(shù)的自研實(shí)力,助力企業(yè)釋放數(shù)據(jù)價(jià)值。在8月22日-24日的第15屆中國(guó)
    的頭像 發(fā)表于 08-19 14:53 ?361次閱讀
    DTCC2024前瞻:天翼<b class='flag-5'>云</b><b class='flag-5'>數(shù)據(jù)庫(kù)</b>專家共話TeleDB發(fā)展藍(lán)圖

    大模型價(jià)格,向量數(shù)據(jù)庫(kù)”什么?

    被大模型“帶飛”這年,向量數(shù)據(jù)庫(kù)才剛剛寫下序言
    的頭像 發(fā)表于 05-23 09:24 ?1774次閱讀
    大模型<b class='flag-5'>卷</b>價(jià)格,<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫(kù)</b>“<b class='flag-5'>卷</b>”什么?

    阿里與中興通訊達(dá)成開源數(shù)據(jù)庫(kù)合作,助推國(guó)產(chǎn)數(shù)據(jù)庫(kù)發(fā)展

    據(jù)悉,阿里與中興通訊于5月16日公布開源數(shù)據(jù)庫(kù)合作事宜。中興通訊正式宣布加入PolarDB開源社區(qū),并擔(dān)任首屆理事會(huì)成員單位。
    的頭像 發(fā)表于 05-16 16:34 ?458次閱讀

    華為多模數(shù)據(jù)庫(kù) GeminiDB 架構(gòu)與應(yīng)用實(shí)踐直播問(wèn)答實(shí)錄

    多模數(shù)據(jù)庫(kù)作為種新興的數(shù)據(jù)管理解決方案,正在受到越來(lái)越多的關(guān)注。而華為多模數(shù)據(jù)庫(kù) GeminiDB 基于云原生
    的頭像 發(fā)表于 04-08 18:25 ?1160次閱讀

    搭載英偉達(dá)GPU,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司Zilliz發(fā)布Milvus2.4向量數(shù)據(jù)庫(kù)

    在美國(guó)硅谷圣何塞召開的 NVIDIA GTC 大會(huì)上,全球領(lǐng)先的向量數(shù)據(jù)庫(kù)公司 Zilliz 發(fā)布 Milvus 2.4 版本。這是款革命性的
    的頭像 發(fā)表于 04-01 14:33 ?479次閱讀
    搭載英偉達(dá)GPU,全球領(lǐng)先的<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫(kù)</b>公司Zilliz發(fā)布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>數(shù)據(jù)庫(kù)</b>