日韩亚卅人妻无码,亚洲欧美中文国产二区

面對大量不斷迭代的新知識，大模型必須“終身學(xué)習(xí)”才能滿足實際應(yīng)用的需求。RAG（Retrieval-augmented Generation，檢索增強生成）讓生成式大模型能夠利用外部的知識源來增強生成能力，提高生成質(zhì)量和可靠性。但企業(yè)構(gòu)建知識檢索系統(tǒng)并非易事，通常面臨開發(fā)門檻高、生成內(nèi)容差等難題。而借助浪潮信息元腦企智EPAI企業(yè)大模型開發(fā)平臺，企業(yè)僅需三步即可高效創(chuàng)建大模型RAG，讓企業(yè)內(nèi)部積累的大量數(shù)據(jù)得到有效利用，喚醒企業(yè)沉睡的知識，顯著提升大模型回答的準(zhǔn)確性。

RAG：生成式大模型落地的最佳實踐方案

在AIGC大模型落地企業(yè)應(yīng)用過程中，必然會碰到的一個問題是，大模型從訓(xùn)練到完成部署，并不意味著抵達了開發(fā)工作的“終點”。在真實場景中，每時每刻都在產(chǎn)生大量數(shù)據(jù)，知識會迭代得飛快，如新學(xué)說的出現(xiàn)、領(lǐng)域知識的更新、某個定義的延展、某個指標(biāo)的調(diào)整等，“終身學(xué)習(xí)”不僅適用于人類本身，對AI來說同樣是必須具備的能力。一旦喪失這種能力，大模型會很快表現(xiàn)出能力的“天花板”，包括產(chǎn)生幻覺、缺乏對生成文本的可解釋性、專業(yè)領(lǐng)域知識理解差，以及對最新知識的了解有限等等。

針對這一問題，業(yè)界主要有兩種解決途徑：一種是微調(diào)（Fine Tune）來更新模型，另一種是讓AI能夠與外部世界互動，以不同的形式和方式獲取知識，即大模型+RAG。

微調(diào)固然效果好，可以讓模型真正的“學(xué)會”一些私域知識。但是微調(diào)也會帶來幾個問題：首先，由于生成模型依賴于內(nèi)在知識（權(quán)重），因此模型還是無法擺脫幻覺的產(chǎn)生，在對理解門檻高且準(zhǔn)確性要求嚴(yán)格的場景下，這是完全無法接受的。其次，模型微調(diào)并不是一個簡單的工作，無論是從數(shù)據(jù)準(zhǔn)備、算力消耗、微調(diào)效果、訓(xùn)練時間等各個角度來看，隨時用新產(chǎn)生的數(shù)據(jù)來進行微調(diào)都是不現(xiàn)實的，且最終微調(diào)的效果也無法保證，能夠做到每月更新一次都已經(jīng)是很理想的狀態(tài)。

相比之下，RAG讓生成式大模型能夠利用外部的知識源（非模型本身的知識庫）來增強模型的生成能力，減少生成內(nèi)容的偏差和錯誤，提高生成質(zhì)量和可靠性，在有效緩解模型幻覺的同時，也能夠“喚醒沉睡的知識”，讓企業(yè)內(nèi)部積累的大量數(shù)據(jù)得到有效利用。由于接入外部實時動態(tài)數(shù)據(jù)，RAG在理論上沒有知識邊界的限制，且無需頻繁進行模型訓(xùn)練，故已經(jīng)成為生成式大模型行業(yè)落地最佳實踐方案。

RAG很好，但好的RAG不好開發(fā)

RAG雖好，但在實際開發(fā)應(yīng)用的場景中，企業(yè)構(gòu)建知識檢索系統(tǒng)并非易事，通常面臨較高的開發(fā)門檻和較差的生成內(nèi)容等難題。

■ 技術(shù)門檻高，開發(fā)效率低

首先，即便技術(shù)人員編程能力扎實、深悟大模型架構(gòu)原理，從海量開源方案里挑選出最合適的大模型+ RAG組合，也需要不斷的試錯，定制化開發(fā)的時間成本高昂。其次，RAG的構(gòu)建包含知識文檔的準(zhǔn)備、嵌入模型（embedding model）、向量數(shù)據(jù)庫、查詢檢索和生成回答五個基本環(huán)節(jié)，各個環(huán)節(jié)均有著極大的優(yōu)化空間。如在處理企業(yè)數(shù)據(jù)時，仍需設(shè)計流程，清洗、分類、標(biāo)注各類數(shù)據(jù)，保其質(zhì)量達模型訓(xùn)練標(biāo)準(zhǔn)；檢索參數(shù)配置同樣如此，向量模型選取與優(yōu)化若有差池，也易使模型訓(xùn)練失敗、檢索不準(zhǔn)。而遵循效果相乘疊加的定律，90%×90%×90%×90%×90%=59%，這意味著任何一個環(huán)節(jié)優(yōu)化效果不佳，將會導(dǎo)致最終的生成效果與最初設(shè)想相距甚遠。

■ 復(fù)雜文檔解析能力不足，生成效果差

企業(yè)數(shù)據(jù)文檔種類繁雜，高質(zhì)量的文檔解析能力會極大影響最終的知識檢索成效。以金融機構(gòu)為例，合同、報告、Excel 財務(wù)數(shù)據(jù)表及 PPT 產(chǎn)品介紹等文檔多格式并行，開源RAG方案對此的解析能力較差，如在合同關(guān)鍵條款的提取方面失準(zhǔn)，條款解讀發(fā)生偏差；進行產(chǎn)品比對推薦時，易導(dǎo)致檢索參數(shù)及大模型抉擇失當(dāng)，推薦金融產(chǎn)品難以滿足個性化需求，使客戶對企業(yè)信任與滿意度滑坡。

元腦企智EPAI：構(gòu)建大模型RAG僅需三步，喚醒企業(yè)沉睡的知識

針對當(dāng)前企業(yè)在構(gòu)建RAG上普遍面臨的難題，浪潮信息元腦企智EPAI（Enterprise Platform of AI）為企業(yè)發(fā)掘數(shù)據(jù)資產(chǎn)、“喚醒沉睡的知識”提供了強大的開發(fā)平臺，文檔解析、知識庫構(gòu)建、檢索增強生成等特色功能，不僅極大提升了企業(yè)知識管理系統(tǒng)的構(gòu)建效率，還顯著增強了大模型回答的準(zhǔn)確性。

■ 高效的文檔解析與知識庫構(gòu)建

元腦企智EPAI適配PDF、TXT、DOCX等多類文檔格式上傳解析，可深度處理文檔內(nèi)容，通過強大數(shù)據(jù)清洗和靈活的知識分塊，幫助企業(yè)建立高質(zhì)量私域知識庫，并支持復(fù)雜問題、大型數(shù)據(jù)集或跨多個文檔查詢。

■ 更優(yōu)的檢索增強生成效果

元腦企智EPAI囊括關(guān)鍵詞檢索、語義檢索、混合檢索等多元檢索模式，精準(zhǔn)適配各類場景檢索訴求。用戶可依自身特定需求，選擇最合適的檢索方法。借由自動化 RAG pipeline技術(shù)，能敏捷抓取最新知識融入大模型，實現(xiàn)檢索庫的定期更新，從而確保生成的文本內(nèi)容基于最新的信息，提升生成內(nèi)容的準(zhǔn)確性和效率，切實滿足企業(yè)多樣化的使用需求。

經(jīng)過浪潮信息在大模型+RAG開發(fā)上的反復(fù)實踐與驗證，元腦企智EPAI封裝了浪潮信息深度優(yōu)化的RAG環(huán)境，開發(fā)者僅需三步即可快速完成檢索增強生成系統(tǒng)的構(gòu)建。

Step1創(chuàng)建知識庫，奠定知識基石

首先，用戶需要在元腦企智EPAI上創(chuàng)建一個知識庫并上傳企業(yè)文檔。元腦企智EPAI支持多種文檔格式，包括PDF、TXT、DOCX等。然后選配解析參數(shù)，如編碼模型、文本分塊長度等。開始文檔解析。文檔解析是將文檔的內(nèi)容進行抽取并對其進行分塊，元腦企智EPAI在解析中支持文檔版式識別，對表格、圖片的文字都能做到精準(zhǔn)提取。

文檔解析成功后，內(nèi)容將被存儲在知識庫中，形成結(jié)構(gòu)化的知識塊。

Step2配置檢索參數(shù)，優(yōu)化檢索效能

在文檔解析完成后，用戶需要配置大模型和檢索參數(shù)，以優(yōu)化檢索效果。元腦企智EPAI提供了多種檢索參數(shù)，包括粗排引用數(shù)量、引用數(shù)量、檢索類型等。在檢索策略上，支持混合檢索、關(guān)鍵詞檢索、向量檢索等。

配置好檢索參數(shù)后，用戶可以進行檢索測試，以驗證文檔分塊和檢索效果。在檢索測試界面，用戶可以輸入測試文本，查看檢索結(jié)果。

Step3對話交互，實現(xiàn)智能應(yīng)用

測試完成后，元腦企智EPAI可以將知識庫發(fā)布為知識助手，并且提供在線交互和API兩種使用方式。

在線交互中，用戶輸入問題，元腦企智EPAI將結(jié)合知識庫內(nèi)容，通過大模型生成準(zhǔn)確的回答，并展示引用源。下圖展示，元腦企智EPAI作為營養(yǎng)問答助手，通過檢索增強生成，提供營養(yǎng)方面的回答。

如果選擇用API的方式，用戶可以通過元腦企智EPAI創(chuàng)建自定義助手，將配置好的模型和知識庫保存為助手，并通過API接口調(diào)用。這一功能使得用戶可以輕松地將元腦企智EPAI的RAG能力集成到現(xiàn)有的信息系統(tǒng)中，提升系統(tǒng)的智能化水平。

元腦企智EPAI讓某領(lǐng)先IT企業(yè)智能生產(chǎn)力激增

業(yè)界領(lǐng)先的某IT企業(yè)積極利用元腦企智EPAI平臺推動內(nèi)部的智能化轉(zhuǎn)型，目前已“零代碼”開發(fā)出IT售前助手“元小智”和撰稿助手“元小墨”。

在“元小智”開發(fā)過程中，該企業(yè)售前團隊（非專業(yè)開發(fā)人員）利用元腦企智EPAI內(nèi)置的數(shù)據(jù)處理工具，自動化解析結(jié)構(gòu)及非結(jié)構(gòu)化數(shù)據(jù)，從超 1500份涵蓋 PDF、DOCX、DOC、XLS等多樣格式的數(shù)據(jù)資源里，成功構(gòu)筑8大業(yè)務(wù)線所有在售產(chǎn)品知識庫，整個開發(fā)時間僅耗時1人1月，有力驅(qū)動知識集成與業(yè)務(wù)精進。

在“元小墨”開發(fā)過程中，該企業(yè)市場部團隊（非專業(yè)開發(fā)人員）按照不同業(yè)務(wù)線、稿件類型收集了1300+篇成文稿件、背景資料、速記、白皮書，一鍵打包上傳，不用任何代碼即構(gòu)建起專用知識庫。同時通過自動化的RAG pipeline 技術(shù)將最新的知識融入大模型，通過選擇關(guān)鍵詞檢索、語義檢索、混合檢索等不同的檢索策略，有效提升檢索生成內(nèi)容的準(zhǔn)確性。

在“元小墨”的加持下，該企業(yè)市場部團隊資料搜索時間縮減80%，同時內(nèi)容生成質(zhì)量躍升，緊密貼合多元需求，驅(qū)動市場傳播創(chuàng)新。如在內(nèi)容策劃時，關(guān)鍵詞檢索鎖定產(chǎn)品亮點與市場趨勢報告；定制文案階段，語義檢索精準(zhǔn)捕捉品牌意圖，推送契合風(fēng)格文案；官微運營中，利用混合檢索融合優(yōu)勢，從海量素材中精準(zhǔn)定位熱點關(guān)聯(lián)素材助力推文。

元腦企智EPAI(Enterprise Platform of AI)是浪潮信息的大模型應(yīng)用落地解決之道，能夠為企業(yè)AI大模型落地應(yīng)用提供高效、易用、安全的端到端開發(fā)平臺，提供數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、知識檢索、應(yīng)用框架等系列工具，支持調(diào)度多元算力和多模算法，幫助企業(yè)高效開發(fā)部署生成式AI應(yīng)用、打造智能生產(chǎn)力。在大模型技術(shù)持續(xù)演進的進程中，元腦企智EPAI 將以持續(xù)創(chuàng)新，助力企業(yè)智能應(yīng)用創(chuàng)新與效率提升。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

浪潮

浪潮

+關(guān)注

關(guān)注
1

文章
460

瀏覽量
23863
AI

AI

+關(guān)注

關(guān)注
87

文章
30887

瀏覽量
269063
大模型

大模型

+關(guān)注

關(guān)注
2

文章
2448

瀏覽量
2701

原文標(biāo)題：喚醒企業(yè)沉睡的知識，元腦企智EPAI三步高效創(chuàng)建大模型RAG

文章出處：【微信號：浪潮AIHPC，微信公眾號：浪潮AIHPC】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

浪潮信息與智源研究院達成戰(zhàn)略合作協(xié)議

正式接入浪潮信息的元腦企智EPAI企業(yè)大模型開發(fā)平臺，助力企業(yè)實現(xiàn)更快速、更廣泛、更

發(fā)表于 12-26 10:25 ?104次閱讀

浪潮信息發(fā)布"源"Yuan-EB，刷新RAG檢索最高成績

檢索任務(wù)的第一名，以78.41的平均精度刷新了大模型RAG檢索的最高成績。 "源"Yuan-EB的發(fā)布，標(biāo)志著浪潮信息在知識向量化技術(shù)方面取得了重要進展。該模型基于

發(fā)表于 12-25 15:54 ?99次閱讀

浪潮信息與17家元腦伙伴共簽億級分銷協(xié)議

近日，一場意義非凡的簽約儀式——2025年浪潮信息億級分銷伙伴簽約大會圓滿落幕。在這場盛會中，浪潮信息與來自全國12個省區(qū)的17家元腦生態(tài)伙伴共同簽署了億級分銷合作協(xié)議，攜手開啟合作共

發(fā)表于 12-25 15:46 ?113次閱讀

浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

近日，浪潮信息發(fā)布 “源”Yuan-EB（Yuan-embedding-1.0，嵌入模型），在C-MTEB榜單中斬獲檢索任務(wù)第一名，以78.41的平均精度刷新大模型RAG檢索最高成績，

發(fā)表于 11-26 13:54 ?184次閱讀

<b class='flag-5'>浪潮信息</b>發(fā)布“源”Yuan-EB助力<b class='flag-5'>RAG</b>檢索精度新高

元腦企智EPAI認證訓(xùn)戰(zhàn)營成功舉辦

近日，浪潮信息合作伙伴元腦企智EPAI認證訓(xùn)戰(zhàn)營暨認證儀式在濟南成功舉辦，來自25家元

發(fā)表于 11-04 13:44 ?172次閱讀

“元腦企智”EPAI：企業(yè)AI應(yīng)用從“手工作坊”到“工廠高精產(chǎn)線”

消滅“節(jié)后綜合癥”，“元腦企智”EPAI為職場人送出AI助攻

發(fā)表于 10-09 15:33 ?1926次閱讀

“<b class='flag-5'>元</b><b class='flag-5'>腦</b><b class='flag-5'>企</b>智”<b class='flag-5'>EPAI</b>：企業(yè)AI應(yīng)用從“手工作坊”到“工廠高精產(chǎn)線”

浪潮信息發(fā)布元腦企智一體機

在2024中國算力大會上，浪潮信息正式發(fā)布了其創(chuàng)新的元腦企智一體機。這款一體機融合了元腦

發(fā)表于 09-30 16:50 ?1406次閱讀

浪潮信息：元腦企智EPAI助力金融大模型快速落地

近日，2024金融科技應(yīng)用創(chuàng)新發(fā)展大會暨農(nóng)村金融機構(gòu)信息化發(fā)展創(chuàng)新座談會在上海舉辦。浪潮信息推出元腦企智

發(fā)表于 09-20 16:07 ?353次閱讀

33家元腦區(qū)域伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

近日，2024年浪潮信息區(qū)域ISP伙伴戰(zhàn)略簽約儀式圓滿落幕，標(biāo)志著浪潮信息在人工智能領(lǐng)域的合作版圖再度擴大。此次盛會匯聚了全國范圍內(nèi)33家實力雄厚的億級及千萬級元腦區(qū)域伙伴，共同簽署戰(zhàn)

發(fā)表于 08-14 16:25 ?457次閱讀

33家區(qū)域ISP伙伴與浪潮信息簽署戰(zhàn)略合作協(xié)議

，涉及互聯(lián)網(wǎng)、電信、金融和制造等人工智能應(yīng)用落地的前沿行業(yè)，雙方將依托浪潮信息元腦生態(tài)體系，以大模型開發(fā)平臺"元

發(fā)表于 08-14 15:43 ?355次閱讀

整數(shù)智能與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議

近日，整數(shù)智能與浪潮信息簽署元腦生態(tài)戰(zhàn)略合作協(xié)議。雙方將秉持協(xié)同共生、開放共贏的原則，在元腦生態(tài)的框架內(nèi)開展AI與數(shù)據(jù)科學(xué)領(lǐng)域的深度協(xié)作

發(fā)表于 05-27 11:21 ?441次閱讀

9家元腦生態(tài)伙伴與浪潮信息簽署億級分銷協(xié)議

北京2024年5月24日 /美通社/ -- 5月23日，2024浪潮信息億級分銷合作伙伴簽約儀式成功舉辦，浪潮信息與北京時空未來、上海金圭、濟南希望等9家元腦伙伴簽署億級分銷合作協(xié)議。

發(fā)表于 05-25 17:14 ?204次閱讀

浪潮信息“元腦”品牌全面升級，全力進擊人工智能！

在北京舉行的浪潮信息生態(tài)伙伴大會(IPF2024)上，浪潮信息總經(jīng)理胡雷鈞表示，未來，一切計算皆AI，“元腦”全面升級為包括所有計算產(chǎn)品的智算品牌，同時“

發(fā)表于 04-19 10:42 ?630次閱讀

浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺"元腦企智"EPAI，加速AI創(chuàng)新落地

北京2024年4月18日?/美通社/ -- 4月17日，在2024浪潮信息生態(tài)伙伴大會（IPF2024）上，浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺"元腦

發(fā)表于 04-18 21:21 ?468次閱讀

浪潮信息發(fā)布企業(yè)大模型開發(fā)平臺“元腦企智”EPAI

4月17日，在2024浪潮信息生態(tài)伙伴大會（IPF2024）上，浪潮信息重磅發(fā)布企業(yè)大模型開發(fā)平臺“元腦

發(fā)表于 04-18 10:12 ?391次閱讀