快猫视频成人,狠狠艹狠狠干美女,天堂在线国产

在生成式 AI 時(shí)代，機(jī)器不僅要從數(shù)據(jù)中學(xué)習(xí)，還要生成類似人類一樣的文本、圖像、視頻等。檢索增強(qiáng)生成（RAG）則是可以實(shí)現(xiàn)的一種突破性方法。

RAG 工作流程基于大語言模型（LLM）而構(gòu)建，這些 LLM 可以理解查詢并生成響應(yīng)。但是，LLM 存在局限性，包括訓(xùn)練的復(fù)雜性和缺乏當(dāng)前（有時(shí)是專有）信息。此外，當(dāng)未根據(jù)特定數(shù)據(jù)進(jìn)行訓(xùn)練就回答提示詞時(shí)，它們往往會(huì)產(chǎn)生幻覺并合成事實(shí)錯(cuò)誤的信息。RAG 通過向 LLM 提供企業(yè)特定信息來增強(qiáng)查詢，從而幫助克服這些限制。

數(shù)據(jù)中心作為新的計(jì)算單元，隨著網(wǎng)絡(luò)服務(wù)對(duì) CPU 壓力的增加，現(xiàn)代工作負(fù)載對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施提出了新的挑戰(zhàn)。網(wǎng)絡(luò)基礎(chǔ)設(shè)施需要具備敏捷性、自動(dòng)化和可編程性的框架，并配備加速器和卸載功能，這些是充分發(fā)揮 AI 技術(shù)潛力和推動(dòng)創(chuàng)新的關(guān)鍵。

在本文中，我們討論了 RAG 如何助力企業(yè)為各種企業(yè)用例創(chuàng)建高質(zhì)量、相關(guān)且引人入勝的內(nèi)容。我們深入探討了通過擴(kuò)展 RAG 來處理大量數(shù)據(jù)和用戶所面臨的技術(shù)挑戰(zhàn)，以及如何使用由 NVIDIA GPU 計(jì)算、加速以太網(wǎng)網(wǎng)絡(luò)、網(wǎng)絡(luò)存儲(chǔ)和 AI 軟件提供支持的可擴(kuò)展架構(gòu)來應(yīng)對(duì)這些挑戰(zhàn)。

RAG 使企業(yè)能夠充分利用數(shù)據(jù)

典型的 RAG 工作流程使用向量數(shù)據(jù)庫，向量數(shù)據(jù)庫是一類專為執(zhí)行相似性搜索而定制的數(shù)據(jù)管理系統(tǒng)，用于存儲(chǔ)和檢索與查詢相關(guān)的企業(yè)特定信息。

通過將 RAG 集成到其信息系統(tǒng)中，企業(yè)可以利用大量?jī)?nèi)部和外部數(shù)據(jù)來生成具有洞察力的全新上下文相關(guān)內(nèi)容。這種融合是一次重大飛躍，使企業(yè)能夠利用其數(shù)據(jù)和領(lǐng)域?qū)I(yè)知識(shí)，為個(gè)性化客戶互動(dòng)開辟新途徑，簡(jiǎn)化內(nèi)容的創(chuàng)建，并提高知識(shí)用例的效率。

然而，在企業(yè)規(guī)模部署 RAG 也面臨著一系列挑戰(zhàn)，包括管理數(shù)百個(gè)數(shù)據(jù)集和數(shù)千名用戶的復(fù)雜性。這就需要一種分布式架構(gòu)，其能夠滿足有效應(yīng)對(duì)此類大規(guī)模操作的處理和存儲(chǔ)需求。

要擴(kuò)展此架構(gòu)，您必須嵌入、向量化和索引數(shù)百萬個(gè)文檔、圖像、音頻文件和視頻，同時(shí)還適應(yīng)每天新創(chuàng)建內(nèi)容的嵌入。

另一個(gè)挑戰(zhàn)是確保交互式多模態(tài)應(yīng)用程序的低延遲響應(yīng)。由于需要集成數(shù)據(jù)企業(yè)應(yīng)用程序以及結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)，因此需要實(shí)時(shí)處理和響應(yīng)，而在大規(guī)模實(shí)現(xiàn)方面可能具有挑戰(zhàn)。

生成式 AI 的數(shù)據(jù)索引和存儲(chǔ)也構(gòu)成了挑戰(zhàn)。

雖然傳統(tǒng)企業(yè)應(yīng)用程序可以壓縮數(shù)據(jù)并將其存儲(chǔ)來進(jìn)行高效檢索，從而支持索引和語義搜索，但是基于 RAG 的數(shù)據(jù)庫可以擴(kuò)展到比原始文本文檔及其相關(guān)元數(shù)據(jù)大 10 倍以上。這將導(dǎo)致在數(shù)據(jù)增長(zhǎng)和存儲(chǔ)方面的重大挑戰(zhàn)。

為了獲得最佳結(jié)果，企業(yè)必須投資加速計(jì)算、網(wǎng)絡(luò)和存儲(chǔ)基礎(chǔ)設(shè)施，這對(duì)于處理訓(xùn)練和部署 RAG 模型所需的大量數(shù)據(jù)至關(guān)重要。

如何實(shí)現(xiàn)可擴(kuò)展且高效的 RAG 推理

在 GTC 2024 上，NVIDIA 推出了一系列生成式 AI 微服務(wù)，為開發(fā)者提供用于創(chuàng)建和部署自定義 AI 應(yīng)用程序的企業(yè)級(jí)構(gòu)建塊。

企業(yè)可以使用這些微服務(wù)作為創(chuàng)建 RAG 驅(qū)動(dòng)的應(yīng)用程序的基礎(chǔ)。通過將其與 NVIDIA RAG 工作流程示例相結(jié)合，您可以加快生成式 AI 應(yīng)用程序的構(gòu)建和產(chǎn)品化過程。

在本文中，我們使用多節(jié)點(diǎn) GPU 計(jì)算推理、加速以太網(wǎng)網(wǎng)絡(luò)和網(wǎng)絡(luò)連接存儲(chǔ)對(duì)這些 RAG 工作流程示例進(jìn)行基準(zhǔn)測(cè)試。我們的測(cè)試結(jié)果表明，高性能網(wǎng)絡(luò)和網(wǎng)絡(luò)連接存儲(chǔ)可實(shí)現(xiàn)高效且可擴(kuò)展的生成式 AI 推理，使企業(yè)能夠開發(fā)由 RAG 驅(qū)動(dòng)的應(yīng)用程序，在促進(jìn)連續(xù)數(shù)據(jù)處理的同時(shí)，還可擴(kuò)展到數(shù)千個(gè)用戶。

圖 1 顯示了包含兩個(gè)階段和數(shù)據(jù)流水線的 RAG 工作流程。

圖 1.RAG 工作流程

在第一階段，數(shù)據(jù)提取將文檔和其他數(shù)據(jù)模式轉(zhuǎn)換為數(shù)字嵌入，然后在向量數(shù)據(jù)庫中對(duì)其進(jìn)行索引。此過程支持基于相似度分?jǐn)?shù)來有效檢索相關(guān)文檔。

查詢階段從用戶輸入問題時(shí)開始，該問題也會(huì)被轉(zhuǎn)換為嵌入并用于在向量數(shù)據(jù)庫中搜索相關(guān)內(nèi)容。檢索相關(guān)內(nèi)容后，會(huì)將其傳遞給 LLM 進(jìn)行進(jìn)一步處理。原始輸入問題以及增強(qiáng)上下文會(huì)提供給 LLM，LLM 會(huì)針對(duì)用戶的查詢生成更精確的答案。

此工作流程可以有效地檢索和生成信息，使其成為適用于各種企業(yè)應(yīng)用程序的強(qiáng)大工具。

加速以太網(wǎng)網(wǎng)絡(luò)、網(wǎng)絡(luò)連接存儲(chǔ)在數(shù)據(jù)提取方面表現(xiàn)出色

我們最初測(cè)試了基于單個(gè) GPU 節(jié)點(diǎn)的數(shù)據(jù)提取流水線。圖 2 顯示了使用一臺(tái)具有 8 個(gè) A100 GPU 的 DGX 系統(tǒng)和一個(gè)專為對(duì)象存儲(chǔ)工作負(fù)載而設(shè)計(jì)的網(wǎng)絡(luò)連接全閃存存儲(chǔ)平臺(tái)來進(jìn)行測(cè)試設(shè)置。

圖 2.具有網(wǎng)絡(luò)連接存儲(chǔ)的單節(jié)點(diǎn) NeMo Retriever 微服務(wù)

DGX 系統(tǒng)通過 NVIDIA ConnectX-7 網(wǎng)卡連接到網(wǎng)絡(luò)，并使用了加速的 NVMe-over-Fabrics（NVMe – oF）和 Amazon S3 對(duì)象存儲(chǔ)協(xié)議及兩臺(tái) NVIDIA Spectrum SN3700 交換機(jī)。

使用 NeMo Retriever 微服務(wù)，我們比較了 PDF 文檔（包括文本和圖像）的嵌入和索引性能。此次比較涉及 DGX 系統(tǒng)中的直接附加存儲(chǔ)（DAS）和網(wǎng)絡(luò)連接存儲(chǔ)。

圖 3 顯示了單節(jié)點(diǎn)上的數(shù)據(jù)提取基準(zhǔn)測(cè)試的結(jié)果。結(jié)果表明，與使用 DAS 相比，使用 Amazon S3 的網(wǎng)絡(luò)連接存儲(chǔ)將數(shù)據(jù)提取速度提高了 36%，將處理時(shí)間縮短了 122 秒。這表明網(wǎng)絡(luò)連接存儲(chǔ)是數(shù)據(jù)提取的更好選擇，同時(shí)還依賴于網(wǎng)絡(luò)速度和延遲。

加速以太網(wǎng)網(wǎng)絡(luò)對(duì)于提供穩(wěn)健、高性能和安全的連接至關(guān)重要。除了增強(qiáng)文檔嵌入外，網(wǎng)絡(luò)連接存儲(chǔ)還提供各種企業(yè)級(jí)數(shù)據(jù)管理功能。

圖 3.單節(jié)點(diǎn)數(shù)據(jù)提取基準(zhǔn)測(cè)試 (100 萬個(gè)向量)

然后，我們使用多節(jié)點(diǎn) RAG 設(shè)置進(jìn)行測(cè)試，該設(shè)置使用通過 NVIDIA BlueField-3 DPU 連接的分布式微服務(wù)架構(gòu)（圖 4）。隨著多個(gè)節(jié)點(diǎn)并行運(yùn)行以上傳嵌入、計(jì)算索引并插入向量數(shù)據(jù)庫，性能也隨之提升。

圖 4.具有網(wǎng)絡(luò)連接存儲(chǔ)的多節(jié)點(diǎn) NeMo Retriever 微服務(wù)

我們比較了每臺(tái)服務(wù)器中使用直接附加 SSD 與網(wǎng)絡(luò)連接存儲(chǔ)的性能。對(duì)于服務(wù)器內(nèi)的 SSD，MinIO 充當(dāng)對(duì)象存儲(chǔ)層。對(duì)于網(wǎng)絡(luò)連接存儲(chǔ)，我們繞過 MinIO，測(cè)試了存儲(chǔ)系統(tǒng)自己的原生 Amazon S3 對(duì)象接口。

結(jié)果表明，多節(jié)點(diǎn)比使用單節(jié)點(diǎn)提供更快的性能，將處理時(shí)間縮短了近 102 秒。這些結(jié)果證明了多節(jié)點(diǎn) GPU 加速與企業(yè)級(jí)網(wǎng)絡(luò)連接存儲(chǔ)相結(jié)合的性能優(yōu)勢(shì)。

圖 5.多節(jié)點(diǎn)數(shù)據(jù)提取基準(zhǔn)測(cè)試 (100 萬個(gè)向量)

適用于 RAG 驅(qū)動(dòng)型應(yīng)用程序的網(wǎng)絡(luò)連接存儲(chǔ)的優(yōu)勢(shì)

網(wǎng)絡(luò)連接存儲(chǔ)可以通過網(wǎng)絡(luò)訪問塊、文件和對(duì)象，而無需直接將存儲(chǔ)介質(zhì)連接到服務(wù)器。

網(wǎng)絡(luò)連接存儲(chǔ)不僅為基于 RAG 的應(yīng)用程序提供了明顯的性能優(yōu)勢(shì)，而且還提供了額外的企業(yè)優(yōu)勢(shì)，使其成為增強(qiáng)自然語言處理的最佳數(shù)據(jù)平臺(tái)。

適用于 RAG 工作流程的網(wǎng)絡(luò)連接存儲(chǔ)具有以下優(yōu)勢(shì)：

實(shí)時(shí)流數(shù)據(jù)提?。?/strong>網(wǎng)絡(luò)連接存儲(chǔ)支持從各種來源（例如社交媒體、Web、傳感器或物聯(lián)網(wǎng)設(shè)備）提取實(shí)時(shí)流數(shù)據(jù)。RAG 應(yīng)用程序可以使用這些數(shù)據(jù)生成相關(guān)的全新內(nèi)容。DAS 可能無法處理大量且快速的流數(shù)據(jù)，或者可能需要額外的處理或緩沖來存儲(chǔ)數(shù)據(jù)。

可擴(kuò)展性：在不影響性能或數(shù)據(jù)可用性的情況下，可以更容易地通過添加更多磁盤或設(shè)備來擴(kuò)展網(wǎng)絡(luò)連接存儲(chǔ)的容量。相比之下，DAS 的可擴(kuò)展性有限，可能需要停機(jī)或重新配置才能進(jìn)行存儲(chǔ)升級(jí)。

元數(shù)據(jù)標(biāo)注：網(wǎng)絡(luò)連接存儲(chǔ)支持使用元數(shù)據(jù)（例如標(biāo)簽、類別、關(guān)鍵字或摘要）對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。元數(shù)據(jù)可以被 RAG 應(yīng)用程序使用來根據(jù)查詢或上下文進(jìn)行檢索和排名數(shù)據(jù)源。DAS 可能不支持?jǐn)?shù)據(jù)標(biāo)注，或需要單獨(dú)的數(shù)據(jù)庫或索引來存儲(chǔ)元數(shù)據(jù)。

利用率：網(wǎng)絡(luò)連接存儲(chǔ)使多個(gè)用戶和應(yīng)用程序能夠同時(shí)訪問相同的數(shù)據(jù)，從而優(yōu)化存儲(chǔ)資源的利用率，而不會(huì)產(chǎn)生重復(fù)或沖突。相比之下，DAS 可能會(huì)導(dǎo)致存儲(chǔ)未充分使用或過度使用的問題，具體取決于特定服務(wù)器內(nèi)的需求和數(shù)據(jù)分配。

可靠性：網(wǎng)絡(luò)連接存儲(chǔ)通過使用先進(jìn)的獨(dú)立磁盤冗余陣列（RAID）功能或其他方法來保護(hù)數(shù)據(jù)免受磁盤故障、網(wǎng)絡(luò)故障或斷電的影響，提高了可靠性和數(shù)據(jù)可用性。相比之下，DAS 在磁盤或服務(wù)器發(fā)生故障時(shí)，可能會(huì)丟失數(shù)據(jù)或損壞，因?yàn)?DAS 并不具備數(shù)據(jù)保護(hù)功能。

刪除重復(fù)數(shù)據(jù)：網(wǎng)絡(luò)存儲(chǔ)通過消除文件或設(shè)備之間的重復(fù)或冗余數(shù)據(jù)來減少存儲(chǔ)空間和網(wǎng)絡(luò)帶寬。DAS 可能會(huì)存儲(chǔ)相同數(shù)據(jù)的多個(gè)副本，從而浪費(fèi)存儲(chǔ)空間和網(wǎng)絡(luò)資源。

數(shù)據(jù)出處的來源引用：網(wǎng)絡(luò)連接存儲(chǔ)可以提供數(shù)據(jù)的來源引用，例如 URL、作者、日期或許可證。RAG 應(yīng)用程序可以使用此信息來歸因和驗(yàn)證數(shù)據(jù)源，并確保所生成內(nèi)容的質(zhì)量和可信度。DAS 可能不提供數(shù)據(jù)來源引用，或者可能需要手動(dòng)或外部方法來跟蹤數(shù)據(jù)來源。

備份：網(wǎng)絡(luò)連接存儲(chǔ)通過使用快照、復(fù)制或其他方法在不同位置或設(shè)備上創(chuàng)建數(shù)據(jù)副本來促進(jìn)數(shù)據(jù)備份和恢復(fù)。DAS 可能需要手動(dòng)或復(fù)雜的備份過程，這可能很耗時(shí)或容易出錯(cuò)。

數(shù)據(jù)保護(hù)和保留：網(wǎng)絡(luò)連接存儲(chǔ)通過使用加密、壓縮或其他技術(shù)來保護(hù)數(shù)據(jù)免遭未經(jīng)授權(quán)的訪問或修改，從而確保數(shù)據(jù)保護(hù)和保留。它還使用策略、規(guī)則或法規(guī)來管理數(shù)據(jù)生命周期，例如數(shù)據(jù)的創(chuàng)建、刪除或存檔。相比之下，DAS 可能不提供數(shù)據(jù)保護(hù)和保留功能，或者可能需要額外的軟件或硬件來實(shí)現(xiàn)數(shù)據(jù)安全和治理。

結(jié)束語

檢索增強(qiáng)型生成通過利用生成式 AI 的強(qiáng)大功能以及企業(yè)特定的上下文和信息來增強(qiáng)數(shù)據(jù)和利用，為企業(yè)提供了巨大的潛力。

然而，大規(guī)模部署 RAG 會(huì)帶來諸多挑戰(zhàn)，例如管理大型數(shù)據(jù)集、確保交互式應(yīng)用程序的低延遲以及滿足生成式 AI 的存儲(chǔ)需求。

為了克服這些挑戰(zhàn)，企業(yè)必須擴(kuò)展其基于 RAG 的生成式 AI 基礎(chǔ)設(shè)施。為了高效運(yùn)行，此基礎(chǔ)架構(gòu)必須在整個(gè)數(shù)據(jù)中心堆棧中進(jìn)行適當(dāng)?shù)恼{(diào)整和架構(gòu)設(shè)計(jì)：加速計(jì)算、快速網(wǎng)絡(luò)、網(wǎng)絡(luò)連接存儲(chǔ)和企業(yè) AI 軟件。

生成式 AI 是一個(gè)快速增長(zhǎng)的新領(lǐng)域。隨著 RAG 的不斷擴(kuò)展以支持視頻等新模式，數(shù)據(jù)處理需求持續(xù)快速增長(zhǎng)。NVIDIA 生成式 AI 微服務(wù)與多節(jié)點(diǎn) NVIDIA GPU 計(jì)算推理、加速以太網(wǎng)網(wǎng)絡(luò)和網(wǎng)絡(luò)連接存儲(chǔ)相結(jié)合，展示了企業(yè)規(guī)模 RAG 推理的效率。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

以太網(wǎng)

以太網(wǎng)

+關(guān)注

關(guān)注
40

文章
5425

瀏覽量
171721

網(wǎng)絡(luò)存儲(chǔ)

網(wǎng)絡(luò)存儲(chǔ)

+關(guān)注

關(guān)注
1

文章
61

瀏覽量
25283

GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
303

瀏覽量
5812

LLM

LLM

+關(guān)注

關(guān)注
0

文章
288

瀏覽量
335

生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
504

瀏覽量
474

原文標(biāo)題：借助加速以太網(wǎng)網(wǎng)絡(luò)和網(wǎng)絡(luò)存儲(chǔ)擴(kuò)展企業(yè) RAG

文章出處：【微信號(hào)：NVIDIA-Enterprise，微信公眾號(hào)：NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

評(píng)論

發(fā)布評(píng)論請(qǐng)先登錄

相關(guān)推薦

檢索增強(qiáng)型生成(RAG)系統(tǒng)詳解

流暢且類似人類的文本方面表現(xiàn)出色，但它們有時(shí)在事實(shí)準(zhǔn)確性上存在困難。當(dāng)準(zhǔn)確性非常重要時(shí)，這可能是一個(gè)巨大的問題。那么，這個(gè)問題的解決方案是什么呢？答案是檢索增強(qiáng)型生成（RAG）系統(tǒng)。

發(fā)表于 12-24 10:44 ?187次閱讀

借助浪潮信息元腦企智EPAI高效創(chuàng)建大模型RAG

能力，提高生成質(zhì)量和可靠性。但企業(yè)構(gòu)建知識(shí)檢索系統(tǒng)并非易事，通常面臨開發(fā)門檻高、生成內(nèi)容差等難題

發(fā)表于 12-19 14:32 ?191次閱讀

RAG的概念及工作原理

檢索增強(qiáng)型生成（RAG）系統(tǒng)正在重塑我們處理AI驅(qū)動(dòng)信息的方式。作為架構(gòu)師，我們需要理解這些系統(tǒng)的基本原理，從而有效地發(fā)揮它們的潛力。什么是RAG

發(fā)表于 12-17 13:41 ?175次閱讀

Cloudera推出RAG Studio，助力企業(yè)快速部署聊天機(jī)器人

近日，數(shù)據(jù)、分析和AI混合平臺(tái)廠商Cloudera宣布了一項(xiàng)創(chuàng)新舉措——推出RAG(Retrieval-Augmented Generation，檢索增強(qiáng)生成)Studio。這一平臺(tái)的問世，標(biāo)志著

發(fā)表于 12-12 11:06 ?325次閱讀

【書籍評(píng)測(cè)活動(dòng)NO.52】基于大模型的RAG應(yīng)用開發(fā)與優(yōu)化

Agenerated，檢索增強(qiáng)生成）與Agent（AI智能體）。本篇小棗君首先嘗試用通俗易懂的語言幫助大家認(rèn)識(shí)RAG這一重要應(yīng)用形式。 01 了解大模型的“幻覺” 在了解為什么出現(xiàn)RAG

發(fā)表于 12-04 10:50

浪潮信息發(fā)布“源”Yuan-EB助力RAG檢索精度新高

智EPAI為構(gòu)建企業(yè)知識(shí)庫提供更高效、精準(zhǔn)的知識(shí)向量化能力支撐，助力用戶使用領(lǐng)先的RAG技術(shù)加速企業(yè)知識(shí)資產(chǎn)的價(jià)值釋放。

發(fā)表于 11-26 13:54 ?185次閱讀

英特爾軟硬件構(gòu)建模塊如何幫助優(yōu)化RAG應(yīng)用

深入研究檢索增強(qiáng)生成 (Retrieval Augmented Generation, RAG)，該創(chuàng)新方法定義了企業(yè)和機(jī)構(gòu)如何利用大語言模型(LLM)來發(fā)揮其數(shù)據(jù)的價(jià)值。本文將探索若

發(fā)表于 07-24 15:12 ?429次閱讀

英特爾以生成式AI RAG解決方案，為巴黎奧運(yùn)健兒提供便捷體驗(yàn)

的生成式AI（GenAI）檢索增強(qiáng)生成（RAG）解決方案。該成果深度展示了英特爾如何通過基于英特爾至強(qiáng)處理器和英特爾?Gaudi AI加速器的開放式AI系統(tǒng)及平臺(tái)，幫助開發(fā)者和

發(fā)表于 07-19 19:43 ?1733次閱讀

英特爾攜手Aible打造創(chuàng)新解決方案，助力企業(yè)實(shí)現(xiàn)低成本智能化升級(jí)

）生成式AI和增強(qiáng)型分析方案提供商Aible合作，為企業(yè)客戶提供了創(chuàng)新的解決方案，助力其在不同代際的英特爾?至強(qiáng)??CPU上運(yùn)行

發(fā)表于 07-03 19:17 ?374次閱讀

什么是RAG，RAG學(xué)習(xí)和實(shí)踐經(jīng)驗(yàn)

高級(jí)的RAG能很大程度優(yōu)化原始RAG的問題，在索引、檢索和生成上都有更多精細(xì)的優(yōu)化，主要的優(yōu)化點(diǎn)會(huì)集中在索引、向量模型優(yōu)化、檢索后處理等模塊

發(fā)表于 04-24 09:17 ?894次閱讀

中創(chuàng)新航榮獲“2023年度江蘇高質(zhì)量發(fā)展標(biāo)桿企業(yè)”稱號(hào)

3月30日，第二屆蘇商精英大會(huì)在南京舉辦。會(huì)上，中創(chuàng)新航榮獲“2023年度江蘇高質(zhì)量發(fā)展標(biāo)桿企業(yè)”稱號(hào)，是動(dòng)力及儲(chǔ)能電池行業(yè)唯一獲此殊榮的企業(yè)；劉靜瑜董事長(zhǎng)獲評(píng)“2023年度江蘇十大經(jīng)濟(jì)新聞人物”。

發(fā)表于 04-03 09:45 ?532次閱讀

環(huán)宇智行成功入選“2023年度中國車谷經(jīng)濟(jì)高質(zhì)量發(fā)展企業(yè)”名單

近日，武漢市經(jīng)開區(qū)公布“2023年度中國車谷經(jīng)濟(jì)高質(zhì)量發(fā)展企業(yè)”名單，武漢環(huán)宇智行科技有限公司憑借自主研發(fā)優(yōu)勢(shì)與自動(dòng)駕駛技術(shù)創(chuàng)新優(yōu)勢(shì)，成功入選“2023年度中國車谷經(jīng)濟(jì)高質(zhì)量發(fā)展企業(yè)—

發(fā)表于 03-21 16:00 ?485次閱讀

高華科技榮獲“高質(zhì)量發(fā)展突出貢獻(xiàn)企業(yè)”“科技創(chuàng)新引領(lǐng)示范企業(yè)”稱號(hào)

2月24日，南京經(jīng)開區(qū)召開新型工業(yè)化暨產(chǎn)業(yè)強(qiáng)區(qū)推進(jìn)大會(huì)，會(huì)上宣讀了 2023年度經(jīng)開區(qū)高質(zhì)量發(fā)展突出貢獻(xiàn)企業(yè)及科技創(chuàng)新引領(lǐng)示范企業(yè)的表揚(yáng)決定，

發(fā)表于 02-26 16:07 ?414次閱讀

穩(wěn)中創(chuàng)新?產(chǎn)業(yè)升級(jí)?高質(zhì)量發(fā)展 | 聯(lián)誠發(fā)高質(zhì)量發(fā)展工作推進(jìn)會(huì)議召開

2月21日下午，聯(lián)誠發(fā)LCF以“穩(wěn)中創(chuàng)新?產(chǎn)業(yè)升級(jí)?高質(zhì)量發(fā)展”為主題的企業(yè)高質(zhì)量發(fā)展工作推進(jìn)大會(huì)在聯(lián)誠發(fā)深圳總部隆重召開。擂起奮進(jìn)催征的戰(zhàn)鼓，爭(zhēng)分奪秒搶抓寶貴春光，明確企業(yè)重點(diǎn)目標(biāo)任

發(fā)表于 02-22 11:33 ?471次閱讀

阿里云推出企業(yè)級(jí)大模型RAG系統(tǒng)

在國際AI大數(shù)據(jù)峰會(huì)上，阿里云重磅推出了企業(yè)級(jí)大模型檢索增強(qiáng)生成（RAG）解決方案。這一解決方案旨在為企業(yè)提供更強(qiáng)大、更智能的大模型應(yīng)用工具

發(fā)表于 02-05 09:54 ?1188次閱讀