办公室欧美大尺寸SUV,国产调教免费专区,无码老熟妇乱子伦在线播放

如何讓小規(guī)模語言模型像 GPT-4 一樣使用任意工具是一個非常有價值的研究課題。中國科學(xué)院軟件研究所中文信息處理實驗室提出了一種語言模型的工具學(xué)習(xí)新框架，該框架利用基于大模型的多智能體模擬交互策略，可以自動生成多樣化的工具使用數(shù)據(jù)集，并使用生成的數(shù)據(jù)集對小模型進(jìn)行微調(diào)。論文的實驗驗證了僅需要使用三千多個多樣化的工具調(diào)用實例，就能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

具體來說，本文的核心工作包括：

1. 提出一種基于大模型的多智能體模擬交互策略，用于生成工具使用數(shù)據(jù)集。這種方法能在最小化人工干預(yù)的前提下，生成大量且多樣化的工具使用數(shù)據(jù)集；

2. 開源了一個涵蓋超過400個工具，三千多條實例的模擬工具使用數(shù)據(jù)集，為探索通用工具使用能力奠定了基礎(chǔ)；

3. 通過實驗，驗證了在多樣化工具使用數(shù)據(jù)集上進(jìn)行微調(diào)，能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

論文：ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

數(shù)據(jù)：https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人類進(jìn)化史上占據(jù)了重要的地位，對于語言模型來說，這一點同樣適用。當(dāng)語言模型能夠熟練運(yùn)用各種工具，它們就能突破自身的局限，獲取最新的信息，幫助用戶利用各種服務(wù)，并提升回答的精確性。如今，OpenAI 的 GPT-4 已經(jīng)可以通過插件的形式接入和使用各種第三方工具，同時這類超大型的語言模型支持通過僅給定配置文件的情況下，以即插即用的方式使用之前模型訓(xùn)練過程中未見過的工具，這一泛化性的工具使用能力大大豐富了模型調(diào)動資源解決復(fù)雜問題的手段。然而，對于較小的語言模型，例如 Moss、ToolLLaMA 等，它們使用工具的能力仍然來源于在特定工具的數(shù)據(jù)集上進(jìn)行監(jiān)督學(xué)習(xí)。這使得這些模型的工具使用能力受限于在訓(xùn)練過程中接觸過的工具，尚未真正獲得通用的工具使用能力。上述的對比引出了研究人員所關(guān)注的一個核心研究問題，即是否有可能讓較小規(guī)模的語言模型也具備有泛化地使用各種不同的、未見過的工具的能力，進(jìn)而讓它們能夠更好地與更廣泛的工具進(jìn)行交互，從而提升模型利用現(xiàn)實世界的資源解決問題的手段。

ToolAlpaca：通用工具使用能力學(xué)習(xí)新框架

受 Alpaca 通過微調(diào)讓小模型學(xué)會通用指令遵循啟發(fā)，中文信息處理實驗室的研究人員探索了通過在通用工具使用數(shù)據(jù)集上微調(diào)較小規(guī)模的語言模型，讓它們獲得通用工具使用能力。實現(xiàn)上述能力的一個核心難點在于需要構(gòu)建一個多樣化的工具使用數(shù)據(jù)集。然而，由于工具使用涉及復(fù)雜的多方交互，現(xiàn)今仍然缺乏公開可用的多樣化工具使用數(shù)據(jù)集。為了解決這個挑戰(zhàn)，研究人員提出通過多智能體模擬交互的方式生成工具使用數(shù)據(jù)集。這種方法充分利用大模型強(qiáng)大的文本生成能力，在幾乎不需要任何人工干預(yù)的情況下構(gòu)建一個多樣化且真實的數(shù)據(jù)集。我們從構(gòu)建多樣化工具集開始，之后利用多智能體模擬生成工具使用數(shù)據(jù)集，最后基于此訓(xùn)練出擁有通用工具使用能力的 ToolAlpaca 模型。

工具集構(gòu)建：我們首先從開源倉庫 public-apis 中獲取工具的名稱和簡短描述作為初始信息，之后利用大語言模型通過 prompt 的方式將其擴(kuò)展成自然語言形式的文檔，描述工具提供的每一個函數(shù)及其對應(yīng)的輸入。為了讓信息更為精細(xì)和結(jié)構(gòu)化，我們進(jìn)一步將這些自然語言文檔擴(kuò)展為遵循 OpenAPI 規(guī)范的文檔，詳盡描繪了每個函數(shù)的細(xì)節(jié)。結(jié)構(gòu)化文檔的使用不僅使我們的工具集更為細(xì)致和完備，同時也方便了我們的工具集與其他工具（如 ChatGPT 現(xiàn)有的 Plugin 等）進(jìn)行兼容。下圖為一個名為 Public Holidays 工具的示例。

工具使用實例生成：盡管我們已經(jīng)構(gòu)建了大規(guī)模且多樣化的工具集，但構(gòu)建工具使用數(shù)據(jù)集仍然是一項富有挑戰(zhàn)性的任務(wù)。首先，由于工具集是由大模型生成的，要根據(jù)工具集文檔構(gòu)造如此大量的真實工具，需要大量的編程和數(shù)據(jù)收集工作，幾乎不可能實現(xiàn)；其次，工具集本身包含了從通用到專用的各種領(lǐng)域的工具，使得構(gòu)造與工具相關(guān)的初始指令是困難的。為此，我們提出了一種多智能體模擬交互的策略來生成工具使用數(shù)據(jù)。我們利用大模型分別模擬用戶、AI 助手、工具執(zhí)行器這三個智能體，通過他們之間的交互來生成豐富且實用的工具使用數(shù)據(jù)。

如上圖所示，用戶發(fā)起最初的指令，并通過簡單的交互提供更多必要的信息。工具執(zhí)行器則利用結(jié)構(gòu)化文檔作為提示，借助大模型來模擬工具的執(zhí)行過程，從而產(chǎn)生相應(yīng)的反饋。而AI助手則充當(dāng)兩者之間的橋梁，它幫助用戶調(diào)用各種工具以解決問題，并最終對整個交互過程進(jìn)行總結(jié)，返回給用戶最終的響應(yīng)結(jié)果。通過這三個智能體的交互，我們成功構(gòu)建了一套能貼近真實場景需求的工具使用數(shù)據(jù)集。

ToolAlpaca 模型訓(xùn)練與測試：我們使用生成的數(shù)據(jù)集對 Vicuna 模型進(jìn)行微調(diào)，以此得到最終的 ToolAlpaca 模型。在測試階段，ToolAlpaca 將擔(dān)任 AI 助手的角色，同時用戶和工具執(zhí)行器的角色仍由大模型扮演。

實驗

最終，我們利用 ChatGPT 和 GPT-3.5 構(gòu)造了一個包含超過400個工具、3900多條工具使用實例的模擬數(shù)據(jù)集，數(shù)據(jù)集基本統(tǒng)計信息如下圖所示。

之后，我們在Vicuna 模型上進(jìn)行微調(diào)，得到 ToolAlpaca 模型。為了評估模型的泛化性能，我們在10種未包含在訓(xùn)練集中的工具上構(gòu)造了含有100條數(shù)據(jù)的測試集，并通過人工評價對模型的工具調(diào)用過程和整體性能進(jìn)行了評估。評測結(jié)果如下圖所示。

實驗結(jié)果表明，無論是7B還是13B的模型，經(jīng)過在 ToolAlpaca 數(shù)據(jù)集上的訓(xùn)練后，其性能都有了顯著的提升。值得注意的是，ToolAlpaca 在測試集上的整體性能已經(jīng)接近于 GPT-3.5 的表現(xiàn)。這些實驗結(jié)果驗證了我們構(gòu)建數(shù)據(jù)集的有效性，同時也回答了我們最開始提出的問題：通過在多樣化的工具使用數(shù)據(jù)集上微調(diào)，可以讓小模型獲得通用的工具使用能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

框架

框架

+關(guān)注

關(guān)注
0

文章
403

瀏覽量
17514
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
532

瀏覽量
10300
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1208

瀏覽量
24746

原文標(biāo)題：3000多個實例教會小模型通用工具使用能力！中文信息處理實驗室提出工具學(xué)習(xí)新框架 ToolAlpaca

文章出處：【微信號：gh_e5b9d8c5c1d4，微信公眾號：中科院軟件所中文信息處理實驗室】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

[原創(chuàng)]認(rèn)證與實驗室

認(rèn)證、實驗室特寫、電磁兼容、走進(jìn)實驗室、Q博士案例欄目。認(rèn)證實驗室專題范圍：認(rèn)證程序、工廠審查、標(biāo)準(zhǔn)理解、測試設(shè)備管理、標(biāo)準(zhǔn)的差異化等。欄目將對一次或多次不能通過認(rèn)證的企業(yè)或產(chǎn)品，提出

發(fā)表于 10-29 16:57

NI信號處理實驗室

在NI官網(wǎng)下載了“信號處理實驗室”，求源碼而不可得，不知道哪位有源碼？或者相關(guān)的源碼

發(fā)表于 07-31 09:20

實驗室整體解決方案是什么？

三部分。中創(chuàng)盟是中國首家提出實驗室整體解決方案這一概念的公司。如需了解更多實驗室相關(guān)信息請聯(lián)系蘇州中創(chuàng)盟實驗室技術(shù)有限公司居女士 0512-

發(fā)表于 08-11 10:34

智慧實驗室解決方案（LoRa）

實驗室是科技的搖籃，安全、健康、環(huán)保、節(jié)能是實驗室的基本要素；實驗室建設(shè)經(jīng)歷場地-設(shè)備-系統(tǒng)三個階段。在當(dāng)今成系統(tǒng)的實驗建設(shè)理念中，實驗室的

發(fā)表于 02-25 14:09

KGB知識圖譜引擎助力NLPIR中文信息處理

　　隨著信息時代的到了，計算機(jī)在人們生產(chǎn)生活的各個方面將起到越來遠(yuǎn)大的作用。而對于以漢語為母語的我國來說。中文信息處理技術(shù)已經(jīng)在我國信息化建設(shè)中占據(jù)了一個非常重要的地位?！　h語在世界上屬于漢藏語系

發(fā)表于 11-09 11:39

NLPIR大數(shù)據(jù)知識圖譜完美展現(xiàn)文本數(shù)據(jù)內(nèi)容

　　隨著科學(xué)技術(shù)的發(fā)展，中文信息處理已經(jīng)深入到了社會生活的各方面。廣泛的應(yīng)用對中文信息處理技術(shù)也提出了較高的要求。中文信息處理是中文(包括漢

發(fā)表于 07-01 11:40

智慧實驗室教學(xué)管理系統(tǒng)平臺開發(fā)設(shè)計案例

`實驗室管理系統(tǒng)開發(fā)LIMS和量化管理是現(xiàn)代實驗室管理的標(biāo)志，LIMS能實現(xiàn)實驗室的量化管理，能提高實驗室的信息化水平，而量化管理能提高

發(fā)表于 12-09 16:20

系統(tǒng)控制與信息處理實驗室精選資料分享

廣西●河池學(xué)院廣西高校重點實驗室培訓(xùn)基地系統(tǒng)控制與信息處理重點實驗室本篇博客來自河池學(xué)院: 智控?zé)o人機(jī)小組寫作時間: 2020年8月15日培訓(xùn)總結(jié)培訓(xùn)訓(xùn)已經(jīng)結(jié)束了，這一段的學(xué)習(xí)時間也告

發(fā)表于 07-19 08:09

lims實驗室管理系統(tǒng)是什么?實驗室信息管理系統(tǒng)介紹!

采用實驗室信息管理系統(tǒng)或LIMS可能是提高實驗室生產(chǎn)力的最有效方法之一。此頁面的目的是幫助目前未使用LIMS的科學(xué)家和實驗室人員分析采用LIMS的潛在好處。對于已經(jīng)使用LIMS的組織，

發(fā)表于 11-03 11:17

實驗室lims系統(tǒng)解決方案

，需要不同的設(shè)備集成、工作流程工具等，因此該類別中的許多產(chǎn)品都是專門的。為什么要使用實驗室lims系統(tǒng)？從電子表格到記錄簿，傳統(tǒng)的數(shù)據(jù)記錄方法通常不足以滿足現(xiàn)代實驗室的需求。如果沒有合適的工具

發(fā)表于 11-04 11:18

實驗室設(shè)計指南

實驗室設(shè)計指南LBSALE[1000]LBSALE第一章基礎(chǔ)知識主要內(nèi)容：實驗室基礎(chǔ)知識及日常管理實驗室基本操作技術(shù)分析數(shù)據(jù)的處理石油產(chǎn)品分析儀器配置要求第一節(jié)

發(fā)表于 11-09 15:43 ?1658次閱讀

網(wǎng)絡(luò)虛擬實驗室及實現(xiàn)方法

文章描述了網(wǎng)絡(luò) 虛擬實驗室 的定義、框架結(jié)構(gòu)、特點以及面臨的關(guān)鍵技術(shù),并且就當(dāng)前實現(xiàn)網(wǎng)絡(luò)虛擬實驗室的幾種主流技術(shù)進(jìn)行了比較和概括.

發(fā)表于 07-04 11:11 ?16次下載

易云維?實驗室智能管理系統(tǒng)構(gòu)建更適合現(xiàn)代醫(yī)療實驗室的信息化管理體系

隨著信息技術(shù)的快速發(fā)展，實驗室是教育和科研的重要場所。實驗室設(shè)備儀器豐富，實驗項目多，管理內(nèi)容多，管理難度大。部分醫(yī)院在管理實驗室還是人工管

發(fā)表于 06-27 11:44 ?642次閱讀

什么是智慧實驗室綜合管理平臺？

管理平臺目前，我國實驗室存在紙質(zhì)記錄多、信息孤島、不可追溯、安全隱患多、運(yùn)行能耗高、管理難等問題；同時，國內(nèi)LIMS實驗室信息系統(tǒng)專業(yè)化程度低，功能結(jié)構(gòu)單一，不能滿足現(xiàn)階段

發(fā)表于 08-22 14:20 ?1416次閱讀

實驗室信息管理系統(tǒng) LIMS 優(yōu)勢

在當(dāng)今快節(jié)奏和數(shù)據(jù)驅(qū)動的科學(xué)研究環(huán)境中，實驗室信息管理系統(tǒng)（LIMS）已成為提高實驗室效率和準(zhǔn)確性的關(guān)鍵工具。LIMS通過集成各種實驗室操作

發(fā)表于 10-28 16:54 ?322次閱讀