0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

聯(lián)匯科技發(fā)布自主智能體 OmBot 歐姆智能體及 OmBot OS 操作系統(tǒng)

科技訊息 ? 來源:科技訊息 ? 作者:科技訊息 ? 2023-07-11 14:07 ? 次閱讀

今年加入 OpenAI 的大牛、前特斯拉 AI 總監(jiān) Karpathy 在最近的一次開發(fā)者活動上表示:AI 智能體,代表了 AI 的一種未來!

不僅是他,全球 AI 領域的大佬和科技巨頭對 AI 智能體的發(fā)展都表現(xiàn)出極大興趣,并寄予厚望。

大語言模型的出現(xiàn),無疑給 AI 智能體的發(fā)展帶來了全新的想象力,因此盡管在眾多 AI 智能體還未達到完全模擬人類智能的程度的情況下,仍然吸引了全球關注,因為它的出現(xiàn)意味著人類在未來實現(xiàn)通用人工智能的目標上邁出的重要一步。

這個在大模型技術與應用之上誕生的全新賽道,搶跑的人意味著能夠擁有先發(fā)優(yōu)勢。

OmBot自主智能體的誕生

在今天的 2023 世界人工智能大會上,聯(lián)匯科技發(fā)布了基于大模型能力的自主智能體(Auto AI Agent )——OmBot 歐姆智能體,并針對典型場景需求,推出了首批應用。

OmBot 歐姆智能體橫空出世的背后,是聯(lián)匯科技技術團隊的一次 “蓄謀已久”。

公司核心團隊來自全球計算機殿堂 —— 卡內(nèi)基梅隆大學,實驗室對于自主化智能體的探索從 90 年代就已經(jīng)開始。2014 年,聯(lián)匯科技首席科學家趙天成攻讀博士時,已經(jīng)成功研發(fā)了全球第一個多模態(tài)智能體平臺DialPort,讓不同高校的智能體(機器人)在一個平臺匯集,并讓他們一同協(xié)作幫助人類完成各種任務。

這些智能體的專業(yè)領域各不相同。

例如有些是幫助訂餐廳,有些是幫你分析電影,有些是幫你處理文案等等。隨著智能程度的不斷增加,DialPort 匯集了超過 100 個智能體能力,為超過 100 篇學術研究項目提供了智能體的基礎平臺,更是影響了包括 AmazonAlexa 在內(nèi)的眾多目前已經(jīng)成熟的交互智能體的設計思路。

wKgaomSs8YyAZhuUAAFVQBlQQaQ797.jpg

自主智能體的初步探索

那么,什么是自主智能體呢?

聯(lián)匯科技給出了明確的回答 ——智能體是能夠感知環(huán)境、自主決策并且具備短期與長期記憶的計算機模型,它能夠模仿人類大腦工作機制,根據(jù)任務目標,主動完成任務。

聯(lián)匯自主智能體包含了認知、記憶、思考、行動四大核心能力,作為一種自動、自主的智能體,它以最簡單的形式中在循環(huán)中運行,每次迭代時,它們都會生成自我導向的指令和操作。因此,它不依賴人類來指導命令,具備高度可擴展性。

wKgZomSs8YyAb4I1AACpVz7x6-w151.jpg

自主智能體核心能力

認知是智能體獲取環(huán)境信息的過程。將原始數(shù)據(jù)轉(zhuǎn)化為計算機可以理解和處理的形式,而人類 80% 的信息輸入來自于視覺。

記憶是智能體存儲和提取信息的能力。包括短期記憶和長期記憶,前者用于存儲臨時的信息,后者用于存儲更持久的知識和經(jīng)驗,并最終由記憶在決策和行動中發(fā)揮價值。

思考是智能體對感知和記憶進行分析、推理和決策的過程。使用各種算法和技術來處理感知數(shù)據(jù)和記憶信息,以生成合理的決策和行動計劃。其中,語言是我們思考的核心邏輯。

行動是智能體基于感知、記憶和思考結(jié)果采取的具體行為。包括控制機制和執(zhí)行器,用于將決策轉(zhuǎn)化為實際的物理行動或其他形式的輸出。

第一批自主智能體是什么

當自主智能體具備了以上 4 類核心能力后,自然而然面向不同行業(yè)、不同需求、不同場景的第一批智能體應運而生 —— 視頻小歐、文檔小歐和 AIGC 小歐。

是的,聯(lián)匯首次推出的自主智能體并不止一個,而是一批。

他們能做什么呢?

視頻小歐可以成為新零售場景中的智慧店長。通過與攝像頭視覺信息結(jié)合,利用歐姆大模型智能識別店內(nèi)發(fā)生的一切,形成機器人記憶,并自主決策提示交互信息。自主關注店內(nèi)值得關注的事件,在必要時進行提示。通過與機器人對話交互,用戶可以隨時詢問店內(nèi)發(fā)生過的一切,協(xié)助店鋪的管理運營。

wKgaomSs8Y2AKBxrAAHBbW1u8qY117.jpg

視頻小歐成為自主思考的智慧店長

文檔小歐可以成為個人和企業(yè)的學習助理。面對電力、石油、醫(yī)學等行業(yè)專業(yè)知識學習成本高、查詢困難的痛點,文檔問答機器人可以將專業(yè)知識有效集成到向量數(shù)據(jù)庫,并存儲記憶,形成專業(yè)機器人,通過多模態(tài)內(nèi)容理解與內(nèi)容生成,智能回復用戶問題,并給出專業(yè)的回答。

wKgZomSs8Y2AVsg_AAFfMvT6sWo079.jpg

文檔小歐幫助行業(yè)小白解決專業(yè)問題

AIGC 小歐可以成為媒體、文化、游戲等行業(yè)的剪輯助手。通過 AIGC 實現(xiàn)媒體視頻素材的一鍵成片,針對視頻主題,語言模塊完成視頻內(nèi)容文案生成,隨后拆分為更加細節(jié)的視頻鏡頭描述,依托語言理解能力,對素材庫視頻進行搜索、剪輯和生成,最終大幅降低視頻制作門檻。

wKgaomSs8Y2AefgQAAGWiTe2aAA855.jpg

AIGC 小歐一鍵成片

現(xiàn)場,聯(lián)匯科技行嗨發(fā)布了基于 OmBot 歐姆智能體與大模型技術的行業(yè)級智慧文旅底座,為文旅全行業(yè)提供包含元宇宙、AIGC、智慧助手等典型場景快速賦能。

面向行業(yè)、企業(yè)、個人等不同主體千變?nèi)f化的需求,OmBot 歐姆智能體將通過高效調(diào)教,實現(xiàn)個性化智能體的快速生成與進化,未來的自主智能體,不是一個,也不是一批,而是 “人均” 單位下的應有盡有。

自主智能體會像孫悟空的分身猴毛,有需要就可以快速的實現(xiàn)。

歐姆大模型 3.0 來了!

仔細體驗首批自主智能體,不難發(fā)現(xiàn),在應用過程中,認知與思考是自主智能體核心能力的核心。

對于認知與思考的解決方案,聯(lián)匯依賴的是背后的多模態(tài)大模型。

早在 2019 年,聯(lián)匯科技就與 OpenAI CLIP 模型同期推出了歐姆模型 1.0,實現(xiàn)跨模態(tài)搜索,隨后的歐姆大模型 2.0,聚焦開放目標識別,實現(xiàn)了從圖文檢索的到目標理解的躍遷。

目前,聯(lián)匯科技正式推出歐姆大模型 3.0,直指行業(yè)性能最強、真正落地應用的大模型。

這次的歐姆大模型 3.0 實現(xiàn)了哪些飛躍呢?

OmModel V3 正式發(fā)布

開放識別方面,歐姆大模型支持對視覺圖像、視頻進行標簽全開放識別。預訓練中已經(jīng)包含了數(shù)十億的高質(zhì)量圖文匹配數(shù)據(jù),包含大量的環(huán)境背景,目標類型,目標屬性與行為特征,疊加全圖細粒度級別的理解,圖文的語義匹配,圖文問答等多任務的訓練,使歐姆大模型 3.0 具備了能力涌現(xiàn)的保障。

歐姆大模型 3.0 不再局限于固定的目標類型清單,而是通過語義理解去理解視覺中的任意目標,甚至是描述的方式去定義目標。

開放識別

視覺問答方面,構(gòu)建了私有的十億級媒體數(shù)據(jù)和物聯(lián)網(wǎng)數(shù)據(jù),包括無人機視角,監(jiān)控視角等,通過多任務訓練,歐姆大模型 3.0 將包括自然語言解析、邏輯推理、圖像理解以及自然語言生成等AI 能力進行深度融合。將視覺模型和語言模型進行細粒度的對齊,讓其可以理解人類指令,并合理作答。

另外,歐姆大模型可以在針對圖片進行問答之后進行多輪對話推理,并擴充視覺之外的信息。

視覺問答

認知推理方面,通過不斷提升歐模大模型的內(nèi)容理解與多模態(tài)的語義對齊的能力,結(jié)合語言模型的能力,歐模大模型能夠做到基于視覺認知的推理,并由此支撐智能體所需要的認知與推理能力。

例如,看到兒童摔倒,模型可以推理要立即檢查兒童有沒有受傷。看到有小孩在窗邊,模型可以提醒要注意兒童的安全。看到瓶子破裂飲料打翻, 模型可以提醒馬上清理防止有人滑倒。

在開放識別、視覺問答的基礎上,認知推理的能力能夠賦能智能體從被動的識別轉(zhuǎn)為主動推理,進行思考與決策,并提出相應的智能解決方案。

wKgaomSs8Y-ATmUEAAD3xCggWAM486.jpg

推理認知

高效微調(diào)方面,針對傳統(tǒng)全參數(shù)微調(diào)消耗大量 GPU 計算與存儲資源的情況,聯(lián)匯從模型訓練和模型推理兩方面入手,使得歐姆大模型能夠好用、易用。

在模型訓練上,聯(lián)匯自主設計 PEFT 羽量微調(diào)技術,與標準全參數(shù)微調(diào)相比,僅微調(diào)模型參數(shù)的一小部分,訓練參數(shù)量小于 1%,在大幅降低計算和存儲成本的同時,實現(xiàn)媲美全參數(shù)微調(diào)的性能表現(xiàn)。這樣的做法能夠真實降低大模型的微調(diào)訓練門檻,快速適配用戶長尾場景的訓練需求。

wKgZomSs8Y-AT5A2AAFD4ZURODs777.jpg

訓練參數(shù)量小于 1%

在模型推理上,聯(lián)匯推出針對多模態(tài)大模型的推理運行系統(tǒng) ——Hydra 九頭蛇部署架構(gòu),通過多卡集群部署蛇身,由多個公用的底座模型組成,而各個算法任務只需要部署羽量級的蛇頭模型,實現(xiàn) MaaS 架構(gòu)。在推理時,蛇頭模型可與任意公用蛇身模型結(jié)合產(chǎn)生識別結(jié)果,且新增算法任務只需增加羽量級蛇頭模型。從而實現(xiàn)了 GPU 集群資源的高效利用,并突破算法任務部署顯存資源的上限。

wKgaomSs8ZCAbWPkAAEbqrj8zWw959.jpg

Hydra 九頭蛇部署架構(gòu)

作為成熟的大模型,歐姆大模型擁有良好性能的同時,依舊在不斷自我進化。聯(lián)匯研發(fā)團隊構(gòu)建了一套完善的人在環(huán)路指令學習進化體系。

wKgZomSs8ZCAUYSkAADGjks74Go147.jpg

人在環(huán)路指令學習進化體系

對于一個迭代升級后的新版本大模型,首先需要經(jīng)過質(zhì)量部的錘煉,通過基于內(nèi)部量化數(shù)據(jù)集進行能力驗證,再配置并測試各種算法任務,確保模型的升級成功。在模型實際部署上線后,持續(xù)跟蹤算法任務運行情況,記錄并反饋模型潛在缺陷和優(yōu)化點。

數(shù)據(jù)部據(jù)此對新算法任務、長尾場景和模型識別缺陷等關鍵點,使用完整的數(shù)據(jù)回流體系進行針對性的數(shù)據(jù)采集、數(shù)據(jù)清洗、和指令學習數(shù)據(jù)集生成等操作。

在指令學習數(shù)據(jù)集完成累積周期后,算法組將基于質(zhì)量組的反饋以及數(shù)據(jù)組采集的數(shù)據(jù)對歐姆大模型進行新一版本的迭代優(yōu)化訓練,針對性提高模型在業(yè)務算法上的能力,增強泛化能力。

基于由效果評估、升級策略、數(shù)據(jù)回流、優(yōu)化升級構(gòu)成的人在環(huán)路指令學習進化體系,歐姆大模型可以對底座模型進行有效的指令學習、迭代升級,從而在現(xiàn)有的算法任務上有更好的表現(xiàn)。

這也意味著每隔幾個月,歐姆大模型都會迭代進化得更加強大。

完善的工具鏈和工程化框架

成功的大模型在應用層面落地需要與之配套的工具鏈與工程化框架。

為了幫助用戶更好、更快的使用大模型技術與產(chǎn)品,聯(lián)匯正式發(fā)布歐姆大模型工具軟件集合,用 AI - 原生的思路,重新想象 AI 智能體的開發(fā)工具,讓開發(fā)者可以快速構(gòu)建未來的爆款智能體!

wKgaomSs8ZGAC0ZGAAEDiv-xpTQ359.jpg

歐姆大模型應用體系

過去幾年間,聯(lián)匯科技構(gòu)建了完善的針對視覺理解場景的工具鏈平臺。開發(fā)者可以利用自然語言靈活的表述識別需求,OmVision Studio、OmVision OS 等平臺與系統(tǒng),提升算法生產(chǎn)效率的同時,有效降低了人工智能技術的應用門檻,為更多的企業(yè)與行業(yè)賦能。

wKgZomSs8ZGAZrGmAAEbacOcrA4075.jpg

OmVision 應用體系

今天,聯(lián)匯科技首次發(fā)布針對智能體的 OmBot OS 操作系統(tǒng)。開發(fā)者可以基于靈活的模塊配置,將多模態(tài)大模型、向量數(shù)據(jù)庫、人機交互認知架構(gòu)進行深度融合,為構(gòu)建基于多模態(tài)數(shù)據(jù)感知、認知、思考與行動的智能體奠定基礎。

wKgaomSs8ZGAUF9vAAEXRN1U9Cg391.jpg

OmBot OS 架構(gòu)

OmBot OS 提供自帶的長期記憶模塊,同時允許開發(fā)者用戶編寫主動思考模塊與交互響應模塊,支持響應式問答與主動推薦思考的任務場景。同時支持記憶反思模塊,模擬人類對于長期記憶的主動壓縮與思考過程,從繁雜的原始記憶中抽取出更加高維度的抽象記憶信息,讓我們的智能體更加人性化。

OmBot OS 讓開發(fā)者可以基于靈活的模塊配置,將多模態(tài)大模型、向量數(shù)據(jù)庫、人機交互等技術進行深度融合,為構(gòu)建基于多模態(tài)數(shù)據(jù)進行感知、認知、思考與行動的智能體奠定了基礎。

以更開放的方式擁抱 AGI 時代

完善的產(chǎn)品矩陣與人在環(huán)路指令學習進化體系為聯(lián)匯科技的技術生長打下扎實基礎,在此之上的對外開放能力同樣令人期待。

聯(lián)匯首席科學家趙天成博士表示,我們相信在未來,每個人與每一家企業(yè)都可以在 AI 的能力加持,具備更好的記憶、認知和決策能力,我們現(xiàn)在的技術方向,就是讓機器不斷與我們?nèi)祟悓R,持續(xù)進化,最終真正為人類所用。

在這樣的過程中,聯(lián)匯科技始終以用戶為中心,不斷進化能力、迭代產(chǎn)品、開放生態(tài),推動降低人工智能使用門檻,加速推動普惠 AI 賦能千行百業(yè)。

在 AGI 時代來臨之際,人工智能的范式變革正在加速,曾經(jīng)的故事正在成為現(xiàn)實。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31054

    瀏覽量

    269407
  • 智能體
    +關注

    關注

    1

    文章

    152

    瀏覽量

    10593
  • OpenAI
    +關注

    關注

    9

    文章

    1100

    瀏覽量

    6572
收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】+初品的體驗

    。 這些技術的綜合應用使得具身智能系統(tǒng)能夠進行復雜的環(huán)境感知、決策制定和物理操作。例如通過多模態(tài)感知技術,智能體能夠綜合視覺、聽覺和觸覺得數(shù)據(jù),從而可以更全面地理解和響應其所處的環(huán)境。
    發(fā)表于 12-20 19:17

    聯(lián)想百應智能正式發(fā)布

    近日,聯(lián)想集團高級副總裁、中國方案服務業(yè)務群總經(jīng)理戴煒出席“WISE2024 商業(yè)之王”大會,正式發(fā)布業(yè)內(nèi)首款面向中小企業(yè)的IT服務智能——聯(lián)想百應智能
    的頭像 發(fā)表于 12-02 17:20 ?379次閱讀

    微軟Copilot Studio新功能:支持定制Agent 賦能用戶構(gòu)建自主智能

    微軟宣布重大更新,用戶可通過Microsoft Copilot Studio構(gòu)建自主智能。麥肯錫、湯森路透等全球知名企業(yè)己利用智能,實現(xiàn)
    的頭像 發(fā)表于 11-10 09:59 ?626次閱讀
    微軟Copilot Studio新功能:支持定制Agent 賦能用戶構(gòu)建<b class='flag-5'>自主</b><b class='flag-5'>智能</b><b class='flag-5'>體</b>

    聯(lián)想發(fā)布智能機解決方案

    近期,聯(lián)想公司正式推出了全新的智能機解決方案,旨在為企業(yè)和教育用戶提供高效、便捷的人工智能應用落地途徑。該方案包含兩大核心類型:面向企業(yè)用戶的
    的頭像 發(fā)表于 10-31 11:19 ?442次閱讀

    榮耀發(fā)布個人化全場景AI操作系統(tǒng)MagicOS 9.0

    近期,手機市場迎來了一波密集的新品發(fā)布,其中AI技術成為了各大廠商競相追逐的焦點。   10月23日,榮耀公司發(fā)布了行業(yè)首個搭載智能(AI Agent)的個人化全場景AI
    的頭像 發(fā)表于 10-29 16:48 ?828次閱讀

    聯(lián)發(fā)科技新推智能AI芯片天璣9400

    10月10日資訊,聯(lián)發(fā)科技揭曉了其最新的5G智能AI芯片——天璣9400,該芯片采用了臺積電的第二代3nm制程技術,并宣布vivo的X200系列將作為全球首款搭載此芯片的智能手機。
    的頭像 發(fā)表于 10-10 17:08 ?678次閱讀

    長虹發(fā)布滄海智能AI TV與智家AI大模型

    2024年德國柏林消費電子展覽會(IFA2024)盛大啟幕,長虹集團攜全球首款滄海智能AI TV與長虹美菱智家AI大模型驚艷亮相。滄海智能
    的頭像 發(fā)表于 09-10 18:21 ?876次閱讀

    聚徽觸控-工業(yè)一機選擇什么操作系統(tǒng)

    工業(yè)一機選擇操作系統(tǒng)時,需要考慮穩(wěn)定性、安全性、易用性、兼容性以及具體應用場景等多個因素。以下是對常見操作系統(tǒng)的一些分析:
    的頭像 發(fā)表于 07-21 11:14 ?449次閱讀

    華為發(fā)布鴻蒙原生智能,OS深度融合AI,小藝升級為系統(tǒng)智能

    Beta。鴻蒙原生智能是基于軟硬芯云協(xié)同的硬件與基礎設施架構(gòu),AI與OS深度融合的智能系統(tǒng)。 小藝智能
    的頭像 發(fā)表于 06-24 14:30 ?555次閱讀
    華為<b class='flag-5'>發(fā)布</b>鴻蒙原生<b class='flag-5'>智能</b>,<b class='flag-5'>OS</b>深度融合AI,小藝升級為<b class='flag-5'>系統(tǒng)</b>級<b class='flag-5'>智能</b><b class='flag-5'>體</b>

    黑芝麻智能與均聯(lián)智及聯(lián)合推出首款艙駕一軟件開放平臺

    4月25日,2024(第十八屆)北京車展開幕,黑芝麻智能與均聯(lián)智及(NESINEXT)共同向行業(yè)發(fā)布了基于黑芝麻智能武當系列C1296智能
    的頭像 發(fā)表于 04-26 10:50 ?479次閱讀

    OPPO發(fā)布1+N 智能生態(tài)戰(zhàn)略,聯(lián)發(fā)科攜手OPPO打造AI手機生態(tài)

    最近,OPPO舉辦AI戰(zhàn)略發(fā)布會,發(fā)布由 OPPO AI 超級智能和 AI Pro 智能開發(fā)
    的頭像 發(fā)表于 02-21 17:03 ?1075次閱讀
    OPPO<b class='flag-5'>發(fā)布</b>1+N <b class='flag-5'>智能</b><b class='flag-5'>體</b>生態(tài)戰(zhàn)略,<b class='flag-5'>聯(lián)</b>發(fā)科攜手OPPO打造AI手機生態(tài)

    OPPO發(fā)布1+N智能生態(tài)戰(zhàn)略

    OPPO近日在全球科技界掀起了波瀾,正式發(fā)布了其獨特的1+N智能生態(tài)戰(zhàn)略,標志著這家科技巨頭在人工智能領域的全新布局。該戰(zhàn)略的核心在于兩大組件:AI超級
    的頭像 發(fā)表于 02-21 10:36 ?742次閱讀

    聯(lián)想今年將發(fā)布AI OS操作系統(tǒng)

    聯(lián)想正式宣布,將把AI PC和個人Agent作為2024年的核心業(yè)務推進重點,并計劃在今年內(nèi)推出全新的“AI OS操作系統(tǒng)”以及一系列搭載此系統(tǒng)的“AI PC”。這一創(chuàng)新舉措標志著聯(lián)想在人工
    的頭像 發(fā)表于 02-18 11:10 ?1048次閱讀

    阿里發(fā)布手機操作智能框架Mobile-Agent

    阿里巴巴與北京交通大學的聯(lián)合團隊近日在學術界引起了廣泛關注,因為他們共同推出了一款全新的手機操作智能框架——Mobile-Agent。這款框架旨在為手機用戶提供更高效、便捷的操作體驗
    的頭像 發(fā)表于 02-05 10:41 ?1562次閱讀

    榮耀推出自研操作系統(tǒng)MagicOS 8.0

    榮耀正式推出了自主研發(fā)的全新操作系統(tǒng)——MagicOS 8.0(中文名:魔法OS 8.0)。這款操作系統(tǒng)憑借其獨創(chuàng)的平臺級AI使能的意圖識別人機交互,引領了
    的頭像 發(fā)表于 01-12 15:11 ?2298次閱讀