0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

千億參數(shù)多模態(tài)大模型,“紫東太初”規(guī)模化應(yīng)用加速

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-12-08 00:09 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)過(guò)去近一年時(shí)間,國(guó)內(nèi)外大模型技術(shù)越來(lái)越成熟,并逐步在不同場(chǎng)景中實(shí)現(xiàn)實(shí)現(xiàn)應(yīng)用。在國(guó)內(nèi),作為早早布局多模態(tài)大模型的科研機(jī)構(gòu),中國(guó)科學(xué)院自動(dòng)化研究所自2019年開(kāi)始在語(yǔ)音、文本、圖像等單模態(tài)大模型研究和應(yīng)用的基礎(chǔ)上,向多模態(tài)大模型攻關(guān),并于2021年7月正式發(fā)布了全球首個(gè)千億參數(shù)多模態(tài)大模型紫東太初。

2023年6月16日,中國(guó)科學(xué)院自動(dòng)化研究所和武漢人工智能研究院發(fā)布紫東太初2.0。2023年8月,中科院旗下紫東太初的大模型位列首批通過(guò)《生成式人工智能服務(wù)管理暫行辦法》備案的名單,可正式上線面向公眾提供服務(wù)。如今,紫東太初已經(jīng)在不同領(lǐng)域?qū)崿F(xiàn)應(yīng)用。

紫東太初多模態(tài)大模型的技術(shù)進(jìn)展

紫東太初是全球首個(gè)圖文音(視覺(jué)-文本-語(yǔ)音)三模態(tài)預(yù)訓(xùn)練模型(OPT-Omni-Perception pre-Trainer),同時(shí)具備跨模態(tài)理解與跨模態(tài)生成能力。

紫東太初2.0在文本、圖像、語(yǔ)音三模態(tài)的基礎(chǔ)上,融入3D點(diǎn)云、視頻、信號(hào)等更多模態(tài)數(shù)據(jù),現(xiàn)已支持多輪問(wèn)答、文本創(chuàng)作、圖像生成、3D 理解、信號(hào)分析等全面問(wèn)答任務(wù),擁有更強(qiáng)的認(rèn)知、理解、創(chuàng)作能力,帶來(lái)全新互動(dòng)體驗(yàn)。

紫東太初多模態(tài)大模型擁有三大關(guān)鍵技術(shù)和六大核心能力。三大關(guān)鍵技術(shù):多模態(tài)理解與生成多任務(wù)統(tǒng)一建模;面向國(guó)產(chǎn)化軟硬件的高效訓(xùn)練與部署;多模態(tài)預(yù)訓(xùn)練模型架構(gòu)設(shè)計(jì)與優(yōu)化。六大核心能力:多模態(tài)統(tǒng)一表示與語(yǔ)義關(guān)聯(lián);預(yù)訓(xùn)練模型網(wǎng)絡(luò)架構(gòu)合計(jì);模型適配與分布式訓(xùn)練;跨模態(tài)內(nèi)容轉(zhuǎn)化與生成;標(biāo)注受限自監(jiān)督模型學(xué)習(xí);模型輕量化與推理加速。

近期,為推動(dòng)數(shù)字技術(shù)與行業(yè)應(yīng)用深度融合,提供更加先進(jìn)的新一代人工智能解決方案,助力產(chǎn)業(yè)升級(jí)和發(fā)展,武漢人工智能研究院基于“紫東太初”全模態(tài)大模型,搭建全棧國(guó)產(chǎn)化“紫東太初”大模型開(kāi)放服務(wù)平臺(tái)。“紫東太初”跨模態(tài)通用人工智能平臺(tái)以多模態(tài)大模型為核心,基于全棧國(guó)產(chǎn)化基礎(chǔ)軟硬件平臺(tái),可支撐全場(chǎng)景AI應(yīng)用。

武漢人工智能研究院院長(zhǎng)王金橋不久前表示,武漢人工智能研究院是以科技創(chuàng)新與成果轉(zhuǎn)化雙輪驅(qū)動(dòng)的新型研發(fā)機(jī)構(gòu),作為湖北省人工智能產(chǎn)業(yè)鏈“鏈創(chuàng)”平臺(tái),基于“紫東太初”多模態(tài)大模型,在智能制造、智慧醫(yī)療等多個(gè)領(lǐng)域打造了典型示范應(yīng)用,并搭建全棧國(guó)產(chǎn)化自主可控的紫東太初大模型開(kāi)放服務(wù)平臺(tái),全力打造湖北省數(shù)字經(jīng)濟(jì)智能底座。

“紫東太初”大模型正在賦能千行百業(yè)

據(jù)介紹,目前紫東太初已經(jīng)在各行各業(yè)中實(shí)現(xiàn)應(yīng)用。據(jù)武漢人工智能研究院官網(wǎng)介紹,該機(jī)構(gòu)基于“紫東太初”多模態(tài)大模型攜手長(zhǎng)安歐尚,共同引入了元宇宙的概念,創(chuàng)造出YYDS虛擬數(shù)字人,可以通過(guò)復(fù)刻自己或者親人的形象和聲音,捏出專屬的語(yǔ)音助手。

攜手杭州市文廣旅游局、杭州移動(dòng),基于“紫東太初”多模態(tài)大模型打造文旅場(chǎng)景首個(gè)多模態(tài)AI數(shù)字人“杭小憶”,為杭州文化旅游提供具有親和力、感染力、吸引力的代言人形象。利用AR/VR技術(shù)還原南宋御街歷史風(fēng)貌,包含陶瓷燒制釉變、活字印刷、特色小吃等場(chǎng)景。

在紡織制造領(lǐng)域,該機(jī)構(gòu)與魏橋集團(tuán)合作了布匹缺陷檢測(cè)設(shè)備,該設(shè)備通過(guò)接入“紫東太初”大模型的質(zhì)檢攝像頭識(shí)別70多種布匹瑕疵,能夠在較短時(shí)間內(nèi)就滿足生產(chǎn)的精度要求,在驗(yàn)布檢驗(yàn)環(huán)節(jié)相比人工實(shí)現(xiàn)了質(zhì)的突破,瑕疵識(shí)別檢出率高達(dá)95%。還能夠基于聲音發(fā)現(xiàn)瑕疵,提升紡織行業(yè)織布、驗(yàn)布效率,助力紡織工業(yè)質(zhì)檢。

在醫(yī)療領(lǐng)域,“紫東太初-火石數(shù)智燧石醫(yī)療大模型”最新應(yīng)用成果于近期正式發(fā)布,九州通醫(yī)療器械集團(tuán)項(xiàng)目總監(jiān)徐琳介紹,對(duì)于骨科疾病治療場(chǎng)景來(lái)說(shuō),按照監(jiān)管要求,目前很多醫(yī)院設(shè)備科的工作人員,是拿著放大鏡一顆一顆地去數(shù)骨釘?shù)群牟?,統(tǒng)計(jì)使用數(shù)量、類型,驗(yàn)收器械的批號(hào)和實(shí)物是否一致,這種核驗(yàn)過(guò)程不夠高效快捷。

她透露,今年3月起,九州通與武漢人工智能研究院聯(lián)合進(jìn)行技術(shù)研發(fā),歷經(jīng)半年,完成骨科內(nèi)植入耗材系統(tǒng)“骨科嫦娥”智慧系統(tǒng)研發(fā)。系統(tǒng)利用人工智能、深度神經(jīng)卷積以及大模型等技術(shù),在一個(gè)完整手術(shù)治療周期內(nèi),對(duì)骨科復(fù)雜植入物和工具進(jìn)行智慧識(shí)別、全程追蹤、報(bào)表統(tǒng)計(jì)、能效分析、數(shù)據(jù)查詢、共享協(xié)同等閉環(huán)式、智慧化高效管理,試行效果良好。

“江城洛神”是基于“紫東太初”大模型打造的人工智能內(nèi)容創(chuàng)作平臺(tái),通過(guò)多模態(tài)技術(shù)實(shí)現(xiàn)圖像編輯與生成,輔助內(nèi)容生產(chǎn),用戶無(wú)需任何專業(yè)技能,只需輕輕一點(diǎn),便可輕松創(chuàng)造出屬于自己的藝術(shù)作品,可廣泛運(yùn)用于設(shè)計(jì)、影視、游戲等多個(gè)領(lǐng)域。

以室內(nèi)裝修設(shè)計(jì)領(lǐng)域?yàn)槔?,只需提供一張戶型圖,“江城洛神”就可自動(dòng)生成多種裝修設(shè)計(jì)樣式,提示詞越多、越精細(xì),生成質(zhì)量就越高,還能根據(jù)不同提示自動(dòng)對(duì)結(jié)果進(jìn)行編輯。

王金橋表示,“紫東太初”大模型正在賦能千行百業(yè),推動(dòng)數(shù)字經(jīng)濟(jì)全面發(fā)展。“紫東太初”人工智能開(kāi)放服務(wù)平臺(tái)目前已成功應(yīng)用于汽車制造質(zhì)檢、媒體信息服務(wù)、文化旅游、手語(yǔ)教育、紡織生產(chǎn)質(zhì)檢、醫(yī)療器械等10余個(gè)領(lǐng)域,形成規(guī)?;瘧?yīng)用落地。

小結(jié)

人工智能未來(lái)的10年將是生成式人工智能的10年,如今國(guó)內(nèi)外各大科技巨頭及AI企業(yè)已經(jīng)從初期招兵買馬啟動(dòng)大模型產(chǎn)品的技術(shù)研發(fā),進(jìn)入到拓展應(yīng)用場(chǎng)景的階段。如今市面上已經(jīng)發(fā)布的大模型有幾百款。然而,通用大模型就如早期的操作系統(tǒng)一樣,最終只會(huì)需要一兩個(gè)或者兩三個(gè)。未來(lái),就看誰(shuí)能夠真正了解市場(chǎng)需求,最終脫穎而出了。





聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    商湯日日新模態(tài)模型權(quán)威評(píng)測(cè)第一

    剛剛,商湯科技日日新SenseNova模態(tài)模型,在權(quán)威綜合評(píng)測(cè)權(quán)威平臺(tái)OpenCompass的模態(tài)評(píng)測(cè)中取得榜單第一。
    的頭像 發(fā)表于 12-20 10:39 ?194次閱讀

    一文理解模態(tài)大語(yǔ)言模型——下

    /understanding-multimodal-llms ? 《一文理解模態(tài)大語(yǔ)言模型 - 上》介紹了什么是模態(tài)大語(yǔ)言
    的頭像 發(fā)表于 12-03 15:18 ?129次閱讀
    一文理解<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大語(yǔ)言<b class='flag-5'>模型</b>——下

    模型加速賦能行業(yè) 訊飛星火引領(lǐng)大模型規(guī)?;?/b>落地時(shí)代

    經(jīng)過(guò)一年的探索與調(diào)整,2024年的大模型產(chǎn)業(yè)開(kāi)始真正進(jìn)入到規(guī)?;?/b>落地應(yīng)用階段。在新的時(shí)期,模型之間的能力比拼只是基礎(chǔ),各家開(kāi)始真正進(jìn)入到是否能為產(chǎn)業(yè)帶來(lái)助力的硬實(shí)力比拼上。 10月2
    的頭像 發(fā)表于 10-28 14:03 ?163次閱讀

    利用OpenVINO部署Qwen2模態(tài)模型

    模態(tài)模型的核心思想是將不同媒體數(shù)據(jù)(如文本、圖像、音頻和視頻等)進(jìn)行融合,通過(guò)學(xué)習(xí)不同模態(tài)之間的關(guān)聯(lián),實(shí)現(xiàn)更加智能的信息處理。簡(jiǎn)單來(lái)說(shuō)
    的頭像 發(fā)表于 10-18 09:39 ?440次閱讀

    蘋果發(fā)布300億參數(shù)模態(tài)AI大模型MM1.5

    蘋果近日推出了全新的模態(tài)AI大模型MM1.5,該模型擁有高達(dá)300億的參數(shù)規(guī)模,是在前代MM1
    的頭像 發(fā)表于 10-14 15:50 ?275次閱讀

    云知聲推出山海模態(tài)模型

    在人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來(lái)的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心獨(dú)運(yùn)的山海模態(tài)
    的頭像 發(fā)表于 08-27 15:20 ?394次閱讀

    依圖模態(tài)模型伙伴CTO精研班圓滿舉辦

    模型在不同行業(yè)領(lǐng)域的應(yīng)用前景;7月19日, “依圖科技模態(tài)模型伙伴CTO精研班”在杭州圓滿舉辦,讓更多的伙伴們深度體驗(yàn)了依圖
    的頭像 發(fā)表于 07-23 15:16 ?422次閱讀

    IBM陳旭東:攜手IBM加速 AI 規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    、總經(jīng)理陳旭東應(yīng)邀參會(huì),并以"加速 AI 規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力"為題作主旨演講。 他認(rèn)為,在企業(yè)規(guī)?;?/b>應(yīng)用AI的路徑中,最關(guān)鍵的是如何把企業(yè)數(shù)據(jù)轉(zhuǎn)化為AI源泉,即用企業(yè)的數(shù)據(jù)去訓(xùn)練大
    的頭像 發(fā)表于 07-15 16:13 ?323次閱讀
    IBM陳旭東:攜手IBM<b class='flag-5'>加速</b> AI <b class='flag-5'>規(guī)?;?/b>應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    李未可科技模態(tài) AI 大模型正式發(fā)布,積極推進(jìn) AI 在終端的場(chǎng)景應(yīng)用 ? 4月18日,2024中國(guó)生成式AI大會(huì)上李未可科技正式發(fā)布為眼鏡等未來(lái)終端定向優(yōu)化等自研WAKE-AI
    發(fā)表于 04-18 17:01 ?601次閱讀
    李未可科技正式推出WAKE-AI<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大<b class='flag-5'>模型</b>

    蘋果發(fā)布300億參數(shù)MM1模態(tài)模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態(tài)模型研究成果——MM1。這款具有高達(dá)300億參數(shù)
    的頭像 發(fā)表于 03-19 11:19 ?903次閱讀

    武漢人工智能研究院即將發(fā)布“太初 3.0”,助力千行百業(yè)發(fā)展

    湖北日?qǐng)?bào)透露,該項(xiàng)目的負(fù)責(zé)人王金橋院長(zhǎng)表示:“為了進(jìn)一步提升自身對(duì)各行業(yè)的支持力度,我們計(jì)劃在今年上半年發(fā)布‘太初 3.0’版本”。此外,他也提到,該研究所在智能駕駛領(lǐng)域與東風(fēng)汽車、光庭信息的合作正逐步推進(jìn)。
    的頭像 發(fā)表于 03-05 16:25 ?1189次閱讀

    螞蟻集團(tuán)推出20億參數(shù)模態(tài)遙感基礎(chǔ)模型SkySense

    近日,螞蟻集團(tuán)聯(lián)合武漢大學(xué)宣布成功研發(fā)出20億參數(shù)模態(tài)遙感基礎(chǔ)模型SkySense。這一創(chuàng)新模型由螞蟻集團(tuán)的AI創(chuàng)新研發(fā)部門NextEvo
    的頭像 發(fā)表于 03-04 11:22 ?821次閱讀

    螞蟻推出20億參數(shù)模態(tài)遙感模型SkySense

    據(jù)了解,負(fù)責(zé)開(kāi)發(fā)的百靈團(tuán)隊(duì)利用自身?yè)碛械?9億遙感影像數(shù)據(jù)集進(jìn)行了預(yù)訓(xùn)練,從而生成了具有20.6億參數(shù)的SkySense大模型。官方稱其為全球范圍內(nèi)參數(shù)規(guī)模最大、任務(wù)覆蓋最全且識(shí)別精度
    的頭像 發(fā)表于 02-28 15:53 ?675次閱讀

    機(jī)器人基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型

    ByteDance Research 基于開(kāi)源的模態(tài)語(yǔ)言視覺(jué)大模型 OpenFlamingo 開(kāi)發(fā)了開(kāi)源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?422次閱讀
    機(jī)器人基于開(kāi)源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語(yǔ)言視覺(jué)大<b class='flag-5'>模型</b>

    什么是模態(tài)?模態(tài)的難題是什么?

    模態(tài)模型,通常大于100M~1B參數(shù)。具有較強(qiáng)的通用性,比如對(duì)圖片中任意物體進(jìn)行分割,或者生成任意內(nèi)容的圖片或聲音。極大降低了場(chǎng)景的定制成本。
    的頭像 發(fā)表于 01-17 10:03 ?4649次閱讀
    什么是<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>?<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>的難題是什么?