0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NaVILA:加州大學與英偉達聯(lián)合發(fā)布新型視覺語言模型

科技綠洲 ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2024-12-13 10:51 ? 次閱讀

日前,加州大學的研究人員攜手英偉達,共同推出了一款創(chuàng)新的視覺語言模型——NaVILA。該模型在機器人導航領(lǐng)域展現(xiàn)出了獨特的應(yīng)用潛力,為智能機器人的自主導航提供了一種全新的解決方案。

視覺語言模型(VLM)是一種具備多模態(tài)生成能力的先進AI模型。它能夠智能地處理文本、圖像以及視頻等多種提示,并通過復雜的推理過程,實現(xiàn)對這些信息的準確理解和應(yīng)用。NaVILA正是基于這一原理,通過將大型語言模型(LLM)與視覺編碼器進行巧妙的結(jié)合,從而賦予了LLM“視覺感知”的神奇能力。

這一創(chuàng)新性的結(jié)合,使得NaVILA在機器人導航領(lǐng)域展現(xiàn)出了卓越的性能。它能夠根據(jù)環(huán)境中的視覺信息,結(jié)合文本指令或描述,為機器人提供精確的定位和導航服務(wù)。這一特性不僅提高了機器人的自主性和智能化水平,還為機器人在復雜環(huán)境中的應(yīng)用提供了更加廣闊的空間。

NaVILA的發(fā)布,標志著視覺語言模型在機器人導航領(lǐng)域取得了重要的突破。未來,隨著技術(shù)的不斷發(fā)展和完善,相信NaVILA將在更多領(lǐng)域展現(xiàn)出其獨特的價值和潛力,為人工智能技術(shù)的發(fā)展和應(yīng)用貢獻更多的力量。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    211

    文章

    28418

    瀏覽量

    207082
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    524

    瀏覽量

    10277
  • 英偉達
    +關(guān)注

    關(guān)注

    22

    文章

    3776

    瀏覽量

    91080
收藏 人收藏

    評論

    相關(guān)推薦

    英偉Blackwell可支持10萬億參數(shù)模型AI訓練,實時大語言模型推理

    、NVLink交換機、Spectrum以太網(wǎng)交換機和Quantum InfiniBand交換機。 ? 英偉稱,Blackwell擁有6項革命性技術(shù),可支持多達10萬億參數(shù)的模型進行AI訓練
    的頭像 發(fā)表于 09-04 09:10 ?2904次閱讀

    英偉推出Eagle系列模型

    英偉最新推出的Eagle系列模型,以其1024×1024像素的高分辨率處理能力,重新定義了視覺信息處理的邊界。該模型通過多專家
    的頭像 發(fā)表于 09-03 16:13 ?462次閱讀

    英偉推出Flextron AI框架:賦能靈活高效的AI模型部署

    在人工智能與機器學習領(lǐng)域,隨著技術(shù)的不斷演進,模型的高效部署與適應(yīng)性成為研究的新熱點。近日,英偉與德克薩斯大學奧斯汀分校攜手宣布了一項重大突破——推出了一種名為FLEXTRON的
    的頭像 發(fā)表于 07-18 15:22 ?2756次閱讀

    商湯科技與泰國DTGO集團聯(lián)合發(fā)布泰語大模型

    「日日新」出海了! 7月10日,商湯聯(lián)合泰國DTGO集 團及旗下Quinnnova共同發(fā)布「東風」泰語大模型?(DTLM),成為 全球首個能在泰文、中文、英文三種語言環(huán)境下高效工作的A
    的頭像 發(fā)表于 07-11 19:57 ?1129次閱讀
    商湯科技與泰國DTGO集團<b class='flag-5'>聯(lián)合發(fā)布</b>泰語大<b class='flag-5'>模型</b>

    谷歌發(fā)布新型語言模型Gemma 2

    在人工智能領(lǐng)域,大語言模型一直是研究的熱點。近日,全球科技巨頭谷歌宣布,面向全球研究人員和開發(fā)人員,正式發(fā)布了其最新研發(fā)的大語言模型——Ge
    的頭像 發(fā)表于 06-29 09:48 ?439次閱讀

    英偉開源Nemotron-4 340B系列模型,助力大型語言模型訓練

    近日,英偉宣布開源了一款名為Nemotron-4 340B的大型模型,這一壯舉為開發(fā)者們打開了通往高性能大型語言模型(LLM)訓練的新天地
    的頭像 發(fā)表于 06-17 14:53 ?567次閱讀

    中山大學中山眼科中心與華為聯(lián)合發(fā)布ChatZOC眼科大模型

    [2024年6月6日]今天是第29個全國愛眼日,中山大學中山眼科中心與華為技術(shù)有限公司攜手合作,聯(lián)合發(fā)布基于人工智能技術(shù)研究構(gòu)建的眼科大模型ChatZOC,為守護人民群眾眼健康開辟新路徑。 中山
    的頭像 發(fā)表于 06-06 19:04 ?2220次閱讀

    英偉推出AI模型推理服務(wù)NVIDIA NIM

    英偉近日宣布推出一項革命性的AI模型推理服務(wù)——NVIDIA NIM。這項服務(wù)將極大地簡化AI模型部署過程,為全球的2800萬英偉
    的頭像 發(fā)表于 06-04 09:15 ?679次閱讀

    奧比中光英偉聯(lián)辦3D視覺創(chuàng)新應(yīng)用競賽圓滿收官

    5月15日,奧比中光與NVIDIA(英偉聯(lián)合主辦的“2024第四屆3D視覺創(chuàng)新應(yīng)用競賽”圓滿落幕。
    的頭像 發(fā)表于 05-30 09:37 ?428次閱讀
    奧比中光<b class='flag-5'>英偉</b><b class='flag-5'>達</b>聯(lián)辦3D<b class='flag-5'>視覺</b>創(chuàng)新應(yīng)用競賽圓滿收官

    英偉首席執(zhí)行官黃仁勛:AI模型推動英偉AI芯片需求

    近來,以ChatGPT為代表的AI聊天機器人已經(jīng)導致英偉AI芯片供應(yīng)緊張。然而,隨著能夠創(chuàng)造視頻并進行近似人類交流的新型AI模型問世,英偉
    的頭像 發(fā)表于 05-24 10:04 ?504次閱讀

    英偉靜候新品來臨,亞馬遜暫緩購買Grace Hopper

    今年3月,英偉發(fā)布了全新的Blackwell處理器,距離前任產(chǎn)品Hopper的發(fā)布不過短短一年。英偉
    的頭像 發(fā)表于 05-22 09:07 ?306次閱讀

    進一步解讀英偉 Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    計算工作負載、釋放百億億次計算能力和萬億參數(shù)人工智能模型的全部潛力提供關(guān)鍵基礎(chǔ)。 NVLink釋放數(shù)萬億參數(shù)AI模型的加速性能,顯著提升大型多GPU系統(tǒng)的可擴展性。每個英偉Black
    發(fā)表于 05-13 17:16

    英偉發(fā)布人形機器人基礎(chǔ)模型

    英偉在一年一度的GTC開發(fā)者大會上,由創(chuàng)始人黃仁勛親自揭曉了令人矚目的Project GR00T人形機器人項目,其中引人注目的是一款全新的人形機器人基礎(chǔ)模型。這款模型
    的頭像 發(fā)表于 03-21 11:43 ?761次閱讀

    英偉和AMD發(fā)布適用于臺式電腦的新型AI芯片

    英偉和AMD這兩家GPU巨頭近日宣布,他們將發(fā)布適用于臺式電腦的新型AI芯片。
    的頭像 發(fā)表于 01-10 13:59 ?914次閱讀