0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟OmniParser V2發(fā)布:大模型轉(zhuǎn)化為計(jì)算機(jī)智能體

科技綠洲 ? 來源:網(wǎng)絡(luò)整理 ? 作者:網(wǎng)絡(luò)整理 ? 2025-02-17 14:35 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,微軟官網(wǎng)宣布了一項(xiàng)重要更新。微軟發(fā)布了其視覺Agent解析框架OmniParser的最新版本V2。這一新版本具備將包括OpenAI的4o、o1、o3-mini,DeepSeek的R1,Qwen的2.5VL,以及Anthropic的Sonnet在內(nèi)的大模型,轉(zhuǎn)化為“計(jì)算機(jī)使用智能體”(Computer Use Agent)的能力。

與前代版本相比,OmniParser V2在多個(gè)方面實(shí)現(xiàn)了顯著提升。在檢測(cè)更微小、可交互的元素時(shí),V2展現(xiàn)了更高的精度和更快的推理速度。這一提升得益于V2采用了更大規(guī)模的交互元素檢測(cè)數(shù)據(jù)集和圖標(biāo)功能描述數(shù)據(jù)進(jìn)行訓(xùn)練。

此外,OmniParser V2還通過縮小圖標(biāo)描述模型的輸入圖像尺寸,進(jìn)一步優(yōu)化了推理性能。據(jù)微軟官方數(shù)據(jù),與前代版本相比,V2的推理延遲降低了60%。這一改進(jìn)使得OmniParser V2在處理復(fù)雜視覺任務(wù)時(shí)更加高效,為用戶提供了更加流暢、實(shí)時(shí)的交互體驗(yàn)。

此次OmniParser V2的發(fā)布,不僅展示了微軟在人工智能領(lǐng)域的持續(xù)創(chuàng)新,也為大模型在計(jì)算機(jī)智能體領(lǐng)域的應(yīng)用開辟了新的道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6685

    瀏覽量

    105718
  • 計(jì)算機(jī)
    +關(guān)注

    關(guān)注

    19

    文章

    7660

    瀏覽量

    90745
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1224

    瀏覽量

    25439
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3138

    瀏覽量

    4058
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    V2板子上部署豆包模型調(diào)試指南

    V2板子上部署豆包模型調(diào)試指南 準(zhǔn)備階段 首先,可以觀看大模型實(shí)戰(zhàn)(SC171開發(fā)套件V3)并下載工程源碼,之后我們需要在板子上安裝這個(gè)代碼所要用到的一些庫(kù)。 pip3 instal
    發(fā)表于 05-25 10:17

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布

    重磅更新 | 先楫半導(dǎo)體HPM_APPS v1.9.0發(fā)布
    的頭像 發(fā)表于 05-13 11:29 ?555次閱讀
    重磅更新 | 先楫半導(dǎo)體HPM_APPS <b class='flag-5'>v</b>1.9.0<b class='flag-5'>發(fā)布</b>

    微軟推出兩款全新銷售智能

    采用智能Mirosoft Copilot副駕駛,企業(yè)構(gòu)建超40萬個(gè)自定義智能。新功能公開預(yù)覽版將于5月發(fā)布,體驗(yàn)AI銷售新紀(jì)元!
    的頭像 發(fā)表于 05-09 16:09 ?566次閱讀

    硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能化用戶體驗(yàn)時(shí)代到來

    ,芯片能力的躍遷都是一切的起點(diǎn)。從率先落地端側(cè)AI大模型,到打造天璣AI智能化引擎,聯(lián)發(fā)科一直跑在行業(yè)最前沿。去年發(fā)布的天璣9400不僅端
    發(fā)表于 04-13 19:51

    軟通計(jì)算機(jī)重磅發(fā)布DeepSeek大模型機(jī)產(chǎn)品

    。 在人工智能技術(shù)加速賦能千行百業(yè)的背景下,隨著AI應(yīng)用場(chǎng)景的深度拓展,模型部署復(fù)雜度高、場(chǎng)景適配難度大、運(yùn)維成本居高不下等問題日益凸顯,嚴(yán)重制約了技術(shù)普惠進(jìn)程。此次,軟通計(jì)算機(jī)發(fā)布
    的頭像 發(fā)表于 03-22 10:40 ?955次閱讀
    軟通<b class='flag-5'>計(jì)算機(jī)</b>重磅<b class='flag-5'>發(fā)布</b>DeepSeek大<b class='flag-5'>模型</b>一<b class='flag-5'>體</b>機(jī)產(chǎn)品

    機(jī)智發(fā)布Gokit5 AI智能開發(fā)板:工業(yè)級(jí)智能流水線重構(gòu)AIoT開發(fā)范式

    【2025年2月26日,廣州】全球領(lǐng)先的AIoT服務(wù)商機(jī)智云正式發(fā)布“Gokit5AI智能開發(fā)板”,該產(chǎn)品作為行業(yè)首個(gè)全棧式AIoT開發(fā)中
    的頭像 發(fā)表于 02-26 13:33 ?588次閱讀
    <b class='flag-5'>機(jī)智</b>云<b class='flag-5'>發(fā)布</b>Gokit5 AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>開發(fā)板:工業(yè)級(jí)<b class='flag-5'>智能</b><b class='flag-5'>體</b>流水線重構(gòu)AIoT開發(fā)范式

    微軟OmniParser V2:大模型轉(zhuǎn)化為計(jì)算機(jī)智能

    )以及Anthropic(Sonnet)等,轉(zhuǎn)化為計(jì)算機(jī)使用智能”(Computer Use Agent)的能力。 與前一版本相比,OmniPa
    的頭像 發(fā)表于 02-18 09:31 ?2332次閱讀

    新華三發(fā)布DeepSeek大模型機(jī)UniCube

    日前,紫光股份旗下的新華三集團(tuán)震撼發(fā)布了基于DeepSeek大模型的一機(jī)產(chǎn)品——UniCube。這款一機(jī)全面搭載了DeepSeek V3
    的頭像 發(fā)表于 02-11 15:21 ?1546次閱讀

    OpenAI將發(fā)布智能GPT模型及AI智能工具

    OpenAI近日透露了其未來發(fā)展的重要?jiǎng)酉?。?jù)OpenAI首席產(chǎn)品官凱文·維爾(Kevin Weil)介紹,公司計(jì)劃推出更智能的GPT o3模型,并首次亮相AI智能工具,這將使Cha
    的頭像 發(fā)表于 01-24 13:54 ?534次閱讀

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1467次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    谷歌計(jì)劃12月發(fā)布Gemini 2.0模型

    近日,有消息稱谷歌計(jì)劃在12月發(fā)布其下一代人工智能模型——Gemini 2.0。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,因?yàn)楣雀柙谌斯?b class='flag-5'>智能領(lǐng)域一直保持著領(lǐng)先地位,而Gemini系列
    的頭像 發(fā)表于 10-29 11:02 ?1137次閱讀

    NVIDIA助力丹麥發(fā)布首臺(tái)AI超級(jí)計(jì)算機(jī)

    這臺(tái)丹麥最大的超級(jí)計(jì)算機(jī)由該國(guó)政府與丹麥 AI 創(chuàng)新中心共同建設(shè),是一臺(tái) NVIDIA DGX SuperPOD 超級(jí)計(jì)算機(jī)。
    的頭像 發(fā)表于 10-27 09:42 ?891次閱讀

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)有什么區(qū)別

    晶體管計(jì)算機(jī)和電子管計(jì)算機(jī)作為計(jì)算機(jī)發(fā)展史上的兩個(gè)重要階段,它們?cè)诙鄠€(gè)方面存在顯著的區(qū)別。以下是對(duì)這兩類計(jì)算機(jī)在硬件、性能、應(yīng)用以及技術(shù)發(fā)展等方面區(qū)別的詳細(xì)闡述。
    的頭像 發(fā)表于 08-23 15:28 ?3599次閱讀

    INAIR發(fā)布新款A(yù)R空間計(jì)算機(jī)INAIR 2

    科技前沿再添新軍,INAIR近期震撼發(fā)布了其最新款A(yù)R空間計(jì)算機(jī)——INAIR 2。這款集AR眼鏡與空間計(jì)算主機(jī)INAIR Pod于一的創(chuàng)
    的頭像 發(fā)表于 08-12 16:09 ?1067次閱讀

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺技術(shù)依賴于多種先進(jìn)的AI算法
    的頭像 發(fā)表于 07-24 12:46 ?1798次閱讀