0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里發(fā)布手機操作智能體框架Mobile-Agent

CHANBAEK ? 來源:網(wǎng)絡(luò)整理 ? 2024-02-05 10:41 ? 次閱讀

阿里巴巴與北京交通大學(xué)的聯(lián)合團隊近日在學(xué)術(shù)界引起了廣泛關(guān)注,因為他們共同推出了一款全新的手機操作智能體框架——Mobile-Agent。這款框架旨在為手機用戶提供更高效、便捷的操作體驗,引領(lǐng)手機操作方式的全新革命。

Mobile-Agent框架的核心優(yōu)勢在于其純視覺解決方案。傳統(tǒng)的手機操作方式往往需要依賴XML等標(biāo)記語言以及系統(tǒng)元數(shù)據(jù),而Mobile-Agent則完全摒棄了這些需求。這意味著用戶無需進行復(fù)雜的設(shè)置或修改,只需通過直觀的視覺指示即可完成操作。

Mobile-Agent的操作范圍不受任何限制,可以在任何應(yīng)用上進行操作。這得益于其強大的多應(yīng)用操作能力,使得用戶可以在不同應(yīng)用之間輕松切換,無需重復(fù)相同的操作步驟。

為了實現(xiàn)精確的操作定位,Mobile-Agent配備了多種視覺感知工具。這些工具能夠識別屏幕上的各種元素,如按鈕、圖標(biāo)等,并對其進行精準(zhǔn)的定位和識別。這一功能為用戶提供了更加個性化的操作體驗,滿足各種不同用戶的需求。

最令人驚喜的是,Mobile-Agent無需進行任何訓(xùn)練即可即插即用。這意味著用戶無需花費大量時間進行學(xué)習(xí)和適應(yīng),即可輕松上手。這種便捷性使得Mobile-Agent具有廣泛的應(yīng)用前景,為各類用戶提供更加高效、智能的手機操作體驗。

目前,Mobile-Agent已經(jīng)學(xué)會了如何操作阿里巴巴、谷歌地圖、TikTok等10個知名應(yīng)用。這意味著用戶可以通過簡單的視覺指示,在這些應(yīng)用上進行各種操作,完成跨應(yīng)用任務(wù)。這一功能為用戶提供了前所未有的便利性,使得手機操作變得更加輕松愉快。

總體來說,阿里發(fā)布的手機操作智能體框架Mobile-Agent具有巨大的潛力,有望引領(lǐng)手機操作方式的全新變革。通過純視覺解決方案、不受限制的操作范圍、精準(zhǔn)的操作定位以及無需訓(xùn)練的便捷性,Mobile-Agent為用戶提供了更加高效、智能的手機操作體驗。未來,我們期待看到更多關(guān)于Mobile-Agent的研究和應(yīng)用,為手機操作領(lǐng)域帶來更多的創(chuàng)新和突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 手機
    +關(guān)注

    關(guān)注

    35

    文章

    6917

    瀏覽量

    158826
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1628

    瀏覽量

    47752
收藏 人收藏

    評論

    相關(guān)推薦

    Manus與阿里通義達成合作

    據(jù)媒體報道,火爆異常的AI Agent新秀Manus和阿里云旗下大語言模型通義千問達成合作。雙方將基于通義千問系列開源模型,在國產(chǎn)模型和算力平臺上實現(xiàn)Manus的全部功能;雙方將共同推動通用智能
    的頭像 發(fā)表于 03-12 15:47 ?317次閱讀

    【書籍評測活動NO.59】零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能

    把握科技大勢。 ▊《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能》 葉濤管鍇張心雨 著 不懂編程也可以開發(fā)Agent Agent
    發(fā)表于 03-10 16:29

    【「AI Agent應(yīng)用與項目實戰(zhàn)」閱讀體驗】書籍介紹

    會追根溯源,讓你有種“大徹大悟”的感覺。 這本書主要講大語言模型的內(nèi)容,教我們做一個AI Agent應(yīng)用出來,其實這個東西現(xiàn)在也叫智能了,他跟我們平常使用大語言模型有個不同點在于他會專注某個領(lǐng)域
    發(fā)表于 03-05 20:40

    《AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應(yīng)用與項目實戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶需求和環(huán)境變化做出相應(yīng)響應(yīng)。通?;谏疃?/div>
    發(fā)表于 03-05 19:52

    《AI Agent應(yīng)用與項目實戰(zhàn)》閱讀體驗--跟著迪哥學(xué)Agent

    的知識是自由行,那么閱讀《Agent》就是跟團游。它讓我對AI落地應(yīng)用有了更系統(tǒng)和清晰的了解。 《Agent》第一章是全書的導(dǎo)引章節(jié),本章讓我對Agent的理解從模糊到清晰,然后逐一介紹Age
    發(fā)表于 03-02 12:28

    《AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成式代理

    了語言的自然度。 第4章是講述AutoGen Agent開發(fā)框架實戰(zhàn)。微軟開源的AutoGen框架Agent開發(fā)提供了革新性的解決方案。該框架
    發(fā)表于 02-25 21:59

    《AI Agent 應(yīng)用與項目實戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺的應(yīng)用

    Operator 和 Deep Research 代表的第三層 Agent。 我對AI Agent的發(fā)展前景和未來應(yīng)用落地都持有非常樂觀的看法。 談回到本書,書中對Agent框架的闡
    發(fā)表于 02-19 16:35

    名單公布!【書籍評測活動NO.55】AI Agent應(yīng)用與項目實戰(zhàn)

    日程預(yù)測性地調(diào)整了今天的工作安排。 在近日的Agent OpenDay上,智譜AI展示了在AI Agent智能)方面最新成果,發(fā)布了用A
    發(fā)表于 01-13 11:04

    黑芝麻智能與RockAI發(fā)布AI Agent解決方案

    黑芝麻智能與RockAI聯(lián)合發(fā)布基于武當(dāng)C1200家族芯片的AI Agent解決方案,該方案將部署于未來的智能座艙應(yīng)用中。
    的頭像 發(fā)表于 01-10 16:33 ?366次閱讀

    AI智能是什么_AI智能如何重塑企業(yè)業(yè)務(wù)流程

    AI技術(shù)的飛速發(fā)展令人矚目。就在企業(yè)領(lǐng)導(dǎo)者們剛開始熟悉AI助手時,AI智能Agent(國際版)已經(jīng)迅速成為討論的焦點。它們之所以受到廣泛關(guān)注,是因為正如每位員工都將配備AI助手一樣,每個業(yè)務(wù)流程也
    的頭像 發(fā)表于 12-19 17:55 ?514次閱讀

    榮耀發(fā)布個人化全場景AI操作系統(tǒng)MagicOS 9.0

    近期,手機市場迎來了一波密集的新品發(fā)布,其中AI技術(shù)成為了各大廠商競相追逐的焦點。   10月23日,榮耀公司發(fā)布了行業(yè)首個搭載智能
    的頭像 發(fā)表于 10-29 16:48 ?1089次閱讀

    基于Qwen-Agent與OpenVINO構(gòu)建本地AI智能

    Qwen2 是阿里巴巴集團 Qwen 團隊研發(fā)的大語言模型和大型多模態(tài)模型系列。Qwen2 具備自然語言理解、文本生成、視覺理解、音頻理解、工具使用、角色扮演、作為 AI Agent 進行互動等多種能力。
    的頭像 發(fā)表于 07-26 09:54 ?1004次閱讀
    基于Qwen-<b class='flag-5'>Agent</b>與OpenVINO構(gòu)建本地AI<b class='flag-5'>智能</b><b class='flag-5'>體</b>

    螞蟻集團發(fā)布首個開源金融場景多智能框架

    在第七屆數(shù)字中國建設(shè)峰會上,螞蟻集團宣布了一項引人注目的舉措:正式開源其多智能框架agentUniverse。這一框架不僅是金融領(lǐng)域的首個開源多
    的頭像 發(fā)表于 05-28 09:25 ?811次閱讀

    阿里達摩院提出“知識鏈”框架,降低大模型幻覺

    近日,阿里巴巴達摩院(湖畔實驗室)攜手新加坡南洋理工大學(xué)等研究機構(gòu),共同推出了大模型知識鏈(CoK)框架。該框架不僅可實時檢索異構(gòu)知識源,還能逐步糾正推理錯誤,有效提高了大模型在回答知識型問題時的準(zhǔn)確率,并顯著降低了所謂的“幻覺
    的頭像 發(fā)表于 05-10 11:46 ?794次閱讀

    創(chuàng)作者變身知識智能,AI時代的“超級個體”

    Agent不創(chuàng)作:為什么知識智能是創(chuàng)作者的人生杠桿?
    的頭像 發(fā)表于 04-23 09:26 ?1576次閱讀
    創(chuàng)作者變身知識<b class='flag-5'>智能</b><b class='flag-5'>體</b>,AI時代的“超級個體”