0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

樹莓派打造專屬AI Agent:DeepSeek與BrowserUse聯(lián)手實現(xiàn)智能自動化

上海晶珩電子科技有限公司 ? 2025-03-24 14:50 ? 次閱讀

導(dǎo)語

2025年3月6日,中國AI團隊Monica.im推出的通用型AI Agent產(chǎn)品Manus引爆全球科技圈。這款號稱“全球首款全自主執(zhí)行復(fù)雜任務(wù)的數(shù)字代理人”不僅刷新了GAIA基準測試的SOTA記錄,更以“手腦并用”的設(shè)計哲學(xué)掀起了一場效率革命。然而,在狂熱的市場反響背后,爭議與挑戰(zhàn)也隨之浮現(xiàn)。那么,AI Agent 到底是什么?它又如何在我們的工作和生活中發(fā)揮作用呢?今天,就讓我們一同探索這一奇妙的領(lǐng)域。

一、AI Agent 的介紹

1.1 什么是 AI Agent?

AI Agent,即智能體,是一種能夠自主執(zhí)行任務(wù)并與環(huán)境進行交互的智能程序。它通過感知環(huán)境信息,利用自身的知識和能力,做出合理的決策并采取行動,以完成特定的目標。AI Agent 的核心在于其自主性和智能性,它能夠像人類一樣思考和學(xué)習(xí),不斷提升自身的性能和適應(yīng)能力。

526ed05c-087c-11f0-9434-92fbcf53809c.png

1.2 AI Agent 的應(yīng)用

AI Agent 的應(yīng)用范圍非常廣泛,涵蓋了多個領(lǐng)域。例如,在客服領(lǐng)域,AI Agent 可以自動回答常見問題,提高客戶服務(wù)的效率;在金融領(lǐng)域,它可以用于風(fēng)險評估和投資決策;在醫(yī)療領(lǐng)域,它可以輔助醫(yī)生進行疾病診斷和治療方案制定;在教育領(lǐng)域,它可以為學(xué)生提供個性化的學(xué)習(xí)指導(dǎo)。

1.3 打造 AI Agent 的步驟

52b21bd2-087c-11f0-9434-92fbcf53809c.png

打造一個商用 AI Agent 通常需要經(jīng)過以下幾個步驟:

1.需求梳理:明確 AI Agent 的目標和功能,梳理工作流程,確定哪些任務(wù)可以由 AI 協(xié)助完成。

2.軟件選型:選擇合適的 AI Agent 開發(fā)平臺和工具,根據(jù)需求選擇合適的大模型。

3.提示工程:設(shè)計有效的提示詞,提高大模型的輸出質(zhì)量和準確性。

4.數(shù)據(jù)庫選型:選擇合適的數(shù)據(jù)庫,存儲 AI Agent 運行過程中產(chǎn)生的數(shù)據(jù)。

5.構(gòu)建 UI 界面:設(shè)計用戶界面,提高用戶體驗。

6.測試評估:對 AI Agent 進行測試和評估,確保其能夠正確地完成任務(wù)。

7.部署發(fā)布:將 AI Agent 部署到實際環(huán)境中,供用戶使用。

二、BrowserUse 的介紹

2.1 什么是 BrowserUse?

52c1bc0e-087c-11f0-9434-92fbcf53809c.png

BrowserUse 是一個開源的 Python 庫,旨在簡化 AI 代理與瀏覽器之間的交互,在Github上有36K star。通過集成 Playwright 等瀏覽器自動化工具,BrowserUse 允許開發(fā)者使用任何支持 LangChain 的大語言模型(如 GPT-4、Claude 等),來自動化瀏覽網(wǎng)頁、提取信息、模擬用戶操作等。這不僅極大地提高了網(wǎng)頁數(shù)據(jù)抓取的效率,還為開發(fā)者提供了一個靈活、可擴展的框架,用于構(gòu)建復(fù)雜的網(wǎng)頁自動化任務(wù)。之所以這么受歡迎,當然是因為他的性能炸裂:

52cd68ce-087c-11f0-9434-92fbcf53809c.png

2.2 BrowserUse 的應(yīng)用

BrowserUse 在網(wǎng)頁自動化任務(wù)中有著廣泛的應(yīng)用。例如,它可以用于自動化的網(wǎng)頁數(shù)據(jù)抓取,如從新聞網(wǎng)站抓取最新的新聞資訊、從電商網(wǎng)站抓取商品信息等;可以用于自動化的網(wǎng)頁測試,如測試網(wǎng)頁的性能和功能;還可以用于自動化的網(wǎng)頁操作,如自動填寫表單、自動點擊按鈕等。下面的圖來自項目截圖:

53073af4-087c-11f0-9434-92fbcf53809c.png

2.3 BrowserUse 的優(yōu)勢

BrowserUse 的優(yōu)勢主要體現(xiàn)在以下幾個方面:

1.支持多模型:BrowserUse 支持多種大語言模型,開發(fā)者可以根據(jù)自己的需求選擇合適的模型。

2.易于集成:BrowserUse 提供了簡單的 API,易于與現(xiàn)有的系統(tǒng)和工具集成。

3.靈活性高:BrowserUse 允許開發(fā)者自定義任務(wù)和操作,具有很高的靈活性。

4.性能強大:通過 Playwright 的支持,BrowserUse 能夠高效地完成各種復(fù)雜的網(wǎng)頁自動化任務(wù)。

三、樹莓派打造 AI Agent

3.1 項目背景

在 AI 應(yīng)用領(lǐng)域,昂貴的云服務(wù)訂閱費用和復(fù)雜的硬件配置一直是困擾開發(fā)者的問題。而樹莓派的出現(xiàn),為這一困境帶來了轉(zhuǎn)機。這款小型計算機,憑借其強大的性能和豐富的擴展性,成為眾多開發(fā)者的寵兒。然而,單獨的樹莓派在處理復(fù)雜的 AI 任務(wù)時,仍存在一定的局限性。這時,DeepSeek 和 BrowserUse 的出現(xiàn),就像一把鑰匙,打開了樹莓派 AI 應(yīng)用的大門。一位Mo Zhou的作者就在國外網(wǎng)站上展示了他的成果。

你可能會問:“這真的有用嗎?” 從我們在網(wǎng)上看到的各類測試結(jié)果來看,DeepSeek R1 在性能上與許多高級人工智能模型相當,甚至更優(yōu),只是處理速度稍慢一些。當它與用于自動化操作的 BrowserUse 搭配使用時,能處理從內(nèi)容排期到市場調(diào)研等一切基于網(wǎng)絡(luò)的任務(wù),而且沒有月費或使用限制。

你能用它自動化處理哪些任務(wù)呢?基本上,你在網(wǎng)絡(luò)瀏覽器中進行的任何操作都可以實現(xiàn)自動化:

1.監(jiān)測行業(yè)新聞

2.從網(wǎng)站收集數(shù)據(jù)

3.處理重復(fù)性的在線任務(wù)

4.安排并發(fā)布社交內(nèi)容

5.追蹤競爭對手的價格

該系統(tǒng)在你的樹莓派上本地運行,這意味著沒有云服務(wù)費用或 API 成本。你的數(shù)據(jù)會保留在本地硬件中,并且它可以全天候運行,耗電量比臺

拆解你的新型 AI 自動化組合

533b882c-087c-11f0-9434-92fbcf53809c.png

BrowserUse—— 你的自動化網(wǎng)絡(luò)導(dǎo)航器

1.從不休息

2.從不抱怨重復(fù)性任務(wù)

3.能完美記住所有操作步驟

4.無需登錄你的賬戶

5.即使在低功耗硬件上也能流暢運行

DeepSeek R1—— 你的本地 AI powerhouse

1.比大多數(shù)商業(yè)人工智能模型更智能

2.可在你的設(shè)備上直接運行(沒錯,樹莓派也可以?。?/p>

3.做出的決策合理有效

4.零訂閱成本

整套系統(tǒng)都在樹莓派上運行。這臺微型電腦可以處理:

1.完整的網(wǎng)絡(luò)自動化套件

2.本地人工智能模型(140 億參數(shù)版本)

3.多個并發(fā)任務(wù)

4.全天候運行

不同領(lǐng)域的實際任務(wù)自動化

內(nèi)容創(chuàng)作和社交媒體

“為 Instagram、Twitter 和 LinkedIn 制定下個月的內(nèi)容日歷”

你的自動化助手將:

1.規(guī)劃發(fā)布日程

2.為每個平臺起草定制內(nèi)容

3.自動安排所有內(nèi)容發(fā)布

4.追蹤參與度模式

5.在你的樹莓派上全天候運行,毫不費力

設(shè)計趨勢分析

“在 Behance、Dribbble 和 Pinterest 上監(jiān)測金融科技領(lǐng)域新興的 UI 設(shè)計趨勢”

你的系統(tǒng)通過以下方式進行跟蹤:

1.掃描多個設(shè)計平臺

2.分析常見模式

3.創(chuàng)建趨勢報告

4.保存參考圖片

5.即使你的主設(shè)備關(guān)閉,也能持續(xù)監(jiān)測

音樂行業(yè)監(jiān)測

“追蹤我的樂隊在音樂博客和社交媒體上的提及情況”

它可以處理:

1.持續(xù)的平臺監(jiān)測

2.提及和評論匯總

3.流媒體數(shù)據(jù)追蹤

4.合作機會標記

5.低功耗的后臺運行

市場分析和競爭對手追蹤

“分析競爭對手全系列產(chǎn)品的價格變化”

自動化追蹤包括:

1.價格波動監(jiān)測

2.生成對比報告

3.促銷模式分析

4.重大變化提醒

5.全天候監(jiān)測,無云服務(wù)成本

設(shè)置你經(jīng)濟實惠的 AI 助手:完整指南

準備好構(gòu)建自己的人工智能自動化系統(tǒng)了嗎?下面我們詳細拆解每一個命令,讓你清楚了解每一步操作。把這想象成搭建樂高積木,每一塊都有其用途,我們將一步一步把它們組合起來。

第一步:準備好你的樹莓派

在開始之前,用這個命令讓你的樹莓派保持最佳狀態(tài):

sudo apt-getupdate&&sudo apt-getupgrade

這一步在做什么呢?你是在告訴樹莓派:

1.更新可用軟件列表(update)

2.安裝所有軟件的最新版本(upgrade)

3.sudo 的意思是 “以管理員權(quán)限執(zhí)行此操作”

購物清單(必備工具)

首先,獲取這些免費工具:

1.Python—— 核心運行時環(huán)境

2.Git—— 代碼管理工具

3.VS Code—— 開發(fā)環(huán)境

4.UV—— 環(huán)境管理工具

5.Ollama——AI 模型運行器

構(gòu)建你的 AI 助手(分步指南)

步驟 1:設(shè)置 BrowserUse—— 獲取代碼

gitclonehttps://github.com/browser-use/web-uicdweb-ui

這一步的操作是:

下載項目(git clone)

進入項目文件夾(cd)

步驟 2:設(shè)置你的工作區(qū)這一步就像是為你的項目打造一個干凈的空間,就像為每個工作準備一個單獨的工具箱。

步驟 3:激活你的工作區(qū)

對于 Windows/Linux 系統(tǒng):無特殊指令

對于樹莓派:

sourcevenv/bin/activateexportPYTHONPATH=$PYTHONPATH:$PWD

這一步的作用是:

啟動你項目的 “工具箱”

告訴樹莓派在哪里找到所有相關(guān)內(nèi)容(export 那一行指令)

步驟 4:安裝 Browseruse

pipinstall browser-useplaywright install

這一步:

安裝自動化引擎

設(shè)置網(wǎng)絡(luò)瀏覽器控制器

步驟 5:安裝 DeepSeek R1

ollamapull deepseek-r1:14b # 適用于大多數(shù)用戶# 或者ollama pull deepseek-r1:32b # 適用于高性能計算機

這一步會下載人工智能模型,就像是為你的助手安裝 “大腦”。

最終設(shè)置:配置并啟動

1.打開你的網(wǎng)絡(luò)瀏覽器

2.訪問http://localhost:7860

3.點擊 “設(shè)置”

4.選擇 “本地” 模型

5.選擇 “deepseek-r1”

這里的每一步都是在將各個組件連接起來:

1.網(wǎng)頁界面(localhost:7860)是你的控制面板

2.“本地” 表示使用你樹莓派的 “大腦”(即本地模型)

3.“deepseek-r1” 是你將使用的人工智能模型

常見問題排查

當出現(xiàn)問題時:

1.系統(tǒng)凍結(jié):重啟設(shè)備

2.Python 問題:重新安裝通常可以解決

3.瀏覽器問題:清除緩存并重啟

4.樹莓派過熱:檢查通風(fēng)情況

5.性能滯后:確保沒有占用大量資源的后臺任務(wù)

四、提出話題,拋磚引玉,鼓勵網(wǎng)友討論及

在打造 AI Agent 的過程中,你遇到了哪些挑戰(zhàn)?是如何解決的?你對 AI Agent 和 BrowserUse 的結(jié)合應(yīng)用有什么獨特的見解?歡迎在評論區(qū)分享你的經(jīng)驗和想法,讓我們一起探討,共同進步!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    32905

    瀏覽量

    272525
  • 樹莓派
    +關(guān)注

    關(guān)注

    118

    文章

    1871

    瀏覽量

    106237
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    690

    瀏覽量

    567
收藏 人收藏

    評論

    相關(guān)推薦

    AI Agent與Agentic AI的區(qū)別

    在人工智能技術(shù)快速演進的浪潮中,AI Agent與Agentic AI的差異認知正成為企業(yè)智能化轉(zhuǎn)型的關(guān)鍵分水嶺。盡管二者都承載著
    的頭像 發(fā)表于 03-21 14:35 ?283次閱讀

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造AI開發(fā)指南。它不僅深入淺出地講解了
    發(fā)表于 03-18 12:03

    【書籍評測活動NO.59】零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能

    把握科技大勢。 ▊《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》 葉濤管鍇張心雨 著 不懂編程也可以開發(fā)Agent Agent
    發(fā)表于 03-10 16:29

    AI Agent 應(yīng)用與項目實戰(zhàn)》----- 學(xué)習(xí)如何開發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應(yīng)用與項目實戰(zhàn)》這本書學(xué)習(xí)如何構(gòu)建開發(fā)一個視頻應(yīng)用。AI Agent是一種智能
    發(fā)表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    ASIC、GPU)與FPGA的協(xié)同工作模式,例如通過芯片合封或系統(tǒng)集成,實現(xiàn)高性能的AI推理。 3.利用FPGA的獨特優(yōu)勢? 實時性與低延遲:在需要高實時性和低延遲的應(yīng)用中(如自動駕駛、工業(yè)
    發(fā)表于 03-03 11:21

    AI Agent應(yīng)用與項目實戰(zhàn)》閱讀體驗--跟著迪哥學(xué)Agent

    感謝電子發(fā)燒友的這次活動,讓我有幸抽中了《AI Agent應(yīng)用與項目實戰(zhàn)》(以下簡稱《Agent》)這本書的贈送。 收到書本之后我就迫不及待地學(xué)習(xí)書本中的知識。如果說依靠各種平臺上的文章了解關(guān)于
    發(fā)表于 03-02 12:28

    研華與昆山數(shù)字創(chuàng)新協(xié)會聯(lián)合舉辦AI Agent專題論壇

    研華與昆山數(shù)字創(chuàng)新協(xié)會聯(lián)合舉辦AI Agent專題論壇,展示了與DeepSeek大模型結(jié)合的“零代碼”AI
    的頭像 發(fā)表于 03-01 10:00 ?900次閱讀

    AI Agent 應(yīng)用與項目實戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺的應(yīng)用

    場景時表現(xiàn)出更強的適應(yīng)性。 Multi-Agent多角色協(xié)作機制是書中的一大亮點。在傳統(tǒng)的AI系統(tǒng)中,不同功能模塊往往是割裂的,缺乏有效的協(xié)同。而Multi-Agent架構(gòu)通過引入多個專業(yè)
    發(fā)表于 02-19 16:35

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇

    API實現(xiàn)簡單指令調(diào)用 支持多步驟工具鏈控制(如從仿真到結(jié)果分析的自動化腳本生成) R1 實時性需求 響應(yīng)速度更快(適合輕量級任務(wù)) 復(fù)雜任務(wù)延遲較高,但結(jié)果更嚴謹 V3(輕量場景) 結(jié)論
    發(fā)表于 02-14 02:08

    工業(yè)自動化采用DeepSeek協(xié)助調(diào)試PLC通訊

    項目采用IGT-DSER網(wǎng)關(guān)實現(xiàn)不用品牌的PLC之間通訊,碰到問題后,丟給DeepSeek用戶手冊后讓它分析: 按照以上操作后一次性解決問題! 相關(guān)資料案例:*附件:PLC之間通訊.zip
    發(fā)表于 02-10 11:38

    長城汽車Coffee AgentDeepSeek實現(xiàn)技術(shù)深度融合

    近日,長城汽車自主研發(fā)的Coffee Agent大模型與DeepSeek技術(shù)成功實現(xiàn)了深度融合,標志著長城汽車在智能駕駛和人工智能技術(shù)方面取
    的頭像 發(fā)表于 02-10 09:41 ?619次閱讀

    名單公布!【書籍評測活動NO.55】AI Agent應(yīng)用與項目實戰(zhàn)

    出來,當前的AI Agent并不僅僅是簡單的對話機器人或根據(jù)固定流程的自動化程序,而是成為了一種能夠自主完成任務(wù)的智能體,它正在迅速改變?nèi)祟惖墓ぷ骱蜕罘绞健F浜诵奶匦园ㄗ灾餍?、學(xué)習(xí)
    發(fā)表于 01-13 11:04

    微軟Dynamics365集成10大自主AI Agent,引領(lǐng)智能自動化新時代

    近日,微軟宣布在Dynamics365中集成了10個全新的自主AI Agent,這一創(chuàng)新舉措將為企業(yè)帶來前所未有的智能自動化工作模式。這些AI
    的頭像 發(fā)表于 10-23 11:25 ?582次閱讀

    樹莓的功能用途是什么

    、科研、工業(yè)控制、物聯(lián)網(wǎng)、多媒體播放、家庭自動化等領(lǐng)域。 樹莓(Raspberry Pi)是一種小型、低成本的單板計算機,由英國的Raspberry Pi基金會開發(fā),其功能和用途非常廣泛。以下是
    的頭像 發(fā)表于 08-30 18:01 ?3611次閱讀

    Hailo聯(lián)手樹莓,開創(chuàng)人工智能新紀元

    近日,人工智能處理器領(lǐng)導(dǎo)品牌Hailo正式宣布與樹莓展開深度合作。Hailo將為樹莓推出專用AI
    的頭像 發(fā)表于 06-06 16:08 ?876次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會員交流學(xué)習(xí)
    • 獲取您個性化的科技前沿技術(shù)信息
    • 參加活動獲取豐厚的禮品