0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全球首位AI程序員Devin誕生,超越GPT-4等業(yè)界巨頭

微云疏影 ? 來(lái)源:綜合整理 ? 作者:綜合整理 ? 2024-03-15 10:13 ? 次閱讀

2023年3月13日,全球首個(gè)人工智能程序員Devin正式亮相,自如適應(yīng)新科技,自行修復(fù)瑕疵,甚至可自我調(diào)整及訓(xùn)練AI模型。其表現(xiàn)已超越GPT-4等明星產(chǎn)品。

Devin來(lái)自 Cognition AI 公司,該公司位于紐約與舊金山,定位為集推理為本的應(yīng)用型AI研究機(jī)構(gòu)。Cognition AI之前一度低調(diào)。直至兩個(gè)月前政府正式獲批成立。

當(dāng)前小組人數(shù)僅10人,卻榮膺10塊國(guó)際奧林匹克電腦競(jìng)賽(IOI)金牌。所有成員皆擁有豐富AI實(shí)踐經(jīng)驗(yàn),背景包括Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等領(lǐng)先企業(yè)。其中亦不乏華裔員工。

據(jù)悉,Devin的重大創(chuàng)新在于顯著增強(qiáng)計(jì)算機(jī)邏輯和規(guī)劃能力,同時(shí)具備全棧技能、自主學(xué)習(xí)新知識(shí)、構(gòu)建部署應(yīng)用程序、自動(dòng)修復(fù)漏洞以及自我調(diào)整和訓(xùn)練AI模型等多種能力。

在 SWE-bench 的基準(zhǔn)測(cè)試中,Devin能夠準(zhǔn)確無(wú)誤地解決問(wèn)題的比例高達(dá)13.86%;然而,GPT-4的這一數(shù)字僅為1.74%,并且還需依賴人類指示篩選和處理相關(guān)文件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31493

    瀏覽量

    270049
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47643

    瀏覽量

    239863
  • 應(yīng)用程序
    +關(guān)注

    關(guān)注

    38

    文章

    3292

    瀏覽量

    57866
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    阿里云升級(jí)通義靈碼AI程序員,全面上線

    和JetBrains IDEs兩大主流開(kāi)發(fā)環(huán)境,這意味著開(kāi)發(fā)者可以在自己熟悉的開(kāi)發(fā)平臺(tái)上,無(wú)縫接入并使用這款AI工具。 除了支持主流開(kāi)發(fā)環(huán)境外,通義靈碼AI程序員還引入了多項(xiàng)新特性,如多文件代碼修改和上下文感知
    的頭像 發(fā)表于 01-09 11:16 ?283次閱讀

    機(jī)械革命發(fā)布CODE AI程序員

    近日,英特爾新質(zhì)生產(chǎn)力技術(shù)生態(tài)大會(huì)在成都舉行,機(jī)械革命作為重要參展商帶來(lái)了多款明星產(chǎn)品引爆全場(chǎng)!其中更是在AI PC軟件生態(tài)產(chǎn)品發(fā)布分論壇上,Intel、智譜、機(jī)械革命三方聯(lián)合發(fā)布了專為程序員設(shè)計(jì)的CODE AI
    的頭像 發(fā)表于 11-30 10:34 ?505次閱讀

    AI編程工具會(huì)不會(huì)搶程序員飯碗

    AI編程工具可輔助編程,減少手動(dòng)編碼,提升效率,對(duì)程序員有積極影響也有挑戰(zhàn)。程序員需深化技能、拓寬知識(shí)應(yīng)對(duì)。長(zhǎng)遠(yuǎn)看,AI與人類程序員將共生共
    的頭像 發(fā)表于 11-08 10:17 ?213次閱讀

    Llama 3 與 GPT-4 比較

    隨著人工智能技術(shù)的飛速發(fā)展,我們見(jiàn)證了一代又一代的AI模型不斷突破界限,為各行各業(yè)帶來(lái)革命性的變化。在這場(chǎng)技術(shù)競(jìng)賽中,Llama 3和GPT-4作為兩個(gè)備受矚目的模型,它們代表了當(dāng)前AI領(lǐng)域的最前
    的頭像 發(fā)表于 10-27 14:17 ?456次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo:七大能力超GPT-4 Turbo

    超過(guò)GPT-4 Turbo,數(shù)學(xué)能力和代碼能力更是超過(guò)了Open AI最新一代GPT模型GPT-4o。此外,其效率相對(duì)提升50%。
    的頭像 發(fā)表于 10-24 11:39 ?540次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯(cuò)

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯(cuò)誤而設(shè)計(jì),其獨(dú)特的作用在于,讓人們能夠用GPT-4來(lái)查找GPT-4的錯(cuò)誤。
    的頭像 發(fā)表于 06-29 09:55 ?585次閱讀

    OpenAI API Key獲?。洪_(kāi)發(fā)人員申請(qǐng)GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語(yǔ)言理解和生成能力,成為了許多開(kāi)發(fā)者的首選工具。獲取GPT-4 API Key并將其應(yīng)用于項(xiàng)目,如開(kāi)發(fā)一個(gè)ChatGPT聊天應(yīng)用,不僅是實(shí)踐人工智能技術(shù)
    的頭像 發(fā)表于 06-24 17:40 ?2519次閱讀
    OpenAI API Key獲取:開(kāi)發(fā)人員申請(qǐng)<b class='flag-5'>GPT-4</b> API Key教程

    開(kāi)發(fā)者如何調(diào)用OpenAI的GPT-4o API以及價(jià)格詳情指南

    ?目前,OpenAI新模型GPT-4o和GPT-4 Turbo的價(jià)格如下: GPT-4o 對(duì)比 GPT-4 Turbo GPT-4o 擁有與
    的頭像 發(fā)表于 05-29 16:00 ?1.2w次閱讀
    開(kāi)發(fā)者如何調(diào)用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價(jià)格詳情指南

    阿里云正式發(fā)布通義千問(wèn)2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發(fā)布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發(fā)布通義千問(wèn)2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
    的頭像 發(fā)表于 05-13 11:16 ?1040次閱讀

    阿里云發(fā)布通義千問(wèn)2.5大模型,多項(xiàng)能力超越GPT-4

    阿里云隆重推出了通義千問(wèn) 2.5 版,宣稱其“技術(shù)進(jìn)步,全面超越GPT-4”,尤其是在中文環(huán)境中的多種任務(wù)(如文本理解、文本生成、知識(shí)問(wèn)答及生活建議、臨時(shí)聊天及對(duì)話以及安全風(fēng)險(xiǎn)評(píng)估)方面表現(xiàn)出色,超越
    的頭像 發(fā)表于 05-09 14:17 ?1008次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級(jí)至GPT-4取得顯著進(jìn)步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無(wú)疑將使得
    的頭像 發(fā)表于 03-13 13:42 ?772次閱讀

    新火種AI|秒殺GPT-4,狙殺GPT-5,橫空出世的Claude 3振奮人心!

    GPT-4被拉下神壇, Claude 3很可能對(duì)GPT-4實(shí)現(xiàn)全方位的碾壓 。 Anthropic發(fā)布3個(gè)模型,全方位實(shí)現(xiàn)
    的頭像 發(fā)表于 03-06 22:22 ?704次閱讀
    新火種<b class='flag-5'>AI</b>|秒殺<b class='flag-5'>GPT-4</b>,狙殺<b class='flag-5'>GPT</b>-5,橫空出世的Claude 3振奮人心!

    全球最強(qiáng)大模型易主,GPT-4超越

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic宣布推出全新的Claude 3系列模型,其中包括最強(qiáng)版Claude 3 Opus。據(jù)該公司稱,Claude 3系列在推理、數(shù)學(xué)、編碼、多語(yǔ)言理解和視覺(jué)方面全面超越了包括GPT-4在內(nèi)的所
    的頭像 發(fā)表于 03-05 09:58 ?695次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹(shù)立AI新標(biāo)桿

    近日,AI領(lǐng)域的領(lǐng)軍企業(yè)Anthropic震撼發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能,成功擊敗了此前被廣泛認(rèn)為是全球最強(qiáng)AI模型的
    的頭像 發(fā)表于 03-05 09:49 ?729次閱讀

    全球最強(qiáng)大模型易主:GPT-4超越,Claude 3系列嶄露頭角

    近日,人工智能領(lǐng)域迎來(lái)了一場(chǎng)革命性的突破。Anthropic公司發(fā)布了全新的Claude 3系列模型,該系列模型在多模態(tài)和語(yǔ)言能力關(guān)鍵指標(biāo)上展現(xiàn)出卓越性能,成功超越了此前被廣泛認(rèn)為是全球最強(qiáng)
    的頭像 發(fā)表于 03-05 09:42 ?696次閱讀