0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

OpenAI推出兩套多模態(tài)人工智能系統(tǒng)模型

姚小熊27 ? 來源:人工智能實(shí)驗(yàn)室 ? 作者:人工智能實(shí)驗(yàn)室 ? 2021-01-07 11:13 ? 次閱讀

據(jù)外媒,知名機(jī)器學(xué)習(xí)公司OpenAI近日推出兩套多模態(tài)人工智能系統(tǒng)模型DALL-E和CLIP,DALL-E可以基于文本直接生成圖像,CLIP能夠完成圖像與文本類別的匹配。DALL-E可以將以自然語言形式表達(dá)的大量概念轉(zhuǎn)換為恰當(dāng)?shù)膱D像,并使用了GPT-3 同樣的方法,只不過DALL-E將其應(yīng)用于文本-圖像對(duì)。

另一個(gè)神經(jīng)網(wǎng)絡(luò)CLIP能夠執(zhí)行一系列視覺識(shí)別任務(wù)。給出一組以語言形式表述的類別,CLIP能夠立即將一張圖像與其中某個(gè)類別進(jìn)行匹配,而且它不像標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)那樣需要針對(duì)這些類別的特定數(shù)據(jù)進(jìn)行微調(diào)。在ImageNet基準(zhǔn)上,CLIP的性能超過ResNet-50,在識(shí)別不常見圖像任務(wù)中的性能遠(yuǎn)超ResNet。

雖然CLIP在識(shí)別常見對(duì)象時(shí)往往表現(xiàn)良好,但在計(jì)算圖像中對(duì)象數(shù)量等更抽象或更系統(tǒng)的任務(wù),以及預(yù)測(cè)照片中最靠近車輛間的距離等更復(fù)雜任務(wù)上的表現(xiàn)不佳。在這兩項(xiàng)任務(wù)上,zero-shot CLIP的效果也只比隨機(jī)猜測(cè)好一點(diǎn)。
責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1792

    文章

    47441

    瀏覽量

    238989
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1100

    瀏覽量

    6580
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    亥步模態(tài)醫(yī)療大模型發(fā)布:人工智能引領(lǐng)醫(yī)療新紀(jì)元

    當(dāng)下,人工智能(AI)正以不可阻擋之勢(shì)滲透到各行各業(yè),包括醫(yī)療行業(yè)。12月14日,2024中國醫(yī)學(xué)人工智能大會(huì)的召開。會(huì)上,一款名為“亥步”的模態(tài)醫(yī)療大
    的頭像 發(fā)表于 12-19 17:56 ?181次閱讀

    AI看點(diǎn):OpenAI 世界最貴大模型 阿里將推出人工智能電商工具

    給大家?guī)硪恍┳钚碌?b class='flag-5'>人工智能信息,希望對(duì)大家有用。 OpenAI發(fā)布滿血版ChatGPT Pro OpenAI隆重推出了備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的
    的頭像 發(fā)表于 12-06 11:23 ?806次閱讀

    云知聲山海模態(tài)模型UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    近日,模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,云知聲山海模態(tài)
    的頭像 發(fā)表于 10-12 14:09 ?305次閱讀
    云知聲山海<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大<b class='flag-5'>模型</b>UniGPT-mMed登頂MMMU測(cè)評(píng)榜首

    Meta發(fā)布模態(tài)LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破,成功推出模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新
    的頭像 發(fā)表于 09-27 11:44 ?417次閱讀

    云知聲推出山海模態(tài)模型

    人工智能技術(shù)的浩瀚星海中,模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心
    的頭像 發(fā)表于 08-27 15:20 ?405次閱讀

    OpenAI發(fā)布高性價(jià)比小型AI模型GPT-4o mini

    人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以親民價(jià)格提供強(qiáng)大功能的小型聊天機(jī)器人。這款產(chǎn)品的問世,標(biāo)志著OpenAI在推動(dòng)
    的頭像 發(fā)表于 07-19 15:27 ?664次閱讀

    智譜AI發(fā)布全新模態(tài)開源模型GLM-4-9B

    近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的模態(tài)
    的頭像 發(fā)表于 06-07 09:17 ?774次閱讀

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示
    發(fā)表于 05-27 15:43

    OpenAI推出更快更便宜的大語言模型GPT-4o

    美國人工智能公司OpenAI于14日凌晨正式推出了一個(gè)更快、更便宜的人工智能模型來支持其聊天機(jī)器人ChatGPT。
    的頭像 發(fā)表于 05-15 15:12 ?628次閱讀

    OpenAI推出新款人工智能模型GPT-4o

    人工智能領(lǐng)域的領(lǐng)軍者OpenAI在最近的春季更新活動(dòng)中,重磅推出了全新升級(jí)的ChatGPT版本,它支持了GPT-4o這一強(qiáng)大的人工智能模型。
    的頭像 發(fā)表于 05-14 10:52 ?560次閱讀

    OpenAI有望在年中推出全新GPT-5模型

    近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI傳來了令人振奮的消息。據(jù)悉,他們有望在今年的年中,大約是夏季時(shí)分,推出全新的GPT-5模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注與期待。
    的頭像 發(fā)表于 03-22 11:29 ?798次閱讀

    蘋果發(fā)布300億參數(shù)MM1模態(tài)模型

    近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的模態(tài)模型研究成果——MM1。這款具有高達(dá)300億參數(shù)的模態(tài)
    的頭像 發(fā)表于 03-19 11:19 ?921次閱讀

    OpenAI迎戰(zhàn)紐約時(shí)報(bào)指控 非法使用其內(nèi)容訓(xùn)練人工智能模型

    OpenAI迎戰(zhàn)紐約時(shí)報(bào)指控 《紐約時(shí)報(bào)》提起版權(quán)訴訟指控OpenAI非法使用其內(nèi)容訓(xùn)練人工智能模型OpenAI積極迎戰(zhàn),
    的頭像 發(fā)表于 02-28 15:05 ?551次閱讀

    OpenAI發(fā)布人工智能文生視頻大模型Sora

    近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI宣布推出其最新的人工智能文生視頻大模型——Sora。這款模型
    的頭像 發(fā)表于 02-20 13:54 ?886次閱讀

    OpenAI推出新款大模型Sora,引領(lǐng)模態(tài)AI新潮流

    全球人工智能領(lǐng)域的佼佼者OpenAI近日發(fā)布了一款名為Sora的短視頻生成模型,該模型能夠根據(jù)文字指令即時(shí)生成高質(zhì)量短視頻,引起了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 02-18 10:16 ?1364次閱讀