據(jù)外媒,知名機(jī)器學(xué)習(xí)公司OpenAI近日推出兩套多模態(tài)人工智能系統(tǒng)模型DALL-E和CLIP,DALL-E可以基于文本直接生成圖像,CLIP能夠完成圖像與文本類別的匹配。DALL-E可以將以自然語言形式表達(dá)的大量概念轉(zhuǎn)換為恰當(dāng)?shù)膱D像,并使用了GPT-3 同樣的方法,只不過DALL-E將其應(yīng)用于文本-圖像對(duì)。
另一個(gè)神經(jīng)網(wǎng)絡(luò)CLIP能夠執(zhí)行一系列視覺識(shí)別任務(wù)。給出一組以語言形式表述的類別,CLIP能夠立即將一張圖像與其中某個(gè)類別進(jìn)行匹配,而且它不像標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)那樣需要針對(duì)這些類別的特定數(shù)據(jù)進(jìn)行微調(diào)。在ImageNet基準(zhǔn)上,CLIP的性能超過ResNet-50,在識(shí)別不常見圖像任務(wù)中的性能遠(yuǎn)超ResNet。
雖然CLIP在識(shí)別常見對(duì)象時(shí)往往表現(xiàn)良好,但在計(jì)算圖像中對(duì)象數(shù)量等更抽象或更系統(tǒng)的任務(wù),以及預(yù)測(cè)照片中最靠近車輛間的距離等更復(fù)雜任務(wù)上的表現(xiàn)不佳。在這兩項(xiàng)任務(wù)上,zero-shot CLIP的效果也只比隨機(jī)猜測(cè)好一點(diǎn)。
責(zé)任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
當(dāng)下,人工智能(AI)正以不可阻擋之勢(shì)滲透到各行各業(yè),包括醫(yī)療行業(yè)。12月14日,2024中國醫(yī)學(xué)人工智能大會(huì)的召開。會(huì)上,一款名為“亥步”的多模態(tài)醫(yī)療大
發(fā)表于 12-19 17:56
?181次閱讀
給大家?guī)硪恍┳钚碌?b class='flag-5'>人工智能信息,希望對(duì)大家有用。 OpenAI發(fā)布滿血版ChatGPT Pro OpenAI隆重推出了備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的
發(fā)表于 12-06 11:23
?806次閱讀
近日,多模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,云知聲山海多模態(tài)大
發(fā)表于 10-12 14:09
?305次閱讀
Meta Platforms近日宣布了一項(xiàng)重要技術(shù)突破,成功推出了多模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新
發(fā)表于 09-27 11:44
?417次閱讀
在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心
發(fā)表于 08-27 15:20
?405次閱讀
在人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以親民價(jià)格提供強(qiáng)大功能的小型聊天機(jī)器人。這款產(chǎn)品的問世,標(biāo)志著OpenAI在推動(dòng)
發(fā)表于 07-19 15:27
?664次閱讀
近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態(tài)
發(fā)表于 06-07 09:17
?774次閱讀
當(dāng)?shù)貢r(shí)間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強(qiáng)大基礎(chǔ)上,這種迭代擁有顯著的改進(jìn)。在發(fā)布會(huì)的演示中,OpenAI展示
發(fā)表于 05-27 15:43
美國人工智能公司OpenAI于14日凌晨正式推出了一個(gè)更快、更便宜的人工智能模型來支持其聊天機(jī)器人ChatGPT。
發(fā)表于 05-15 15:12
?628次閱讀
人工智能領(lǐng)域的領(lǐng)軍者OpenAI在最近的春季更新活動(dòng)中,重磅推出了全新升級(jí)的ChatGPT版本,它支持了GPT-4o這一強(qiáng)大的人工智能模型。
發(fā)表于 05-14 10:52
?560次閱讀
近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI傳來了令人振奮的消息。據(jù)悉,他們有望在今年的年中,大約是夏季時(shí)分,推出全新的GPT-5模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注與期待。
發(fā)表于 03-22 11:29
?798次閱讀
近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態(tài)大模型研究成果——MM1。這款具有高達(dá)300億參數(shù)的多模態(tài)
發(fā)表于 03-19 11:19
?921次閱讀
OpenAI迎戰(zhàn)紐約時(shí)報(bào)指控 《紐約時(shí)報(bào)》提起版權(quán)訴訟指控OpenAI非法使用其內(nèi)容訓(xùn)練人工智能模型,OpenAI積極迎戰(zhàn),
發(fā)表于 02-28 15:05
?551次閱讀
近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI宣布推出其最新的人工智能文生視頻大模型——Sora。這款模型
發(fā)表于 02-20 13:54
?886次閱讀
全球人工智能領(lǐng)域的佼佼者OpenAI近日發(fā)布了一款名為Sora的短視頻生成模型,該模型能夠根據(jù)文字指令即時(shí)生成高質(zhì)量短視頻,引起了業(yè)界的廣泛關(guān)注。
發(fā)表于 02-18 10:16
?1364次閱讀
評(píng)論