0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

精準(zhǔn)圖片搜索 OpenAI最新技術(shù) CLIP

工程師鄧生 ? 來源:凹非寺 ? 作者:金磊 ? 2021-02-11 09:13 ? 次閱讀

別再怕圖片搜索結(jié)果牛頭不對(duì)馬嘴了,你可以試試這個(gè) 精準(zhǔn)圖片搜索,來自 OpenAI最新的技術(shù) CLIP。

只需一句 “大白話”描述,便能給出想要的圖片。

例如輸入:

The word love written on the wall

就會(huì)得到這樣的結(jié)果:

可以說是相當(dāng)?shù)?精準(zhǔn)了!這就是今天在Reddit上爆火的一個(gè)項(xiàng)目。

這個(gè)項(xiàng)目利用到的,便是 OpenAI前不久頻頻刷屏的DALL·E 中的核心模塊—— CLIP,一個(gè)負(fù)責(zé)重排序 (rerank)的模型。

這個(gè)項(xiàng)目使用谷歌Colab Notebook,而且在線、免費(fèi),包含200萬(wàn)圖片數(shù)據(jù)集,最重要的是效果還非常的精準(zhǔn)。

不禁引得網(wǎng)友直呼“ Amazing”。

簡(jiǎn)單幾步,“大白話”在線精準(zhǔn)搜圖

這個(gè)項(xiàng)目之所以如此火爆, 操作簡(jiǎn)單是很重要的一個(gè)原因之一。

首先要做的,就是點(diǎn)開該項(xiàng)目在Colab Notebook中的地址 (見文末鏈接),登陸自己的賬號(hào)。

至于環(huán)境配置、包或庫(kù)的調(diào)用,這個(gè)項(xiàng)目非常貼心的已經(jīng)做好了,只需要依次點(diǎn)擊cell左側(cè)的小三角,等待運(yùn)行完成即可。

最后,來到包含如下代碼的cell:

search_query = “Two dogs playing inthe snow”

點(diǎn)擊運(yùn)行這個(gè)cell,便可得到搜索圖片的結(jié)果,例如:

當(dāng)然,這個(gè)程序似乎很懂人,若是輸入“當(dāng)你的代碼跑通時(shí)的情緒”:

The feeling when your program finallyworks

得到的結(jié)果,和正常人想象中的應(yīng)該是一致的:

為什么CLIP搜圖能如此精準(zhǔn)?

OpenAI前不久推出的DALL·E,主要能實(shí)現(xiàn)的功能就是 可以按照文字描述、生成對(duì)應(yīng)圖片。

而其呈現(xiàn)給我們的最終作品,其實(shí)是它生成大量圖片中的一部分。

在中間過程中,其實(shí)也有排名、打分的帥選過程。

這部分的任務(wù),便是由 CLIP來完成:

越是它看得懂、匹配度最高的作品,分?jǐn)?shù)就會(huì)越高,排名也會(huì)越靠前。

這種結(jié)構(gòu),有點(diǎn)像是利用生成對(duì)抗文本,以合成圖像的 GAN。

不過,相比于利用GAN擴(kuò)大圖像分辨率、匹配圖像-文本特征等方法,CLIP則選擇了直接對(duì)輸出進(jìn)行排名。

據(jù)研究人員表示,CLIP網(wǎng)絡(luò)的 最大意義在于,它緩解了深度學(xué)習(xí)在視覺任務(wù)中,最大的兩個(gè)問題。

首先,它 降低了深度學(xué)習(xí)需要的數(shù)據(jù)標(biāo)注量。

相比于手動(dòng)在ImageNet上,用文字描述1400萬(wàn)張圖像,CLIP直接從網(wǎng)上已有的“文字描述圖像”數(shù)據(jù)中進(jìn)行學(xué)習(xí)。

此外,CLIP還能“身兼多職”,在各種數(shù)據(jù)集上的表現(xiàn)都很好 (包括沒見過的數(shù)據(jù)集)。

但此前的大部分視覺神經(jīng)網(wǎng)絡(luò),只能在訓(xùn)練的數(shù)據(jù)集上有不錯(cuò)的表現(xiàn)。

例如,CLIP與ResNet101相比,在各項(xiàng)數(shù)據(jù)集上都有不錯(cuò)的檢測(cè)精度,然而ResNet101在除了ImageNet以外的檢測(cè)精度上,表現(xiàn)都不太好。

具體來說,CLIP用到了零樣本學(xué)習(xí) (zero-shot learning)、自然語(yǔ)言理解和多模態(tài)學(xué)習(xí)等技術(shù),來完成圖像的理解。

例如,描述一只斑馬,可以用“馬的輪廓+虎的皮毛+熊貓的黑白”。這樣,網(wǎng)絡(luò)就能從沒見過的數(shù)據(jù)中,找出“斑馬”的圖像。

最后,CLIP將文本和圖像理解結(jié)合起來,預(yù)測(cè)哪些圖像,與數(shù)據(jù)集中的哪些文本能完成最好的配對(duì)。

網(wǎng)友:機(jī)器人(bot)可能不太高興

在驚嘆CLIP用“大白話”搜索圖片效果之余,一位Reddit網(wǎng)友還發(fā)現(xiàn)了一個(gè)比較有意思的搜索結(jié)果。

他在文本描述的代碼部分輸入:

What image best represents how you feel right now?

這句話在我們?nèi)祟愌壑?,?yīng)當(dāng)是詢問AI的語(yǔ)氣了,然后出來的圖片結(jié)果是這樣的:

還有這樣的:

嗯,看來是被“玩多了”,AI寶寶有點(diǎn)小脾氣了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 搜索
    +關(guān)注

    關(guān)注

    0

    文章

    70

    瀏覽量

    16792
  • OpenAT
    +關(guān)注

    關(guān)注

    0

    文章

    5

    瀏覽量

    8734
  • 圖片
    +關(guān)注

    關(guān)注

    0

    文章

    203

    瀏覽量

    16176
  • Clip
    +關(guān)注

    關(guān)注

    0

    文章

    32

    瀏覽量

    6978
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1202

    瀏覽量

    8655
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    揭秘Cu Clip封裝:如何助力半導(dǎo)體芯片飛躍

    在半導(dǎo)體行業(yè)中,封裝技術(shù)對(duì)于功率芯片的性能發(fā)揮起著至關(guān)重要的作用。隨著電子技術(shù)的飛速發(fā)展,特別是在大功率場(chǎng)合下,傳統(tǒng)的封裝技術(shù)已經(jīng)難以滿足日益增長(zhǎng)的性能需求。因此,Cu Clip封裝
    的頭像 發(fā)表于 02-19 11:32 ?1587次閱讀
    揭秘Cu <b class='flag-5'>Clip</b>封裝:如何助力半導(dǎo)體芯片飛躍

    OpenAI免費(fèi)開放ChatGPT搜索功能

    近日,OpenAI宣布了一項(xiàng)重大決策:向所有用戶免費(fèi)開放ChatGPT搜索功能。這一舉措無(wú)疑將為用戶帶來更加高效、智能的搜索體驗(yàn)。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT
    的頭像 發(fā)表于 02-06 14:35 ?443次閱讀

    OpenAI提交新商標(biāo)的申請(qǐng)

    的前沿。2024 年,OpenAI 發(fā)布首個(gè)視頻生成模型 Sora,展示了其在多模態(tài)領(lǐng)域的技術(shù)實(shí)力。此次申請(qǐng)新商標(biāo)
    的頭像 發(fā)表于 02-05 16:38 ?626次閱讀

    ChatGPT新增實(shí)時(shí)搜索與高級(jí)語(yǔ)音功能

    OpenAI的第八天技術(shù)分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實(shí)用性和競(jìng)爭(zhēng)力。 新增的實(shí)時(shí)搜索功能,是此次更新的亮
    的頭像 發(fā)表于 12-17 14:08 ?591次閱讀

    新品 | 可拼接燈板矩陣 Puzzle Unit &amp;amp; 創(chuàng)意固定套件CLIP-A/CLIP-B

    本月的第三波新品上線了3款全新產(chǎn)品,涵蓋了多種需求和應(yīng)用領(lǐng)域。從激發(fā)興趣和創(chuàng)意的PuzzleUnit,到多功能創(chuàng)意套件CLIP-A&CLIP-B,每一款都為不同場(chǎng)景提供了創(chuàng)新解決方案??靵?/div>
    的頭像 發(fā)表于 11-16 01:07 ?341次閱讀
    新品 | 可拼接燈板矩陣 Puzzle Unit &amp;amp; 創(chuàng)意固定套件<b class='flag-5'>CLIP</b>-A/<b class='flag-5'>CLIP</b>-B

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評(píng)的ChatGPT平臺(tái)添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗(yàn)。以
    的頭像 發(fā)表于 11-04 10:34 ?630次閱讀

    OpenAI在ChatGPT增添搜索功能

    近日,OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能,此舉標(biāo)志著該公司對(duì)Alphabet旗下谷歌的直接挑戰(zhàn)進(jìn)一步升級(jí)。OpenAI周四正式揭曉了這一名為“ChatGPT搜索
    的頭像 發(fā)表于 11-01 17:01 ?697次閱讀

    谷歌取消“站點(diǎn)鏈接搜索框”,適應(yīng)新搜索需求

    近日,谷歌發(fā)布了一則通知,決定取消搜索結(jié)果中的“站點(diǎn)鏈接搜索框”。這一功能已經(jīng)陪伴了用戶十多年,它允許用戶在特定網(wǎng)站上進(jìn)行更深入的搜索,為許多網(wǎng)民提供了便利。然而,隨著時(shí)代的變遷和技術(shù)
    的頭像 發(fā)表于 10-23 11:20 ?619次閱讀

    TAS5630電路PBTL接法,CLIP燈無(wú)法滅是怎么回事?

    TAS5630電路PBTL接法,正在測(cè)試時(shí)CLIP信號(hào)燈亮(CLIP低電平),輸出為0,無(wú)論重新開機(jī)或人工復(fù)位,均不能使得CLIP燈滅,請(qǐng)大俠教我。謝謝。
    發(fā)表于 09-03 07:58

    OpenAI解鎖GPT-4o定制功能,助力企業(yè)精準(zhǔn)優(yōu)化AI應(yīng)用

    在8月21日的最新動(dòng)態(tài)中,OpenAI 宣布了一項(xiàng)革命性的新功能,正式向企業(yè)用戶開放其頂尖AI模型GPT-4o的定制能力。這一舉措標(biāo)志著OpenAI在激烈的企業(yè)級(jí)AI應(yīng)用市場(chǎng)中邁出了重要一步,旨在幫助企業(yè)客戶實(shí)現(xiàn)更精準(zhǔn)、高效的A
    的頭像 發(fā)表于 08-21 16:06 ?697次閱讀

    OpenAI將推出在線搜索工具“SearchGPT”

    科技巨頭OpenAI正悄然醞釀一場(chǎng)搜索領(lǐng)域的變革,其最新推出的在線搜索工具“SearchGPT”正悄然挑戰(zhàn)著Alphabet旗下谷歌的搜索霸主地位。這款被寄予厚望的新工具,目前正處于緊
    的頭像 發(fā)表于 07-26 16:54 ?898次閱讀

    OpenAI對(duì)SearchGPT的人工智能功能搜索原型產(chǎn)品進(jìn)行測(cè)試

    七月廿六日訊息,據(jù)海外媒體透漏,本年度, OpenAI先后成功研發(fā)出了AI模型GPT-4o以及GPT-4o mini,并且成功與業(yè)界翹楚蘋果公司達(dá)成深度合作關(guān)系,將先進(jìn)的生成式人工智能技術(shù)引入到
    的頭像 發(fā)表于 07-26 16:43 ?876次閱讀

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發(fā)起挑戰(zhàn)

    在人工智能領(lǐng)域的持續(xù)探索中,OpenAI 邁出了重大一步,發(fā)布了其最新的 SearchGPT 原型,直接瞄準(zhǔn)了 Google 的核心業(yè)務(wù)——搜索引擎。這一舉動(dòng)不僅標(biāo)志著 OpenAI技術(shù)
    的頭像 發(fā)表于 07-26 15:11 ?758次閱讀

    OpenAI收購(gòu)Rockset,加強(qiáng)數(shù)據(jù)處理能力

    近日,人工智能領(lǐng)域的領(lǐng)軍者OpenAI宣布收購(gòu)了一家專注于企業(yè)搜索和分析的初創(chuàng)公司Rockset。此次收購(gòu)不僅為OpenAI帶來了強(qiáng)大的技術(shù)支撐,也為其在AI領(lǐng)域的競(jìng)爭(zhēng)增添了新的籌碼。
    的頭像 發(fā)表于 06-24 18:00 ?1051次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品