微軟近日推出了一項(xiàng)新的模仿類似藝術(shù)家的人工智能技術(shù)—一個(gè)“繪圖機(jī)器人”。機(jī)器人能夠根據(jù)文字描述創(chuàng)建一個(gè)與之相對(duì)應(yīng)的圖像,而且它也增加了細(xì)節(jié),這些細(xì)節(jié)甚至超越了本身而不僅僅在所對(duì)應(yīng)的文字里出現(xiàn)的內(nèi)容?!斑@些現(xiàn)象可以說(shuō)明,人工智能具有自己的想象力”,一名在微軟公司的工作人員說(shuō)道。
“如果你在必應(yīng)引擎去搜索關(guān)于一只鳥(niǎo)的信息,你會(huì)得到一個(gè)與鳥(niǎo)類相關(guān)的圖片。但是在這里,圖片是由計(jì)算機(jī)逐個(gè)像素地從頭開(kāi)始創(chuàng)建的,“微軟公司在華盛頓州雷蒙德市微軟研究實(shí)驗(yàn)室深度學(xué)習(xí)技術(shù)中心的首席研究員兼研究經(jīng)理何曉東在微軟最近的一篇公告中表示。 “這些鳥(niǎo)可能在現(xiàn)實(shí)世界中都不存在,而它們只是代表了我們研發(fā)的人工智能對(duì)鳥(niǎo)類想象力的一個(gè)方面的描述?!?/p>
研究人員說(shuō),機(jī)器人能夠生成各種圖像,包括從“普通的田園場(chǎng)景”,如放牧家畜,甚至包括對(duì)“浮動(dòng)雙層巴士”的想象圖。
微軟方面表示,該機(jī)器人已經(jīng)在配對(duì)圖像和標(biāo)題的數(shù)據(jù)集上進(jìn)行了培訓(xùn),該培訓(xùn)能夠使其理解如何將相應(yīng)的單詞與圖像進(jìn)行匹配。例如,當(dāng)標(biāo)題上寫(xiě)著“鳥(niǎo)”時(shí),它先學(xué)會(huì)畫(huà)一只鳥(niǎo),然后通過(guò)機(jī)器學(xué)習(xí)來(lái)理解鳥(niǎo)的圖像應(yīng)該是什么樣的。
何曉東說(shuō):“這是我們相信機(jī)器可以學(xué)習(xí)的根本原因之一?!?/p>
繪圖機(jī)器人的技術(shù)由兩個(gè)機(jī)器學(xué)習(xí)模型組成,一個(gè)是從文本描述生成圖像,另一個(gè)是使用文本描述來(lái)判斷生成圖像的真實(shí)性。前者試圖從后者獲得虛擬的照片,但后者不想被愚弄。所以通過(guò)互相之間內(nèi)部的“競(jìng)爭(zhēng)”,兩者結(jié)合起來(lái)便能夠共同創(chuàng)造更高質(zhì)量的圖像。
根據(jù)最近的一篇研究報(bào)告,微軟方面還指出,與現(xiàn)有技術(shù)相比,這種新型機(jī)器人生成的圖像質(zhì)量相較以前提升了近三倍。
當(dāng)然,這不是第一個(gè)研發(fā)出來(lái)的與藝術(shù)相結(jié)合的人工智能技術(shù)。
這兩者結(jié)合有時(shí)會(huì)產(chǎn)生出色的結(jié)果,比如Google的人工智能機(jī)器生成的圖像展現(xiàn)了其具有藝術(shù)表現(xiàn)力的潛能。谷歌還有一個(gè)神經(jīng)網(wǎng)絡(luò),可以猜測(cè)你正在繪制什么,他們還擁有一個(gè)自動(dòng)繪圖機(jī)器人,并定期地詳細(xì)介紹它如何在幫助機(jī)器進(jìn)行繪制的研究。
Facebook也一直在開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò)來(lái)制作飛機(jī),汽車和動(dòng)物等小圖片,甚至用它從照片中創(chuàng)建自己的Bitmoji形象。
對(duì)于微軟來(lái)說(shuō),教一個(gè)機(jī)器人根據(jù)文本來(lái)畫(huà)出相對(duì)應(yīng)的圖像這項(xiàng)技術(shù)代表著它已經(jīng)達(dá)到了在這個(gè)計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域所需要的技術(shù)。
這包括CaptionBot的自動(dòng)寫(xiě)入照片字幕的開(kāi)發(fā),以及可以回答人們?cè)儐?wèn)圖像的問(wèn)題的技術(shù),如圖中對(duì)象的位置或?qū)傩裕@是對(duì)盲人有幫助的事物。
至于人工智能藝術(shù)家在現(xiàn)實(shí)世界中如何為人類服務(wù),微軟公司有一些想法。
這表明該機(jī)器人可以作為畫(huà)家或室內(nèi)設(shè)計(jì)師的素描助手,或者可以作為聲控美化照片的工具來(lái)被使用。 (“Cortana,請(qǐng)你為我畫(huà)一只鳥(niǎo)”,也許它能做到?)
但該技術(shù)還沒(méi)有達(dá)到我們能夠用它完成所提出的要求的程度。
如果仔細(xì)觀察這些圖像,它們幾乎都會(huì)有缺陷,我們可以很明顯地看出來(lái)它們是由機(jī)器創(chuàng)造的,而不是人類:例如上圖中的藍(lán)喙鳥(niǎo),水果和奇形怪狀的香蕉圖(見(jiàn)上文)。
然而,隨著它的進(jìn)3倍速度能力的提高,繪圖機(jī)器人代表了人工智能發(fā)展的里程碑,微軟公司相關(guān)人員說(shuō)道。(TechCrunch)
-
微軟
+關(guān)注
關(guān)注
4文章
6607瀏覽量
104156 -
機(jī)器人
+關(guān)注
關(guān)注
211文章
28483瀏覽量
207437
原文標(biāo)題:微軟研發(fā)繪圖機(jī)器人 根據(jù)文字描述畫(huà)出相應(yīng)圖像
文章出處:【微信號(hào):jingzhenglizixun,微信公眾號(hào):機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論