0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟研發(fā)出根據(jù)文字描述可畫(huà)出相應(yīng)圖像的機(jī)器人 并增加了一些想象細(xì)節(jié)

OaXG_jingzhengl ? 2018-01-23 11:46 ? 次閱讀

微軟近日推出了一項(xiàng)新的模仿類似藝術(shù)家的人工智能技術(shù)—一個(gè)“繪圖機(jī)器人”。機(jī)器人能夠根據(jù)文字描述創(chuàng)建一個(gè)與之相對(duì)應(yīng)的圖像,而且它也增加了細(xì)節(jié),這些細(xì)節(jié)甚至超越了本身而不僅僅在所對(duì)應(yīng)的文字里出現(xiàn)的內(nèi)容?!斑@些現(xiàn)象可以說(shuō)明,人工智能具有自己的想象力”,一名在微軟公司的工作人員說(shuō)道。

“如果你在必應(yīng)引擎去搜索關(guān)于一只鳥(niǎo)的信息,你會(huì)得到一個(gè)與鳥(niǎo)類相關(guān)的圖片。但是在這里,圖片是由計(jì)算機(jī)逐個(gè)像素地從頭開(kāi)始創(chuàng)建的,“微軟公司在華盛頓州雷蒙德市微軟研究實(shí)驗(yàn)室深度學(xué)習(xí)技術(shù)中心的首席研究員兼研究經(jīng)理何曉東在微軟最近的一篇公告中表示。 “這些鳥(niǎo)可能在現(xiàn)實(shí)世界中都不存在,而它們只是代表了我們研發(fā)的人工智能對(duì)鳥(niǎo)類想象力的一個(gè)方面的描述?!?/p>

研究人員說(shuō),機(jī)器人能夠生成各種圖像,包括從“普通的田園場(chǎng)景”,如放牧家畜,甚至包括對(duì)“浮動(dòng)雙層巴士”的想象圖。

微軟方面表示,該機(jī)器人已經(jīng)在配對(duì)圖像和標(biāo)題的數(shù)據(jù)集上進(jìn)行了培訓(xùn),該培訓(xùn)能夠使其理解如何將相應(yīng)的單詞與圖像進(jìn)行匹配。例如,當(dāng)標(biāo)題上寫(xiě)著“鳥(niǎo)”時(shí),它先學(xué)會(huì)畫(huà)一只鳥(niǎo),然后通過(guò)機(jī)器學(xué)習(xí)來(lái)理解鳥(niǎo)的圖像應(yīng)該是什么樣的。

何曉東說(shuō):“這是我們相信機(jī)器可以學(xué)習(xí)的根本原因之一?!?/p>

繪圖機(jī)器人的技術(shù)由兩個(gè)機(jī)器學(xué)習(xí)模型組成,一個(gè)是從文本描述生成圖像,另一個(gè)是使用文本描述來(lái)判斷生成圖像的真實(shí)性。前者試圖從后者獲得虛擬的照片,但后者不想被愚弄。所以通過(guò)互相之間內(nèi)部的“競(jìng)爭(zhēng)”,兩者結(jié)合起來(lái)便能夠共同創(chuàng)造更高質(zhì)量的圖像。

根據(jù)最近的一篇研究報(bào)告,微軟方面還指出,與現(xiàn)有技術(shù)相比,這種新型機(jī)器人生成的圖像質(zhì)量相較以前提升了近三倍。

當(dāng)然,這不是第一個(gè)研發(fā)出來(lái)的與藝術(shù)相結(jié)合的人工智能技術(shù)。

這兩者結(jié)合有時(shí)會(huì)產(chǎn)生出色的結(jié)果,比如Google的人工智能機(jī)器生成的圖像展現(xiàn)了其具有藝術(shù)表現(xiàn)力的潛能。谷歌還有一個(gè)神經(jīng)網(wǎng)絡(luò),可以猜測(cè)你正在繪制什么,他們還擁有一個(gè)自動(dòng)繪圖機(jī)器人,并定期地詳細(xì)介紹它如何在幫助機(jī)器進(jìn)行繪制的研究。

Facebook也一直在開(kāi)發(fā)神經(jīng)網(wǎng)絡(luò)來(lái)制作飛機(jī),汽車和動(dòng)物等小圖片,甚至用它從照片中創(chuàng)建自己的Bitmoji形象。

對(duì)于微軟來(lái)說(shuō),教一個(gè)機(jī)器人根據(jù)文本來(lái)畫(huà)出相對(duì)應(yīng)的圖像這項(xiàng)技術(shù)代表著它已經(jīng)達(dá)到了在這個(gè)計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理領(lǐng)域所需要的技術(shù)。

這包括CaptionBot的自動(dòng)寫(xiě)入照片字幕的開(kāi)發(fā),以及可以回答人們?cè)儐?wèn)圖像的問(wèn)題的技術(shù),如圖中對(duì)象的位置或?qū)傩裕@是對(duì)盲人有幫助的事物。

至于人工智能藝術(shù)家在現(xiàn)實(shí)世界中如何為人類服務(wù),微軟公司有一些想法。

這表明該機(jī)器人可以作為畫(huà)家或室內(nèi)設(shè)計(jì)師的素描助手,或者可以作為聲控美化照片的工具來(lái)被使用。 (“Cortana,請(qǐng)你為我畫(huà)一只鳥(niǎo)”,也許它能做到?)

但該技術(shù)還沒(méi)有達(dá)到我們能夠用它完成所提出的要求的程度。

如果仔細(xì)觀察這些圖像,它們幾乎都會(huì)有缺陷,我們可以很明顯地看出來(lái)它們是由機(jī)器創(chuàng)造的,而不是人類:例如上圖中的藍(lán)喙鳥(niǎo),水果和奇形怪狀的香蕉圖(見(jiàn)上文)。

然而,隨著它的進(jìn)3倍速度能力的提高,繪圖機(jī)器人代表了人工智能發(fā)展的里程碑,微軟公司相關(guān)人員說(shuō)道。(TechCrunch)

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6607

    瀏覽量

    104156
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    211

    文章

    28483

    瀏覽量

    207437

原文標(biāo)題:微軟研發(fā)繪圖機(jī)器人 根據(jù)文字描述畫(huà)出相應(yīng)圖像

文章出處:【微信號(hào):jingzhenglizixun,微信公眾號(hào):機(jī)器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    變色龍機(jī)器人DARPA研發(fā)出可變色硅膠機(jī)器人

    `變色龍機(jī)器人DARPA研發(fā)出可變色硅膠機(jī)器人`
    發(fā)表于 08-20 17:36

    會(huì)物體識(shí)別和語(yǔ)音識(shí)別的nao機(jī)器人

    是nao機(jī)器人的偉大之處。面部探測(cè)與識(shí)別這是最廣為人知的項(xiàng)互動(dòng)功能。nao機(jī)器人探測(cè)學(xué)習(xí)記憶不同的面部,此后,它可對(duì)其進(jìn)行識(shí)別。語(yǔ)音合
    發(fā)表于 02-13 14:09

    中國(guó)機(jī)器人行業(yè)的現(xiàn)狀——行業(yè)***

    高工機(jī)器人產(chǎn)業(yè)研究所統(tǒng)計(jì),截至2014年9月,中國(guó)機(jī)器人相關(guān)企業(yè)數(shù)量428家,其中1~3季度就增加了175家,占到總數(shù)的41%。機(jī)器人
    發(fā)表于 02-13 15:46

    【Embedded Pi申請(qǐng)】六足機(jī)器人的創(chuàng)新研發(fā)

    申請(qǐng)理由:關(guān)于六足機(jī)器人,基本上是用18個(gè)舵機(jī)起使用來(lái)驅(qū)動(dòng)六足完成相應(yīng)的動(dòng)作組,而般的89C52以及STC12系列的單片機(jī)只能讓六足機(jī)器人
    發(fā)表于 11-25 15:35

    智久AGV搬運(yùn)機(jī)器人呼喚更多中國(guó)籍的機(jī)器人

    ,食品、化妝品等行業(yè)也增加了機(jī)器人的利用?! ∧隳?b class='flag-5'>想象早上吃的粉也是工業(yè)機(jī)器人搬運(yùn)的嗎?而現(xiàn)在它正在成為現(xiàn)實(shí)?!霸谖夜镜目蛻糁?,不乏五金加工、面粉廠、電子廠、摩汽配廠這類勞動(dòng)密集型企
    發(fā)表于 12-17 14:53

    機(jī)器人與未來(lái)

    劉***:歡迎來(lái)到未來(lái)機(jī)器人的世界,在這里一些關(guān)于機(jī)器人及未來(lái)的傳統(tǒng)認(rèn)識(shí)將被顛覆。創(chuàng)造機(jī)器人曾是我們兒時(shí)的夢(mèng)想,從敲打簡(jiǎn)陋的鐵皮機(jī)器人,到憧
    發(fā)表于 12-29 14:56

    辰漢-如何實(shí)現(xiàn)服務(wù)機(jī)器人的運(yùn)算與控制

    手機(jī)端的AR技術(shù),在手機(jī)屏幕里可以給機(jī)器人加上各種效果,增加娛樂(lè)性。還有一些具有特殊用途的機(jī)器人,比如掃地機(jī)器人,
    發(fā)表于 06-09 17:18

    微軟HoloLens正研發(fā)AI芯片 識(shí)別語(yǔ)音和圖像

      導(dǎo)讀:關(guān)于下代 HoloLens,微軟終于透露了一些消息:正在研發(fā) AI 芯片,使其識(shí)別語(yǔ)音和圖像。 [img][/img] 雷鋒網(wǎng)
    發(fā)表于 07-31 21:17

    玩偶秒變機(jī)器人機(jī)器人皮了解下?

    紕漏則很可能會(huì)產(chǎn)生難以估量的后果。那么,有了機(jī)器人皮,現(xiàn)場(chǎng)的一些非工具性物品則有了成為工具的可能,為救援人員增加了救援方式的選擇。不僅僅是災(zāi)難救援,在考古、勘探考察等方面,它樣可以發(fā)
    發(fā)表于 09-26 09:01

    機(jī)器人、協(xié)作機(jī)器人和移動(dòng)機(jī)器人,你分的清楚嗎

    R15.06)給出了機(jī)器人的設(shè)計(jì)和應(yīng)用要求,關(guān)于協(xié)作運(yùn)行也有一些要求。般而言,這些標(biāo)準(zhǔn)倡導(dǎo)的安全完整性要求是SIL 2、HFT = 1(根據(jù)IEC 62061)或PL d、CAT 3
    發(fā)表于 10-30 11:33

    智能救援機(jī)器人的功能和作用

    對(duì)智能機(jī)器人的運(yùn)行進(jìn)行監(jiān)控?! 〗陙?lái),全球?yàn)?zāi)害呈上升趨勢(shì),給人民生命財(cái)產(chǎn)造成嚴(yán)重?fù)p害。在一些抗災(zāi)的地方,救援人員如果在不了解現(xiàn)場(chǎng)災(zāi)害動(dòng)態(tài)的情況下強(qiáng)行進(jìn)入救援救災(zāi)工作,很可能會(huì)遇到悲觀的風(fēng)險(xiǎn)。具有
    發(fā)表于 11-30 15:10

    怎樣去設(shè)計(jì)個(gè)基于arduino的簡(jiǎn)單記憶機(jī)器人

    完成了”。雖然做工極其的“爛”,但是也算是完成了個(gè)讓自己還算是滿意的作品。需要的零件我們對(duì)Markdown編輯器進(jìn)行了一些功能拓展與語(yǔ)法支持,除了標(biāo)準(zhǔn)的Markdown編輯器功能,我們增加了如下幾...
    發(fā)表于 03-02 07:24

    機(jī)器人是什么?

    機(jī)器一些書(shū)呆子式的語(yǔ)言可能會(huì)把它描述成“個(gè)重新編程的多功能機(jī)械手,旨在通過(guò)各種編程的動(dòng)作移動(dòng)材料、部件、工具或?qū)iT(mén)設(shè)備,以完成各種任
    發(fā)表于 03-31 10:31

    輪式機(jī)器人怎么樣

    。圖1:輪式機(jī)器人配送披薩的示例 隨著一些人認(rèn)為是“偽裝機(jī)器人”的輪式機(jī)器人的出現(xiàn),讓我們來(lái)看看目前業(yè)界使用的整個(gè)機(jī)器人組合…
    發(fā)表于 11-09 07:49

    新加坡研發(fā)出款外形神似魔鬼魚(yú)的新型機(jī)器人

    根據(jù)報(bào)道,新加坡研究者近日研發(fā)出款新型機(jī)器人,該機(jī)器人形狀似魔鬼魚(yú),研究者稱它為該類機(jī)器人中第
    發(fā)表于 09-29 09:26 ?1329次閱讀