德國伯恩大學的研究人員設計了一個軟件,能夠看視頻并預測未來5分鐘會發(fā)生的事件,準確率在15%到40%之間。研究人員表示,對于具有大量不同動作的長視頻,他們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息。
從幾百萬年前起,第一個原始人類仰望星空,對宇宙產(chǎn)生好奇開始,我們?nèi)祟悓χ茉馐澜绲睦斫夂桶芽?,已?jīng)達到了相當嫻熟的程度。
我們已經(jīng)可以超音速飛行,可以轉基因,還能治療癌癥。但是,有一件事情是我們一直沒有做得很好的,那就是對“時間”的感知——如何從當下推斷未來,如何最大限度的利用這種推測?
現(xiàn)在看,機器似乎可以幫助我們做到這一點。
德國波恩大學的計算機科學家設計出了一種軟件,能夠預測未來5分鐘的序列事件,準確率在15%到40%之間。
雖然從數(shù)值上看,這個精度并不高,但研究人員Juergen Gall表示,這代表了機器學習超越了單步預測(single-step prediction),向新的領域邁進了一步。相關的研究論文已經(jīng)被CVPR 2018接收。
Juergen Gall團隊展示他們的預測未來系統(tǒng)
超越單步預測
Gall和他同事們的研究目標——教會計算機預測未來——并不是現(xiàn)在才有,實際上,這是機器學習和計算機視覺領域的一個主要課題,有大量的研究人員都在從事相關的工作。
但是,這項工作特殊的地方在于其方法:到目前為止,這些領域的研究集中在對當前行動的解釋,或者對預期的下一步行動進行預測上面,也即前面提到的“單步預測”。
單步預測,也就是預測未來往前一步的結果。這是預測未來模式的基礎,歸結為一個回歸問題,輸入變量,預測結果。
在進行這樣的預測時,目前的研究已經(jīng)取得了比較好的結果。其中一個例子是,斯坦福大學吳恩達團隊設計了一種深度學習算法,在對臨終關懷的預測中,實現(xiàn)了高達90%的準確性。
在他們的實驗中,斯坦福的研究人員使用了200萬份病歷對他們設計的神經(jīng)網(wǎng)絡進行訓練,通過這些數(shù)據(jù),網(wǎng)絡能夠發(fā)現(xiàn)醫(yī)生發(fā)現(xiàn)不了的模式和規(guī)律,并以此為基礎,對新的病人的情況(患者在接下來3~12個月內(nèi)的死亡率)進行預測。
這項研究面臨的變量十分復雜,而且取得了很高的精度,論文也獲得了IEEE生物信息學和生物醫(yī)學組最佳學生論文獎。但是,這樣的算法是基于過往(retrospective),而且只進行單步預測。
多步預測:用CNN和RNN預測未來的兩種結構
在Gall和他團隊的最新研究中,他們提出了兩種方法,對相當長時間的未來發(fā)生的大量行動進行預測。他們訓練了一個CNN和一個RNN,根據(jù)之前看過的視頻內(nèi)容,學習未來視頻的“標簽”。
“我們表明,即使對于具有大量不同動作的長視頻,我們的方法也能夠準確預測未來,甚至可以處理嘈雜或錯誤的輸入信息。”作者在論文中這樣寫道。
下面的圖例展示了研究人員設計的兩個方法。首先來看RNN的設計。
在RNN系統(tǒng)的結構中,輸入是一個序列,網(wǎng)絡預測最近觀察到的動作的剩余長度,以及下一個動作的標簽和長度。將預測結果附加到原始輸入,就可以預測下一個動作片段。
而在CNN系統(tǒng)的結構中,輸入序列和輸出序列都被轉換成矩陣的形式。其中,C表示類(class)的數(shù)量,S則對應于特定長度的視頻片段的數(shù)量。矩陣的二進制值表示每個視頻片段的標簽。
讓機器預測長時間的未來,有望實現(xiàn)真正的人機協(xié)作
在他們的實驗中,Gall和他的團隊使用數(shù)小時的視頻數(shù)據(jù)來演示不同的烹飪動作(例如煎雞蛋、拌沙拉等),并僅向軟件展示其中的一部分動作。軟件根據(jù)“已經(jīng)學到的”來預測接下來的動作步驟。通過這種方法,Gall希望該領域能夠向真正的人機共生邁進一步。
“[業(yè)界]人們談論人類和機器人協(xié)作,但最終人和機器之間仍存在分離; 他們并沒有真正密切地合作,”Gall說。
Gall建議說,通過使用適當?shù)挠布?,這個軟件可以通過直觀地了解任務來幫助人類完成任務,進而在工業(yè)環(huán)境中幫助人類工作。
Gall說:“老年人越來越多,值得努力在家庭中推廣這種機器人來照顧老年人,”Gall說: “我相信10年后服務機器人將能夠在家照顧老年人?!?/p>
根據(jù)人口統(tǒng)計局的報告,今天65歲以上的美國人的數(shù)量約為4600萬,預計到2060年將翻一番。根據(jù)2014年美國疾病控制與預防中心(CDC)的報告,這些老年人中約140萬將生活在養(yǎng)老院。日本已經(jīng)探索過使用這樣的軟件帶來的影響。例如用于療愈的海豹型機器然PARO,軟銀的伴侶機器人Pepper等。在日本,四分之一人口是老年人。
隨著這類技術的進步,或許會在人類代際之間造成進一步的分化——把愛和關懷外包給一臺機器。對于一個尚未成熟的行業(yè)來說,很難說這條路將通向何方,但最終決定權掌握在開發(fā)人員手中,而不是掌握在他們開發(fā)的軟件或機器人手中。
-
機器人
+關注
關注
211文章
28474瀏覽量
207394 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
46024 -
機器學習
+關注
關注
66文章
8423瀏覽量
132744
原文標題:機器也能感知時間,AI系統(tǒng)可預測5分鐘內(nèi)的未來!
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論