編者按:Google 這家成立于 1998 年的公司,起于互聯(lián)網(wǎng)搜索引擎,其 Android 是移動操作系統(tǒng)當之無愧的霸主,不滿足于語音識別+搜索,而從 2016 年開始了真正意義上的人工智能起點,到如今真正地 All in 了 AI,更是在學(xué)術(shù)和應(yīng)用上兩面開花。那么,Google 在 AI 上究竟都實現(xiàn)了什么?我們或許可以從前不久的 Google I/O 上一窺究竟。
很幸運今年又再一次來到 Google I/O 現(xiàn)場,會場仍然在離 Google Complex 不遠的海岸圓形劇場。會議開始之前,主會場人頭攢動,各種歡呼聲,結(jié)伴照相的聲音此起彼伏,恍若入了慶典的海洋。這三天的會場萬里睛空,除了在 Keynote 中某個團體開著飛機拉橫幅之外,基本上沒有出現(xiàn)其他干擾。由于 Keynote 的一些圖片已經(jīng)滿天飛大家也看到了許多,筆者就現(xiàn)場抓拍了 Google Brain 的老大 Jeff Dean 出場的畫面。
這應(yīng)該是這位大佬,為數(shù)不多的在 Google I/O 出場的場景。
既然各個 Session 的全程視頻網(wǎng)上都有,那我就專注于 Google I/O 大會 AI 相關(guān)的展臺,今年的 ML 相關(guān)的展臺也設(shè)的比較特殊,就在會場入口不遠處。
整個 I/O 的標志是 I/O Lankmark 的位置,而 AI 相關(guān)的展廳便是附近的 G 位置,得天獨厚。我在第二天的下午,就跑到 AI 相關(guān)的展臺,去看看里面倒底有什么。
所有的展廳外面都是搭的帳篷,ML+AI 放在一個展廳,用最醒目的大紅色加以標注。
Google AI Research
進門右拐,可以看到 Google AI Research 的展位。人工智能發(fā)展到今天,數(shù)據(jù)越來越重要,誰掌握了數(shù)據(jù),誰就能夠做出更好的 AI 模型,數(shù)據(jù)是人智能的食糧。大公司可以以數(shù)據(jù)取勝,那么,對于眾多開發(fā)者,探索人工智能如何落地的工程師,如何得到有效的數(shù)據(jù)呢?Google AI 搜索主要解決數(shù)據(jù)集的問題,讓你免費獲得可以公開的數(shù)據(jù)集。
我們知道,Google 最強有力的武器便是它的搜索工具,便攜,好用。而且不會出現(xiàn)各種詐騙信息。那么,Google 對于數(shù)據(jù)集專門出了一個搜索通道,會加速 AI 的學(xué)習(xí)使用。
附數(shù)據(jù)專項搜索引擎的地址:
https://toolbox.google.com/datasetsearch
我們以 students 為關(guān)鍵字,查找一下數(shù)據(jù)。打開頁面為:
https://toolbox.google.com/datasetsearch/search?query=students&docid=aTkZB%2F0%2F6kN6Bq6AAAAAAA%3D%3D
整個結(jié)果頁面如下:
總共搜出了超過 100 個數(shù)據(jù)集。我們就從第一個數(shù)據(jù)集 kaggle 來看一下,搜出了什么樣的結(jié)果:
通用屬性,告訴我們一份關(guān)于中學(xué)生的社會、性別的學(xué)習(xí)數(shù)據(jù),可以看出酒精消耗程度。然后我們拿到這些數(shù)據(jù)的詳細信息,包括來源網(wǎng)站、上傳日期、數(shù)據(jù)來源、許可、可下載的文件格式。
數(shù)據(jù)詳繼描述,說明了這份數(shù)據(jù)可以用來預(yù)測學(xué)生的最終級別。在描述中,共有 30 個數(shù)據(jù)域,把每一個域的數(shù)據(jù)的意義,標識都解釋的一清二楚。
完全是妥妥的一份完全數(shù)據(jù)清洗之后的數(shù)據(jù)嘛??梢阅脕碇苯佑昧?。
一個搜索引擎,做這么貼心。真的很不容易,是不是需要感動一下?
AI on Edge
上面這張照片所顯示的是一個 Edge 端的 Demo 演示,整個演示過程如下:
有一個上面帶有數(shù)字標記的圓盤,圓盤編號從 1 到 8.先把圓盤投到右邊的斜槽上,圓盤滾動到最右邊,然后用帶攝像頭的 Edge TPU 去識別圓盤上的數(shù)字,如果識別完之后,自動的轉(zhuǎn)動右邊的黑色大的圓圈中的白色的通道,使得這個通道連通最下面用數(shù)據(jù)標識的槽。然后帶數(shù)字的圓盤就會掉落到對應(yīng)數(shù)字的槽中。
左邊是一個顯示器,顯示器展于從 1,2,3,4,5,6,7,8 這 8 個數(shù)字的圓盤的識別情況,照片正好識別的數(shù)字 1 的情況,我們能夠看到顯示屏的瀏覽器中,這個 Demo 的名稱為“Vision Intelligence with AutoML and Edge TPU”。 用 AutoML 和 Edge TPU 實現(xiàn)視覺智能。
我起初覺得就是用 Edge TPU 實現(xiàn)簡單的數(shù)字分類,難度在于圓盤識別的數(shù)字可能是歪的,需要調(diào)正,然后再識別。但是展臺工作人員告訴我,這個 Demo 完成了兩個功能,一個功能是識別數(shù)字,打開對應(yīng)通道,另一個功能是檢查圓盤有沒有破損情況,如果有破損,那么會標記出來,在顯示屏上會顯示”break”。相當于是 2 個 AI 模型共同工作,得出的結(jié)果。
即使只是一個小小的 Demo,但背后的技術(shù)含量還是很高的。
那么,讓我們的思緒亂飛一會兒,這樣的 Demo 有什么樣的實際應(yīng)用場景?而且我們用不同的 AI 模型相互搭配、亂入,可以獲得什么奇妙的應(yīng)用場景呢?歡迎留言討論。
Custom&Pre-Trained Models
Custom&Pre-Trained Models 這個展臺實際上向我們展于,我們在視頻中,實時識別的數(shù)據(jù),我們可以做什么樣的處理,達到我們想到的結(jié)論。再補上一張圖:
這張圖也是這個展臺中的,相當于用這個模型,可以分燈出人、飛機、汽車等一些對象。如果是攝像頭處理的視頻流,那么,可以用時間記錄下來,在時間軸上,什么時間識別出了什么樣的物體?這個類型的識別,更能夠用于人口流量的統(tǒng)計等場合。比如一個十字路口,每一秒,每一天過了多少人?如果人流量太大,可以做一些分流。
Dance Like
這應(yīng)該是具有互動性的一個展臺了。
這個展臺實際上想展示 AI 在舞蹈方面的應(yīng)用。首先站在背景的男士,可以看到他的對面有一個顯示器,顯示器上是一個舞蹈老師在跳舞。我們學(xué)舞蹈時,也會這樣做,前面有一個老師,現(xiàn)場教學(xué)。在前面,觀眾可以看得到的顯示器有兩個畫面,左邊的畫面是真實的跳舞的人的動作。右邊的畫面是舞蹈老師和跳舞的小伙子重疊的影像。而且能夠?qū)崟r的看到姿勢的差異。我們用另一張圖片展現(xiàn)一下。
這張圖片就更明顯了,在這個時間點上,后面跳舞的帥哥是正面稍微下蹲的姿勢,但是老師是擺腿的姿勢,完全不一樣。對于學(xué)習(xí)跳舞來說,這是一個很好的產(chǎn)品。但是我突然有種不好的感覺。這個產(chǎn)品對于人的模仿能力,是極大的考驗啊。這完全是用 AI 跟人在磨啊,AI 吊打人類啊。
總結(jié)
這次的 I/O 之行,聽了很多演講,主要在 AI 的展廳實地觀摩了一翻,還有一些 AI 展臺沒有介紹。但是上面這四個展臺給我的印象特別深。對于數(shù)據(jù)處理,結(jié)論分析,實際的應(yīng)用場景,都有展示。可以說,展臺產(chǎn)品涉及到 AI 從數(shù)據(jù)到實際產(chǎn)品的幾個主要環(huán)節(jié),對于開發(fā)者,公司運用 AI 提供了特別好的示例。隨著 AI 的應(yīng)用越來越廣泛,相應(yīng)的落地應(yīng)用會越來越多。
-
Google
+關(guān)注
關(guān)注
5文章
1768瀏覽量
57654 -
AI
+關(guān)注
關(guān)注
87文章
31262瀏覽量
269627 -
人工智能
+關(guān)注
關(guān)注
1792文章
47497瀏覽量
239211
原文標題:Google All in AI都做了什么?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論