美國(guó)時(shí)間 5 月 7 日,谷歌 2019 年 I/O 開發(fā)者大會(huì)在山景城總部開幕,為期三天。
在開幕式上,谷歌宣布了諸多亮點(diǎn),比如更貼近用戶的搜索功能,更強(qiáng)大的 AI 與語(yǔ)音助手,內(nèi)置在安卓系統(tǒng)中的語(yǔ)音轉(zhuǎn)文字功能,新款 Pixel 3a 和 3a XL 中端手機(jī),Nest Hub Max 智能家居設(shè)備,還有安卓 Q 系統(tǒng)更新等等。
“To Be Helpful”是整場(chǎng)大會(huì)的主題之一。因此,無(wú)論是產(chǎn)品演示,還是演講者,幾乎全都從安全、隱私和實(shí)用的理念出發(fā),透露出與往屆 I/O 大會(huì)不同的務(wù)實(shí)風(fēng)格。
圖 | 谷歌AI領(lǐng)軍人 Jeff Dean: 為每一個(gè)人打造一個(gè)更有幫助的谷歌
即使是最后登場(chǎng)的谷歌 AI 領(lǐng)軍人 Jeff Dean,也是以現(xiàn)有研究成果出發(fā),強(qiáng)調(diào)了 BERT 模型在自然語(yǔ)言處理領(lǐng)域取得的建樹,以及 AI 技術(shù)在健康和環(huán)境領(lǐng)域的應(yīng)用潛力,并未帶來(lái)令人眼前一亮的驚艷機(jī)器學(xué)習(xí)新成果。
不過(guò)從另一個(gè)角度來(lái)看,這或許才是科技本身應(yīng)有的樣子:一項(xiàng)高科技,無(wú)論初見有多驚艷,最終只有成為像空氣一般的存在,讓我們幾乎察覺不到它,卻又依賴于它,才能讓我們開始享受它的價(jià)值,進(jìn)而真正地享受生活。
這也是谷歌 2019 年 I/O 開發(fā)者大會(huì)帶給我們的啟示。
圖 | 谷歌I/O大會(huì)開場(chǎng)
“黑科技”開場(chǎng),奠定務(wù)實(shí)風(fēng)格
一開場(chǎng),谷歌就遵循一貫風(fēng)格,直接亮出了人們喜聞樂見的“黑科技”。
副總裁 Aparna Chennapragada 率先介紹了谷歌的最新視覺技術(shù):巧妙地整合攝像頭和增強(qiáng)現(xiàn)實(shí)(AR)技術(shù),強(qiáng)化谷歌搜索結(jié)果的互動(dòng)性和實(shí)用性。
她在谷歌上搜索出的二維圖片,可以直接轉(zhuǎn)換成三維模型,并通過(guò)攝像頭放在真實(shí)環(huán)境中。
無(wú)論你搜索的是人體骨骼,一雙鞋,還是一條鯊魚,都沒問題,只要谷歌制作了 3D 模型,就可以通過(guò)攝像頭,展示在現(xiàn)實(shí)場(chǎng)景中,供用戶查看效果。它們不僅可以活動(dòng),還能夠接受放大、縮小、運(yùn)動(dòng)和轉(zhuǎn)移等操作指令。
可以肯定的是,3D 化的搜索結(jié)果不僅僅停留在有趣這一階段,它可以給用戶帶來(lái)更直觀的使用體驗(yàn)和感受,加深對(duì)物體運(yùn)作機(jī)制的理解程度。
想象一下,如果你想知道心臟長(zhǎng)什么樣子,除了看到實(shí)物,有什么東西能比一個(gè)會(huì)跳動(dòng)的、可以放大縮小和分解的立體模型更加形象的呢?尤其是它可以隨時(shí)隨地出現(xiàn)在任何地方,AR 技術(shù)的價(jià)值進(jìn)一步得到了挖掘。
圖 | 搜索出的大白鯊以 AR 形式出現(xiàn)在演講臺(tái)上
除了強(qiáng)化搜索結(jié)果,谷歌還通過(guò) Google Lens 程序,讓手機(jī)攝像頭變得更有價(jià)值。
如果你新到一家餐館,不知道有什么特色菜,沒關(guān)系,只要拿出手機(jī),打開 Google Lens 程序,對(duì)準(zhǔn)菜單,它就可以根據(jù)已有點(diǎn)評(píng),標(biāo)注出大多數(shù)人推薦的特色菜。
如果你去法國(guó)旅游,卻不會(huì)法語(yǔ),看不懂路標(biāo),沒關(guān)系,只要拿出手機(jī),打開 Google Lens 程序,對(duì)準(zhǔn)路標(biāo),它就可以識(shí)別上面的法語(yǔ),直接翻譯成中文和英語(yǔ)等十多種語(yǔ)言,還可以直接朗讀出來(lái),讓語(yǔ)言不再成為交流和旅游的障礙。
如果你想看菜譜學(xué)做菜,沒問題,Google Lens 配合食譜制造商,錄制預(yù)先制作的烹飪視頻,只要將鏡頭對(duì)準(zhǔn)菜譜文字,就會(huì)有實(shí)際演示視頻跳出來(lái),為你展示如何操作。
這些都是非常貼近日常生活的實(shí)用功能,如果實(shí)際操作效果與演示效果相符,那么將極大地方便我們的生活。
圖 | Google Lens可以翻譯多種語(yǔ)言的不同標(biāo)志
谷歌在現(xiàn)場(chǎng)播放了一段視頻,講述了印度的試點(diǎn)項(xiàng)目。視頻中,一名不識(shí)字的印度母親依靠著 Google Lens 程序,終于可以以聽的方式理解書上的內(nèi)容,孩子的作業(yè),路上的標(biāo)識(shí),餐館的菜單等等,最后無(wú)需別人的幫助,單獨(dú)完成很多任務(wù)。
雖然在普通人看來(lái),她完成的都是些瑣碎小事,比如去 ATM 取錢和預(yù)訂火車票,但對(duì)于她來(lái)說(shuō),這就像打開了生活的另一扇門。
由此可見,谷歌貫徹的“To Be Helpful”的理念,意味著技術(shù)應(yīng)該能夠真正幫助有需要的人提高生活質(zhì)量。
圖|印度母親使用Google Lens幫助自己看懂包裝盒上的字
谷歌最后強(qiáng)調(diào),這種技術(shù)結(jié)合了自然語(yǔ)言處理、機(jī)器視覺、以及谷歌 20 多年來(lái)的搜索信息才能實(shí)現(xiàn),但代碼只有 100 KB 左右,所以無(wú)需高端設(shè)備就可以運(yùn)行。
這項(xiàng)功能將加入 Google Go 應(yīng)用中。對(duì)視覺障礙者,以及不會(huì)外語(yǔ)的人來(lái)說(shuō),這無(wú)疑是獲取信息的新方式。目前,Google Go 已經(jīng)能支持?jǐn)?shù)十種語(yǔ)言,售價(jià)為 35 美元。
不得不說(shuō),谷歌選擇用直觀的視覺技術(shù)作為開場(chǎng),非常機(jī)智。不僅契合主題,突出了實(shí)用性,還成功塑造出眼前一亮的感覺,調(diào)動(dòng)了觀眾的積極性。但是稍顯可惜的是,這些演示或許是整場(chǎng)大會(huì)最有看點(diǎn)的部分了。
更強(qiáng)大、更懂你的AI語(yǔ)音助手
在去年的 I/O 大會(huì)上,谷歌的語(yǔ)音助理技術(shù)推出新功能 Google Duplex,讓 AI 打電話預(yù)訂餐廳,因其聲調(diào)語(yǔ)氣相當(dāng)逼真,接電話的人沒察覺,該技術(shù)一鳴驚人,但引起了一些爭(zhēng)議。
在今年的 I/O 大會(huì)上,谷歌也演示了新功能,包括一句話開啟駕駛模式和更先進(jìn)的 Duplex on the web,也就是“Duplex 可以幫忙執(zhí)行網(wǎng)頁(yè)上的任務(wù)”。
例如用戶可以呼出語(yǔ)音助理,要求它上網(wǎng)幫你預(yù)訂一臺(tái)車,然后語(yǔ)音助理就會(huì)進(jìn)入租車網(wǎng)站,幫你填寫姓名、住址,甚至是偏好車型等信息,并要求你確認(rèn)。
圖 | 語(yǔ)音助手幫你租車
它還利用知識(shí)圖譜來(lái)進(jìn)行個(gè)人推薦。根據(jù)用戶的使用習(xí)慣,AI 能更好地理解用戶的語(yǔ)音指令,可以通過(guò)語(yǔ)音瞬間打開 App,并且可以使用連續(xù)的語(yǔ)音指令,而不需要每次都說(shuō)出喚醒詞。比如 AI 可以追蹤一連串語(yǔ)音指令:打開地圖,播放音樂,打開相冊(cè),搜索有動(dòng)物的照片,發(fā)送給某人,它能根據(jù)一系列語(yǔ)音指令按順序完成相應(yīng)動(dòng)作。
谷歌認(rèn)為此功能擁有很大的應(yīng)用前景,并強(qiáng)調(diào)隨著深度學(xué)習(xí)的進(jìn)展,把 AI 模型放置到移動(dòng)裝置將是一種范式的轉(zhuǎn)換。他們希望可以把 100GB 的語(yǔ)音識(shí)別模型縮小到 0.5GB,并放在終端設(shè)備上,讓用戶更方便使用。
不過(guò)谷歌表示,目前該功能還在完善階段,預(yù)計(jì)今年晚些時(shí)間才會(huì)公布更多細(xì)節(jié),并透露在今年晚些會(huì)推出新的 Pixel 手機(jī)。
安卓?jī)?nèi)置語(yǔ)音轉(zhuǎn)文字功能
作為一家以人性化為核心的公司,谷歌這次格外考慮到了聽覺或語(yǔ)言障礙人士,推出了 Live Caption(實(shí)時(shí)字幕)技術(shù)。
圖 | 實(shí)時(shí)字幕技術(shù)演示
該技術(shù)由循環(huán)神經(jīng)網(wǎng)絡(luò)支持,可以把手機(jī)中的視頻和音頻內(nèi)容實(shí)時(shí)轉(zhuǎn)化成文字,類似于微信的語(yǔ)音信息轉(zhuǎn)文字。
不過(guò)更重要的是,Live Caption 是原生存在于安卓系統(tǒng)中的功能,意味著它能夠契合所有的應(yīng)用,適用于視頻聊天、電話、錄像,甚至是游戲中,而且使用全程可在設(shè)備端進(jìn)行處理,不需要聯(lián)網(wǎng),從而進(jìn)一步保障用戶隱私。
對(duì)于普通人來(lái)說(shuō),如果不想外放語(yǔ)音,一副耳機(jī)就可以解決。但對(duì)于聽覺或語(yǔ)言障礙人士來(lái)說(shuō),這項(xiàng)功能可以發(fā)揮很大的作用,幫助他們更好地與人溝通。
在此基礎(chǔ)上,谷歌推出了 Project Euphonia,通過(guò)機(jī)器學(xué)習(xí)來(lái)了解語(yǔ)言障礙者的對(duì)話模式,來(lái)實(shí)現(xiàn)精準(zhǔn)的語(yǔ)音轉(zhuǎn)寫。
安卓Q圍繞安全和隱私等優(yōu)化
盡管谷歌有許多平臺(tái),像是 Chrome,但安卓系統(tǒng)依舊是最重要、裝機(jī)量最大的那一個(gè),目前全球已有超過(guò) 25 億臺(tái)安卓設(shè)備。
谷歌在今天也發(fā)布了最新安卓 Q Beta 3 版本,圍繞安全和隱私等核心問題進(jìn)行優(yōu)化,12 家 OEM 廠商的 21 個(gè)手機(jī)機(jī)種都可以升級(jí),包括華為、小米、Vivo 等。
除了支持上述的 Live Caption 功能,安卓 Q Beta 3 還適配可折疊屏幕,游戲應(yīng)用可以直接在兩種模式下無(wú)縫流暢轉(zhuǎn)換,并且加入了用戶期待已久的黑暗主題。
圖 | Q Beta 3 適配折疊屏
此外,谷歌還推出了其它新功能,比如 Focus Mode 專注模式,可以讓用戶暫時(shí)停止使用一些容易打擾人的應(yīng)用;Smart Reply 功能,可以預(yù)測(cè)和提供智能回復(fù)建議,能夠通過(guò)任何應(yīng)用快速發(fā)送回復(fù);以及針對(duì)小孩的父母管理機(jī)制。
值得一提的是,安卓 Q 已經(jīng)增加了 5G 網(wǎng)絡(luò)支持,為未來(lái) OEM 廠商推出 5G 手機(jī)打下了基礎(chǔ)。
強(qiáng)調(diào)隱私保護(hù),Nest Hub Max 誕生
智能家居一直是各家業(yè)者都想爭(zhēng)取的市場(chǎng),Nest 是谷歌旗下專注智能家居的獨(dú)立團(tuán)隊(duì),已有家庭安全攝像頭和帶有顯示屏的 Home Hub 等智能家居產(chǎn)品。
圖 | 推出新版 Nest Hub Max
谷歌在大會(huì)上表示,智能家居必須非常重視用戶的隱私,并且宣布,將 Home Hub 更名為 Nest Hub,同時(shí)推出升級(jí)版 Nest Hub Max,裝有更大的 10 英寸顯示屏,直接與 Facebook Portal 和亞馬遜 Echo Show 等同類產(chǎn)品競(jìng)爭(zhēng)。
谷歌強(qiáng)調(diào),沒有用戶允許絕不會(huì)啟動(dòng)攝像頭,另外拍下或錄下的數(shù)據(jù)只會(huì)存在終端上,并使用 FaceMatch 面部識(shí)別用戶,支持手勢(shì)操作。
屏幕較大的 Nest Hub Max 售價(jià) 229 元,現(xiàn)有的 Nest Hub 則降價(jià) 20 美元至 129 美元。
推出兩款Pixel,進(jìn)軍中端智能手機(jī)市場(chǎng)
隨后谷歌帶來(lái)了兩款 Pixel 系列手機(jī),Pixel 3a 與 Pixel 3a XL,售價(jià)分別是 399 美元和 479 美元,前者即日起開售,后者今年暑期上市。這也是谷歌首次推出中端智能手機(jī)。
圖 | 新款Pixel 3a售價(jià)399美元,即日發(fā)售
兩個(gè)機(jī)型在外觀上依然延續(xù) Pixel 家族的特點(diǎn),無(wú)劉海屏幕,后置單攝像頭,提升拍照質(zhì)量主要靠搭載谷歌自研 Pixel Visual Core 圖像處理單元,還繼續(xù)使用后置指紋識(shí)別,保留有 3.5mm 耳機(jī)孔,一次充電可以支撐 30 小時(shí),并且配有 Titan M 安全芯片,專門用來(lái)保護(hù)用戶隱私。
至于硬件配置,谷歌大會(huì)上并沒有給出詳細(xì)參數(shù),但已有媒體爆出了比較可信的數(shù)據(jù),其中 Pixel 3a 搭載高通驍龍 670 處理器,配備 4GB 內(nèi)存+ 64GB 存儲(chǔ),分辨率為 1080×2160 ;Pixel 3a XL 搭載高通驍龍 710 處理器,配備 4GB 內(nèi)存+128GB 存儲(chǔ),分辨率為 2220×1080。
相比 Pixel 3 的 799 美元售價(jià),兩款中端手機(jī)的價(jià)格更加親民,這在一定程度上可以刺激目前較為疲軟的 Pixel 銷量,但隨著全球整體智能手機(jī)市場(chǎng)逐漸飽和,再加上谷歌在大會(huì)上暗示今年晚些時(shí)候?qū)⑼瞥鲂?Pixel 高端機(jī),它們究竟能夠?yàn)楣雀鑾?lái)多少收益還不得而知。
就像在剛剛過(guò)去的第一季度財(cái)報(bào)會(huì)議上,谷歌 CEO Pichai 表示的那樣,“在硬件之路上,谷歌還處于早期階段”。
Jeff Dean登場(chǎng),壓軸的谷歌 AI
在大會(huì)的最后,谷歌 AI 領(lǐng)軍人物 Jeff Dean 壓軸登場(chǎng),介紹了自己團(tuán)隊(duì)一直以來(lái)的研究目標(biāo)和方向。從推動(dòng)計(jì)算機(jī)視覺的極限,到語(yǔ)音識(shí)別,他們研究的領(lǐng)域涵蓋生活中的方方面面。
圖 | Jeff 介紹谷歌AI 團(tuán)隊(duì)的研究進(jìn)展
在Jeff 看來(lái),最讓他激動(dòng)的AI技術(shù)進(jìn)展是語(yǔ)言理解。
遵循這一思想,谷歌 AI 一直在努力提高計(jì)算機(jī)對(duì)語(yǔ)言的理解能力,希望有朝一日能媲美人類的水平。最新的研究成果就是自然語(yǔ)言處理領(lǐng)域大名鼎鼎的 BERT 模型(Bidirectional Encoder Representation from Transformers)。
BERT 模型突破了傳統(tǒng) RNN 模型的限制,不再局限于單個(gè)關(guān)鍵詞詞義的理解,而是結(jié)合上下文分析語(yǔ)義,能夠在大段文字下更好地理解語(yǔ)境和整體內(nèi)容。
該模型于 2018 年 11 月推出,直接刷新了自然語(yǔ)言處理任務(wù)的 11 項(xiàng)紀(jì)錄,同時(shí)啟發(fā)了多個(gè)研究團(tuán)隊(duì),后續(xù)衍生模型不斷刷新著新的紀(jì)錄。
谷歌團(tuán)隊(duì)更是將其直接定義為:BERT 模型開啟了自然語(yǔ)言處理的新時(shí)代!
隨后,谷歌 AI 介紹了 AI for Social Good 項(xiàng)目,旨在將 AI 技術(shù)推廣到各個(gè)領(lǐng)域。
圖 | 谷歌用AI 檢測(cè)肺癌
他們將 AI 運(yùn)用于醫(yī)療保健,建立了 CT 掃描圖預(yù)測(cè)模型,可以幫助檢測(cè)肺癌。他們還將 AI 運(yùn)用在自然災(zāi)害預(yù)測(cè)領(lǐng)域,建立了一個(gè)洪水預(yù)測(cè)模型,預(yù)測(cè)洪水會(huì)出現(xiàn)在何時(shí)何地。該模型結(jié)合了深度學(xué)習(xí)、衛(wèi)星影像與以現(xiàn)實(shí)為基礎(chǔ)的情境模擬,并且會(huì)將信息共享給可能會(huì)受到影響的個(gè)人。
除此之外,谷歌的 AI for Social Good 項(xiàng)目還包括地震余震預(yù)測(cè)、全球漁業(yè)活動(dòng)預(yù)測(cè)等等,都突顯出 AI 技術(shù)的實(shí)用價(jià)值。
圖 - 用 AI 模型預(yù)測(cè)地震余震
結(jié)語(yǔ)
最近一兩年,數(shù)據(jù)隱私和 AI 道德問題持續(xù)困擾著美國(guó)科技巨頭們,特別是用戶體量巨大、掌握海量數(shù)據(jù)的 Facebook 和谷歌。
上周的 Facebook F8 大會(huì),扎克伯格三句話不離數(shù)據(jù)隱私保護(hù),力求挽回形象,而在谷歌 I/O 大會(huì)開幕式上,我們似乎也感受到了谷歌的刻意“保守”。
去年,谷歌在大會(huì)上演示了 Google Duplex,讓 AI 打電話訂位,AI 模仿人類太成功,接聽電話的店員根本沒有察覺有異,不料卻引起外界憂心技術(shù)被用來(lái)欺騙人類。
隨后,谷歌遭人詬病的事一樁接著一樁,一下子員工聯(lián)名抗議用 AI 做軍事生意,導(dǎo)致云計(jì)算部門高管的離職潮,一下子又反對(duì) AI 道德委員會(huì)的某些外部成員,使得該組織才成立一周就被迫解散。這讓曾經(jīng)確立“AI 優(yōu)先”戰(zhàn)略的谷歌不得不重新思考技術(shù)的發(fā)展走向和展示策略。
所以,今年的 I/O 大會(huì)在展示 AI 技術(shù)時(shí),更多演示 AI 對(duì)于人類帶來(lái)正面效益的應(yīng)用,塑造出一種“谷歌是你的好幫手”的感覺,例如幫助聽力或語(yǔ)言障礙人士更好地與世界溝通,在談?wù)摲?wù)及硬件設(shè)備時(shí),也不斷重申數(shù)據(jù)保護(hù)、攝像頭絕不會(huì)監(jiān)視用戶等,深怕又被外界抓了小辮子。
或許正是因?yàn)槿绱耍衲甑拇髸?huì)才略顯平淡,少了曾經(jīng)的驚艷。
但就像開頭所說(shuō),以創(chuàng)新力聞名的谷歌能帶來(lái)顛覆性技術(shù)突破固然令人興奮,可是相比于過(guò)分激進(jìn),轉(zhuǎn)型成為這樣一種幫手型角色,對(duì)于普通用戶、谷歌自身和社會(huì)發(fā)展來(lái)說(shuō),未嘗不是一件好事。
科技之于人類,本就應(yīng)該扮演這樣的角色。
-
谷歌
關(guān)注
27文章
6184瀏覽量
105788 -
AI
+關(guān)注
關(guān)注
87文章
31463瀏覽量
269848
原文標(biāo)題:谷歌發(fā)布最新視覺“黑科技”:搜索3D化,代碼僅100KB,無(wú)需高端設(shè)備即可運(yùn)行
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論