在華盛頓州雷德蒙德(Redmond)的微軟總部,公司CEO薩提亞·納拉德告訴我,未來微軟將會(huì)開發(fā)更多的智能APP和服務(wù)。每天早上,納拉德都會(huì)戴上HoloLens頭盔,他可以在家中住宅的墻上查看虛擬互動(dòng)日歷。系統(tǒng)很智能,生產(chǎn)力高,代表著未來:納拉德已經(jīng)是微軟的領(lǐng)導(dǎo)者,HoloLens寄托了他的所有希望。
納拉德宣稱,未來不管我們?cè)谀睦锕ぷ?,微軟都可以占?jù)一席之地。微軟認(rèn)為“聊天式界面”將會(huì)替代APP,成為使用互聯(lián)網(wǎng)的主要方式:我們會(huì)用新方法查找信息、購物、接入服務(wù)。有了“認(rèn)知API”(微軟提供這種API),APP將會(huì)變得更加智能,可以識(shí)別面部表情、情緒、照片和視頻中的其它信息。
微軟認(rèn)為自己擁有最棒的“大腦”,它以過去20年取得的機(jī)器學(xué)習(xí)、自然語言處理成果作為基礎(chǔ),可以創(chuàng)造一個(gè)AI驅(qū)動(dòng)的未來。
很顯然,微軟為自己的AI工作深感自豪,它渴望向外人傳達(dá)一種感覺:這一次微軟會(huì)成為贏家。6月份,微軟邀請(qǐng)我前往辦公園區(qū)采訪納拉德的副手,他們開發(fā)AI產(chǎn)品,將AI植入業(yè)務(wù)的各個(gè)方面。在隨后的2天里,微軟向我展示了許多應(yīng)用,證明公司在自然語言處理和機(jī)器學(xué)習(xí)上取得了進(jìn)步。
在開發(fā)聊天機(jī)器人方面,微軟取得的成功可能比其它任何一家美國公司都要多。只是我們可能沒有意識(shí)到這一點(diǎn),因?yàn)槲④浀某晒κ菑闹袊_始的。
2016年1月,微軟AI產(chǎn)品出現(xiàn)在東方衛(wèi)視,它以天氣預(yù)報(bào)員“小冰(Xiaoice)”的身份亮相。
為什么微軟如此看好聊天機(jī)器人?要知道答案,小冰正是其中的一部分。必應(yīng)搜索工程主管康奈爾(Derrick Connell)說:“我們不敢拍著胸脯說自己開發(fā)了殺手級(jí)機(jī)器人,但是我們的確已經(jīng)開發(fā)了一個(gè)機(jī)器人,它可以用全新的方式工作,完成許多對(duì)話?!?/p>
在康奈爾看來,小冰的目標(biāo)指向了下一代搜索。當(dāng)我們搜索時(shí),傳統(tǒng)搜索引擎會(huì)返回一個(gè)頁面,上面有10個(gè)藍(lán)色超鏈接結(jié)果;如果會(huì)話機(jī)器人足夠完美,只會(huì)給出正確的答案。
當(dāng)然,在中國取得成功,并不意味著在美國也能成功。在小冰推出2年之后,微軟還沒有開發(fā)出英語版本,短期之內(nèi)也不會(huì)出現(xiàn)。微軟高管稱,小冰的后臺(tái)架構(gòu)對(duì)于公司而言是一個(gè)大機(jī)會(huì)。
成為生態(tài)系統(tǒng)
“現(xiàn)在已經(jīng)是新時(shí)代了——你沒有必要成為語音和語言理解專家?!笨的螤栒f,“只要用我們的工具就行了,你可以用我們的工具開發(fā)機(jī)器人,放在哪里都可以,可能是Slack,可能是Facebook Messenger。當(dāng)然,我們希望應(yīng)用能夠放在Skype或者Windows上,由你選擇?!?/p>
開發(fā)者擔(dān)心各大企業(yè)將會(huì)圍繞機(jī)器人標(biāo)準(zhǔn)展開大戰(zhàn),這一次微軟一反常態(tài)。6月份,微軟在舊金山召開會(huì)議,呼吁機(jī)器人開發(fā)商彼此合作。微軟高級(jí)工程師程麗麗 (Lili Cheng)是會(huì)議(這次會(huì)議名叫Botness)的組織者,她說:“我們對(duì)協(xié)作很感興趣,我們想成為生態(tài)系統(tǒng)的一部分。如果我們發(fā)現(xiàn)了什么問題和挑戰(zhàn),大家可以一起解決?!?/p>
想為下一代計(jì)算建立主導(dǎo)性平臺(tái)的不只有微軟,幾乎每一家大型科技公司都有AI部門,許多創(chuàng)業(yè)公司也有,一些企業(yè)已經(jīng)取得了驕人的成績。要比較各大公司的AI有點(diǎn)困難,幾乎是不可能的事。許多公司(比如谷歌、Facebook、亞馬遜)到底在開發(fā)什么還沒有公布。
VC公司Andreessen Horowitz的未來學(xué)家Benedict Evans最近在博客中表示,AI的未來仍然不明朗。他寫道:“AI領(lǐng)域發(fā)展很快,很難說清最強(qiáng)的領(lǐng)導(dǎo)者會(huì)出現(xiàn)在哪里,也不知道哪些東西會(huì)成為商品,最大的差異點(diǎn)是什么。沒錯(cuò),在AI技術(shù)方面,大多的計(jì)算機(jī)科學(xué)成果都已經(jīng)發(fā)表,都是開源的,但是這些產(chǎn)品都不太重要,這些技術(shù)并不一定能成為商品?!?/p>
APP并不是正確的模式
陸奇(Qi Lu)試圖為微軟建立競爭優(yōu)勢。納拉德的高管團(tuán)隊(duì)有幾十個(gè)人,陸奇是其中之一,他掌管微軟應(yīng)用和服務(wù)集團(tuán)。陸奇獲得過計(jì)算機(jī)博士學(xué)位,名下有20項(xiàng)專利,我曾經(jīng)和陸奇的同事有過交流,他們很尊敬陸奇。很快我就知道了原因,陸奇極為聰明,說話的時(shí)候腳打著拍子,好像自己說話的速度跟上不思維。見面的時(shí)候,陸奇穿著涼鞋和襪子,大口袋短褲,T恤上寫著三個(gè)單詞:“Make epic shit。(意思是創(chuàng)造偉大的東西)”
在第一波移動(dòng)互聯(lián)網(wǎng)浪潮出現(xiàn)時(shí)存在一些缺陷,陸奇最開始時(shí)就是要解決這些問題。陸奇稱,移動(dòng)設(shè)備網(wǎng)絡(luò)流量從未超過桌面流量,因?yàn)橛脩魧?duì)體驗(yàn)感到沮喪?!拔覀兌贾溃W(wǎng)頁在手機(jī)上的運(yùn)行效果不怎么好?!标懫嬲f。除了少數(shù)幾個(gè)大類,用戶不愿意下載其它APP。西雅圖市民可能會(huì)被迫下載一個(gè)APP,用來查看渡輪的票價(jià),實(shí)際上他們一年只用幾次,這種模式并不好。陸奇稱:“我們的產(chǎn)業(yè)還沒有找到一個(gè)體驗(yàn)平臺(tái),真正釋放移動(dòng)和云的價(jià)值。APP并不是正確的模式?!?/p>
當(dāng)APP崛起時(shí),它是用來替代HTML網(wǎng)頁的,就當(dāng)時(shí)來看APP是最好的辦法。我們不能朝著手機(jī)大喊大叫調(diào)出互聯(lián)網(wǎng)內(nèi)容,開發(fā)者只好開發(fā)精致的隱藏管道,讓用戶可以通過圖形按鈕互動(dòng)。盡管如此,在完成許多任務(wù)時(shí),按鈕仍然是最有效的方式。
由于自然語言處理技術(shù)取得了進(jìn)步,現(xiàn)在我們可以朝著手機(jī)叫喊,將互聯(lián)網(wǎng)內(nèi)容喊到手機(jī)上來。陸奇認(rèn)為,下一代“體驗(yàn)平臺(tái)”將會(huì)由此起步,當(dāng)中包含了對(duì)話。這種體驗(yàn)方式更加符合人的行為舉止。只要使用正確,隨時(shí)都可以回到按鈕。陸奇稱:“語言的全方位使用將會(huì)成為基準(zhǔn),圖形互動(dòng)可以通過更周到、更有意義的方式提升體驗(yàn)?!?br />
5大關(guān)鍵資產(chǎn)
要想成為贏家,陸奇認(rèn)為公司必須擁有5大“關(guān)鍵資產(chǎn)”。第一項(xiàng)資產(chǎn)是“會(huì)話層”,也就是提供一個(gè)地方,讓用戶可以談話、輸入文本。微軟擁有Office、Outlook、Skype和Cortana。第二項(xiàng)資產(chǎn)是AI大腦,也就是為世界打造復(fù)雜精致的心智模式。早在20年前微軟就已經(jīng)涉足AI開發(fā)了。第三項(xiàng)資產(chǎn)是社交圖,用戶在互聯(lián)網(wǎng)上進(jìn)行的活動(dòng)許多時(shí)候都與朋友、同事有關(guān)。果不其然,與陸奇交談之后沒過幾天,微軟就宣布262億美元收購LinkedIn,該網(wǎng)站擁有4.33億注冊(cè)用戶。
第四項(xiàng)資產(chǎn)就是建立一個(gè)平臺(tái),讓AI在上面運(yùn)行。微軟擁有Windows和一大堆設(shè)備,特別是Xbox。最后一項(xiàng)資產(chǎn)就是建立一個(gè)開發(fā)者網(wǎng)絡(luò),讓他們?yōu)樽约旱钠脚_(tái)開發(fā)產(chǎn)品,向平臺(tái)付費(fèi)。
如果單看各項(xiàng)資產(chǎn),微軟碰到了強(qiáng)大的競爭對(duì)手。例如,F(xiàn)acebook擁有強(qiáng)大的會(huì)話平臺(tái),擁有信息APP,它還擁有最大的社交圖。谷歌的“大腦”可能更聰明一些,它有無數(shù)Android設(shè)備。如果將所有資產(chǎn)組合在一起觀察,就會(huì)知道微軟為什么這么自信了。陸奇稱:“將所有資產(chǎn)加在一起,我相信我們有資格引領(lǐng)未來?!?/p>
Skype翻譯器的故事
2年前,微軟曾經(jīng)召開Code Conference大會(huì),由此開始,微軟全面擁抱AI。當(dāng)時(shí)納拉德剛剛成為微軟CEO只有3個(gè)月,他現(xiàn)身講臺(tái),談?wù)摿宋④浀奈磥怼T谥v話結(jié)束時(shí),納拉德展示了Skype新功能。兩位微軟員工在講臺(tái)上講話,一個(gè)用英語,一個(gè)用德語,Skype實(shí)時(shí)翻譯,盡管兩人的語言不同,但是可以用Skype交流。演示很驚人,納拉德還宣布,到年底時(shí)新功能就會(huì)出現(xiàn)在產(chǎn)品中。
最開始時(shí),Skype翻譯器(Skype Translator)的開發(fā)團(tuán)隊(duì)有兩大擔(dān)憂。首先,微軟研究院一直以來沒有承擔(dān)將產(chǎn)品推向市場的義務(wù),研究人員擔(dān)心他們可能會(huì)失去追求科學(xué)突破的自由。
還有一個(gè)擔(dān)心在演示時(shí)已經(jīng)出現(xiàn),當(dāng)時(shí)的Skype翻譯器不夠好。微軟的語言模型是根據(jù)大量的正式語音開發(fā)的。Skype需要翻譯的雙向交流大不一樣,翻譯時(shí)會(huì)出現(xiàn)“不流利”的現(xiàn)象,當(dāng)講話者卡在一個(gè)詞匯上,或者退回去重新說一個(gè)句子時(shí),不流利的現(xiàn)象更嚴(yán)重。還有“代碼混用”問題,也就是說講話者在單個(gè)句子中使用多種語言,在英語之外這種現(xiàn)象很常見。如果用戶在唱歌系統(tǒng)也難以處理,當(dāng)一個(gè)人不斷向另一個(gè)人唱歌時(shí),計(jì)算機(jī)難以解析。
“基本上沒有什么效果?!标懫娣Q,“我們必須重新訓(xùn)練所有模型?!北M管如此,在納拉德的鼓勵(lì)之下,當(dāng)年12月陸奇團(tuán)隊(duì)還是發(fā)布了預(yù)覽版產(chǎn)品。第二年,產(chǎn)品開始大規(guī)模部署,供用戶免費(fèi)使用。陸奇稱納拉德是一名“激進(jìn)主義者”,項(xiàng)目最終讓人很滿意。陸奇稱:“當(dāng)你知道產(chǎn)品沒有什么用時(shí),團(tuán)隊(duì)士氣會(huì)變得很低落,會(huì)感到恐懼,我們必須幫助團(tuán)隊(duì)走過低谷。一旦走過去,就會(huì)發(fā)現(xiàn)有驚人的新東西開始出現(xiàn)?!?/p>
現(xiàn)在,微軟的系統(tǒng)可以在8種不同的語言之間翻譯會(huì)話,也就是說,系統(tǒng)可以支持56種不同的組合。系統(tǒng)的底層技術(shù)影響的不只是翻譯。微軟正在測試軟件,它可以記錄企業(yè)會(huì)議,實(shí)時(shí)翻譯成文本。如果有兩個(gè)人在對(duì)話,軟件也可以提取語音記錄,生成文本,還可以辨別兩人的講話。
“當(dāng)翻譯器第一次亮相時(shí)并不怎么好用,你不知道我們當(dāng)時(shí)有多沮喪?!标懫娣Q,“現(xiàn)在我們正在向高峰不斷邁進(jìn),我們正在處理語音和翻譯模型,尤其是語音模型,它們已經(jīng)相當(dāng)不錯(cuò)了。”
讓AI進(jìn)入Windows和Office
與此同時(shí),微軟還將AI資源傾注在最大的幾個(gè)產(chǎn)品中:Windows和Office。AI有一項(xiàng)功能很強(qiáng)大,它可以預(yù)測用戶的需求,Google Now也具備類似的功能。
微軟正在加快步伐,將AI植入桌面平臺(tái)。馬庫斯·阿什(Marcus Ash)負(fù)責(zé)Cortana的研發(fā)工作,他向我展示了模型版Windows,在很大程度上它是根據(jù)云計(jì)算開發(fā)的。當(dāng)阿什進(jìn)入開始(Start)菜單,Cortana彈出一些提示:對(duì)你而言有意義的名字,你經(jīng)常使用的文檔,常用法語詞匯的翻譯。只要你允許,Cortana可以將你的個(gè)人數(shù)據(jù)納入進(jìn)去,比如通訊錄、網(wǎng)絡(luò)搜索歷史。
Cortana每時(shí)每刻都在變化,例如,APP開發(fā)者可以知道程序到底是在早上最有用,還是在晚餐時(shí)最有用。阿什解釋稱:“只要你允許,利用與你有關(guān)的對(duì)話,有關(guān)的環(huán)境信息,Cortana可以加快操作速度,讓你感覺到一切盡在掌握之中,這才是我們真正感興趣的。在我們的用戶體驗(yàn)工作中,有許多與簡約、消除摩擦、展示智能的威力有關(guān)?!?/p>
有一個(gè)功能深受阿什的喜愛,它叫作“Commitments”。只要你允許,Outlook可以為你做筆記,到了周末時(shí)發(fā)給老板,如果發(fā)送不成功它會(huì)自動(dòng)提醒你。阿什說:“我的生活相當(dāng)復(fù)雜,我經(jīng)常會(huì)忘了一些事情,尤其是電子郵件?!彼€舉例說,最近他也曾忘記老板交待的事,幸虧Cortana及時(shí)提醒。
評(píng)論
查看更多