云知聲創(chuàng)始人黃偉
黃偉中,科大博士,上海交大生命科學(xué)技術(shù)學(xué)院博士后,畢業(yè)后任職摩托羅拉中國研究中心資深研究員,期間開發(fā)出了世界第一款手機聲紋認(rèn)證系統(tǒng)。后出任盛大創(chuàng)新院核心高管,并創(chuàng)建了語音分院。2013年底加入國內(nèi)人工智能引領(lǐng)企業(yè)云知聲任職首席執(zhí)行官,負(fù)責(zé)云知聲發(fā)展戰(zhàn)略和運營管理戰(zhàn)略規(guī)劃。自1999年起參與項目研究至今已獲得涉及醫(yī)療、管理信息系統(tǒng)、自然科學(xué)、語音、游戲等多個領(lǐng)域的產(chǎn)品成就,例如在2002到2004年間參與美國國家標(biāo)準(zhǔn)技術(shù)署說話人識別評測(NIST SRE)項目獲SRE主任務(wù)第一名,并獲得當(dāng)年最高的“金星獎”,也是現(xiàn)如今唯一一位能夠在NIST評測中連續(xù)兩年做keynote speaker的華人。獲MIT TR35 2007年度提名,2009年獲上海市十佳科技創(chuàng)業(yè)領(lǐng)軍人才。
云知聲創(chuàng)始人黃偉的成就
當(dāng)你還無法察覺的時候,很多改變?nèi)祟惖男录夹g(shù)已經(jīng)在無聲無息中蛻變、成長,誕生于上世紀(jì)50年代的人工智能就扮演著這樣的角色。
“互聯(lián)網(wǎng)女皇”瑪麗·米克爾在報告中大篇章的描述了語音識別交互帶來的改變,人工智能成為科技發(fā)展的重頭戲已經(jīng)毋庸置疑,物聯(lián)網(wǎng)場景下的應(yīng)用需求在不斷擴大,智能語音技術(shù)在智能家居、智能汽車、教育等領(lǐng)域的應(yīng)用逐步深入,帶動著智能語音產(chǎn)業(yè)規(guī)模的持續(xù)快速增長。
黃偉表示,PC互聯(lián)網(wǎng)時代,聯(lián)網(wǎng)設(shè)備主要是PC,移動互聯(lián)網(wǎng)時代,聯(lián)網(wǎng)設(shè)備主要是手機或平板。而到IOT時代,一切設(shè)備都可能聯(lián)網(wǎng),IOT聯(lián)網(wǎng)最大的特點是沒有屏幕,不像手機平板那樣以觸碰為主,第二,設(shè)備離人比較遠,這時候我們就希望用一種完全自然的,像人和人對話的方式來控制它們,所以,語音識別就成了解決這一痛點的最佳方案。
兩年的技術(shù)探索
2012年成立云知聲的時候,我們的具體方向仍然未定。當(dāng)時看到了移動設(shè)備的飛速發(fā)展,我們認(rèn)為可能未來在智能設(shè)備上,聲音會成為一種重要的交互方式。
當(dāng)時的數(shù)據(jù)庫非常的小。于是我們便一邊做數(shù)據(jù)搜集,一邊升級我們的算法。云知聲2012年6月成立,3個月后我們發(fā)布了基于傳統(tǒng)統(tǒng)計模型的第一代引擎。
我們的第一代引擎,將準(zhǔn)確率提升到了85%。當(dāng)時業(yè)界的領(lǐng)軍者科大訊飛(55.330, -1.79,-3.13%)的準(zhǔn)確率是80%。
2個月后我們的深度學(xué)習(xí)引擎上線,準(zhǔn)確率提升到了91%?;谶@個引擎,我們開發(fā)了微信上第一款語音輸入插件。插件上線第一周,激活用戶數(shù)超過5萬。
我們開發(fā)了一個開放的平臺,任何人、任何組織只要在我們的平臺上注冊,就可以免費使用我們的SDK(軟件開發(fā)工具包)。在你的APP里接入我的SDK,就可以免費調(diào)用我們的服務(wù)。
2013年底,我們的這個平臺上,接入的企業(yè)客戶數(shù)量達到接近一萬家。我們靠著這些用提供的數(shù)據(jù),不斷的進行數(shù)據(jù)迭代和算法優(yōu)化,我們的準(zhǔn)確率提升到了94%。如今,這個平臺上的企業(yè)客戶數(shù)達到了三萬家。
依托物聯(lián)網(wǎng)的商業(yè)化之路
云知聲成立之初的2年,主要精力都用在對技術(shù)模式的探索上。到了2014年,我們逐漸意識到,再好的技術(shù),只有當(dāng)它變成對用戶有價值的產(chǎn)品時,它才有商業(yè)價值。于是我們開始考慮商業(yè)化的路應(yīng)該怎么走。
2014年時,我們開始規(guī)劃云之聲未來的定位,定位是產(chǎn)品模式和業(yè)務(wù)模式的基礎(chǔ)。我們發(fā)現(xiàn)留給創(chuàng)業(yè)者的空間不多了,APP的紅利期已過,流量掌握在BAT手中。做與科大訊飛雷同的業(yè)務(wù),我們沒有科大訊飛身后強大的政府支持,很難在競爭中勝出。
最終,我們決定做物聯(lián)網(wǎng)(LOT)。物聯(lián)網(wǎng)在當(dāng)時是一個新興業(yè)務(wù),當(dāng)時BAT沒有涉及,科大訊飛也沒有相關(guān)的布局。再加上行業(yè)內(nèi)沒有已經(jīng)成功的壁壘,我們由此切入再適合不過。
此外,移動互聯(lián)網(wǎng)總有觸及天花板的一天。 當(dāng)移動互聯(lián)網(wǎng)觸及天花板的時候,一定會有新的機會出現(xiàn)。我們認(rèn)為物聯(lián)網(wǎng)可能就是這個機會。
做物聯(lián)網(wǎng)一定會面臨新的挑戰(zhàn),表象上的模式不同,基礎(chǔ)的模式也會不同。首先便是終端的變化,終端變得更加多元化,家里的冰箱、空調(diào)、洗衣機等,都將是智能化的。
因此,做物聯(lián)網(wǎng)一定要與硬件結(jié)合,甚至要與芯片結(jié)合。而很多設(shè)備是不插電的,這就要求同時做到低能耗。這種模式的轉(zhuǎn)變,需要許多底層的基礎(chǔ)變革來支撐。
所以2014年,為了做物聯(lián)網(wǎng),云知聲完成了兩個重要的舉措。首先是引入高通成為云知聲的戰(zhàn)略投資方。再加上內(nèi)部架構(gòu)的調(diào)整,成立了LOT事業(yè)部,占云知聲總?cè)藬?shù)的一半以上。
具體來說,我們還確定了新的產(chǎn)品形態(tài)。我們根據(jù)用戶場景倒推,未來用戶的形態(tài)應(yīng)該是,比如,在客廳的沙發(fā)上,自然的與空調(diào)對話,而不需要湊上去和它交流。
場景設(shè)定好之后,倒推需要什么樣的產(chǎn)品,里面需要哪些技術(shù)。我們第一個落地的客戶是樂視,樂視的第三代TV,也是國內(nèi)第一款做遠距離自然語音交互的TV,2015年5月份開始在市場上銷售。
現(xiàn)在我們的產(chǎn)品已經(jīng)被國內(nèi)幾乎所有的大廠接受,像格力、美的、海爾、海信、TCL等都是我們的客戶。而且,到目前為止,我們是國內(nèi)唯一能做到這個的廠商。
落地醫(yī)療行業(yè)
除了硬件方面的探索,另外我們希望選擇一些垂直行業(yè)進行落地,最終我們選擇了醫(yī)療行業(yè)。
之所以選擇醫(yī)療行業(yè),首先,醫(yī)療是一個很大的市場。并且,目前平均每個醫(yī)生每天整理病例要花掉3.5到4個小時。我們開發(fā)了一套系統(tǒng),醫(yī)生可以利用麥克風(fēng)輸入病例。北京的協(xié)和醫(yī)院引進我們的系統(tǒng)后,平均每個醫(yī)生每天整理病例的時間從超過3小時,降低到了1個小時。
另外,在和協(xié)和醫(yī)院院長聊天的過程中,他告訴我,其實有80%的誤診是模板拷貝造成的。每個人的體質(zhì)不同,病癥不同,模板無法準(zhǔn)確的記錄病人的情況。利用我們的系統(tǒng),醫(yī)生可以因人而異的進行病理錄入。
未來我們希望將這個產(chǎn)品集中精力和資源,把醫(yī)療行業(yè)做深、做透。目前我們的產(chǎn)品已經(jīng)進入了包括北京協(xié)和醫(yī)院在內(nèi)的幾十家醫(yī)院。而國內(nèi)僅三甲醫(yī)院就有1500家,中醫(yī)診所四萬多家,還有更多的非三甲醫(yī)院。我們可以看到,未來這個市場是非常龐大的。
另外,我們可以將這個產(chǎn)品復(fù)制到任何需要文字錄入的行業(yè),比如,司法領(lǐng)域可以,傳媒領(lǐng)域也可以。
目前云知聲的精力主要用在三個方面,一是,核心技術(shù)的儲備與研發(fā);二是,業(yè)務(wù)的成長,過去2年的商務(wù)探索,我們的產(chǎn)品形態(tài)和業(yè)務(wù)模式都相對比較清晰了,未來要做的是盡快的擴張;三是,加強公司治理。
堅持才有收獲
作為一家專注于物聯(lián)網(wǎng)人工智能服務(wù)的公司,自2012年6月成立以來,云知聲利用機器學(xué)習(xí)平臺,在語音技術(shù)、知識計算、大數(shù)據(jù)分析等領(lǐng)域建立了領(lǐng)先的核心技術(shù)體系。而在應(yīng)用層面,已形成「云端芯」生態(tài)閉環(huán)。
云知聲曾連續(xù)兩年入選福布斯中國最快科技成長公司50強企業(yè),同時也是中國AI行業(yè)成長最快的創(chuàng)業(yè)公司之一。
今年3月,云知聲推出的專門針對智能家居的AIOS@Home(人工智能操作系統(tǒng))。
此次,雷鋒網(wǎng)新智造采訪了云知聲創(chuàng)始人黃偉,跟他聊了聊過去一年云知聲的發(fā)展、現(xiàn)狀、公司今年的目標(biāo)以及他對人工智能行業(yè)前景的看法。
創(chuàng)業(yè)維艱,尤其對處在萌芽階段的AI行業(yè)更是如此。云知聲創(chuàng)始人黃偉稱創(chuàng)業(yè)五年來每一年都如履薄冰,每一天都過得非常煎熬。
因為作為一家公司的CEO每天都要考慮很多事情、作出決定,每一個重大決定都有可能關(guān)乎公司未來發(fā)展方向。這不是原來他在大公司單純的作技術(shù)leader時只是負(fù)責(zé)一些工作安排所能比較的,現(xiàn)在他更多要考慮公司出路、人事和柴米油鹽等方方面面的事情,復(fù)雜程度不可同日而語。
在聽起來很「高大上」的AI行業(yè),實際的發(fā)展卻困難重重。AI行業(yè)的產(chǎn)品難以落地,造成的結(jié)果是大多數(shù)AI公司都處于虧損狀態(tài)。作為一家AI創(chuàng)業(yè)公司,如果沒有其他業(yè)務(wù)反哺,就很難在像Google和Amazon這些巨頭們的夾縫之中存活下來。
而這些公司要想獲取生存空間,就需要把有限的資源投入到公司正確的戰(zhàn)略方向上,把技術(shù)做得更加商業(yè)化并持續(xù)產(chǎn)出。要做到這些并不容易,「到目前為止,我也不認(rèn)為這個問題得到了很好的解決」,黃偉說。
即便如此,黃偉向雷鋒網(wǎng)新智造表示2016年他的收獲還是很大,過去一年云知聲的發(fā)展讓他信心十足。
“我們從技術(shù)的迭代到產(chǎn)品模式的探索,再到商業(yè)模式的探索,去年我們算是初步走通了,至少我們把技術(shù)變成了產(chǎn)品,而且把這個產(chǎn)品形成了主營業(yè)務(wù),這個是比較大的收獲。當(dāng)然,過程是煎熬的,AI技術(shù)現(xiàn)在還是不成熟的,把不成熟的技術(shù)變成可商業(yè)化的產(chǎn)品,這是個比較大的挑戰(zhàn)。產(chǎn)品比較新,客戶對這個是沒有統(tǒng)一標(biāo)準(zhǔn)的,你要不斷滿足他會對你提出的無休止訴求。今天你看到商業(yè)落地的背后,其實是經(jīng)過無數(shù)糾結(jié)和不斷地打磨后的結(jié)果,我們對落地是非常有信心的?!?/p>
「創(chuàng)業(yè)的過程中重要的是堅持」,在信心這一點上,團隊的凝聚力和戰(zhàn)斗力也給了他很大支持。只要戰(zhàn)略方向明確,他相信堅持下去才會有所收獲。
AI的落地有諸多障礙,但技術(shù)領(lǐng)先于整個行業(yè)
在具體的業(yè)績方面,黃偉表示對去年云知聲的業(yè)績比較滿意。
但過程中會有一些困難,一方面是云知聲在硬件上的考慮不足,他們在供應(yīng)鏈和成本等方面遭遇了一些障礙。
另一方面,產(chǎn)品標(biāo)準(zhǔn)主要由客戶主導(dǎo),這個標(biāo)準(zhǔn)要遠遠高于同行業(yè)其他公司,而嚴(yán)格的產(chǎn)品測試也拉長了生產(chǎn)周期。
除了產(chǎn)品標(biāo)準(zhǔn)高,云知聲在技術(shù)上的優(yōu)勢也領(lǐng)先于整個行業(yè)。尤其在智能家居領(lǐng)域的技術(shù)指標(biāo)上,和其他公司對比,黃偉稱云知聲的優(yōu)勢「幾乎是碾壓式的」。
“事實上,云知聲在AI領(lǐng)域的落地,不只是戰(zhàn)略上的提前布局,更是用行業(yè)領(lǐng)先的技術(shù)去撬動這個市場?!?/p>
營收年內(nèi)將突破9位數(shù),業(yè)務(wù)在不斷擴張
據(jù)黃偉透露,云知聲今年的營收預(yù)計會突破9位數(shù)。在融資方面,今年會啟動新一輪融資。云知聲獨立IPO也會很快提上議程,他希望能在兩三年內(nèi)上市。
黃偉也透露了云知聲今年的業(yè)績目標(biāo),他表示所有的目標(biāo)都是可預(yù)期的,其中大部分都在執(zhí)行去年已有的訂單。
雷鋒網(wǎng)新智造了解到,在教育評測領(lǐng)域云知聲之前大約每天1億次的調(diào)用量,而整個平臺的調(diào)用量每天2億多次,這在國內(nèi)排在前三位;智能車載領(lǐng)域,云知聲覆蓋到了600多萬臺終端,占據(jù)整個后裝市場接近70%的份額;在醫(yī)療服務(wù)方面,目前已跟全國30多家醫(yī)院簽約;而在智能家居上,云知聲也在眾多AI公司中遙遙領(lǐng)先。
“今年云知聲計劃在智能家居達到100萬臺的出貨量,教育評測平臺調(diào)用量上達到3~4億次,醫(yī)療領(lǐng)域會新增100家醫(yī)院進行合作,智能車載會覆蓋到1000萬臺終端?!?/p>
黃偉告訴雷鋒網(wǎng)新智造,雖然云知聲業(yè)務(wù)在不斷擴張,但公司目前暫時不會擴展到其他領(lǐng)域,而是依靠品牌優(yōu)勢先在已有項目上進行深度挖掘,從而擴大市場占有率。在人員配備方面,公司目前200人左右,但他表示并不會貿(mào)然大規(guī)模招攬人才,人員會適度擴張10%左右。
看到AI前景不是瞎蒙的,真正的AI絕對不止是深度學(xué)習(xí)
在2012年黃偉決定創(chuàng)業(yè)伊始,當(dāng)時APP創(chuàng)業(yè)正如火如荼,但云知聲的定位就是IOT(物聯(lián)網(wǎng))的AI服務(wù)商,從而一直堅持到如今AI的浪潮襲來。
黃偉認(rèn)為,在現(xiàn)在看來很有遠見的堅持是在當(dāng)時理性而清楚地考慮后形成的結(jié)果。在當(dāng)時不被投資人看好的情況下,毅然決定做toB,因為他清楚地認(rèn)識到這一波AI創(chuàng)業(yè)潮里有工業(yè)技術(shù)背景的并不多,而他在大學(xué)畢業(yè)后就加入了摩托羅拉等公司,他們在技術(shù)和市場上有一定了解和積累。
在2006年深度學(xué)習(xí)鼻祖Hinton教授提出這個概念之后,微軟在2011年間將它應(yīng)用到語音識別領(lǐng)域,當(dāng)時黃偉的師兄俞棟在意大利佛羅倫薩交流時曾告訴他這是趨勢,這給了他一些啟發(fā)。
而在2012年12月28日云知聲的深度學(xué)習(xí)引擎上線后,它也隨即成為了國內(nèi)深度學(xué)習(xí)的引領(lǐng)者。
“我們看到AI的前景并不是瞎蒙的,而是我們的技術(shù)背景和對這種趨勢的敏感?!?/p>
談到AI未來的發(fā)展,黃偉悲觀和樂觀兼而有之。悲觀的一點是,「在AI行業(yè)有江湖騙子在欺騙大家」,黃偉對此直言不諱。他認(rèn)為人們嘗試用深度學(xué)習(xí)解釋一些東西,但大腦并不是這樣的,「人會舉一反三,可以自學(xué)習(xí),但機器不會。」
黃偉還稱真正的AI不是深度學(xué)習(xí)或者絕對不止是深度學(xué)習(xí),強人工智能還離我們比較遠,但也不排除在我們有生之年實現(xiàn)的可能,因為它的突破不光是算法上的突破,還包括計算能力和知識結(jié)構(gòu)上的突破。
另一方面,黃偉的樂觀在于對AI行業(yè)里面一些良心企業(yè)的信心,他認(rèn)為這些公司會取得技術(shù)突破,從而帶動和加快AI的發(fā)展進程。在技術(shù)的迭代上,他的態(tài)度較為理性。
“跟機器人談戀愛這是很難實現(xiàn)的,但讓機器像助理一樣解決問題,這在三年之內(nèi)很容易實現(xiàn)。估高(AI)預(yù)期的目標(biāo)我是比較悲觀的,但很多可執(zhí)行的方向我認(rèn)為比我們想象的可能都要快。”
-
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112700 -
云知聲
+關(guān)注
關(guān)注
0文章
188瀏覽量
8399 -
黃偉
+關(guān)注
關(guān)注
0文章
3瀏覽量
1776
發(fā)布評論請先 登錄
相關(guān)推薦
評論