王小川介紹,AI開始使得搜狗搜索和輸入法更上一個(gè)臺(tái)階,搜狗要打造以語言為核心的人工智能布局。本次會(huì)議,王小川還發(fā)布兩款A(yù)I產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆。
搜狗有兩大核心產(chǎn)品:搜狗搜索和搜狗輸入法。搜狗搜索是中國第二大搜索引擎,搜索份額占17.8%,也是全球第三大搜索引擎。同時(shí)搜狗搜索也在非常快地增長,最近三年在移動(dòng)端搜索流量上漲470%。
搜狗輸入法是全球最大的輸入法,每年有超過900億次中文輸入次數(shù),是手機(jī)第三大應(yīng)用,僅次于微信和QQ,過去三年移動(dòng)端日活用戶增長136%。
1月24日下午,2018搜狗合作伙伴大會(huì)在北京國貿(mào)大酒店舉行。搜狗CEO王小川難掩內(nèi)心之愉悅與輕松。因?yàn)榫驮谝粋€(gè)多月前(確切地說是2017年11月9日),搜狗成功登陸紐交所,首日市值53億美元。
王小川介紹,AI開始使得搜狗搜索和輸入法更上一個(gè)臺(tái)階,搜狗要打造以語言為核心的人工智能布局。本次會(huì)議,王小川還發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆。
以語言為核心的人工智能布局
搜狗以語言為核心,分成兩個(gè)層面。一方面叫做自然交互,即語音識(shí)別、語音合成,還有圖像識(shí)別和合成;另一方面是知識(shí)計(jì)算,比如問答技術(shù)、翻譯技術(shù)。這些技術(shù)在搜狗里面進(jìn)行落地,并且開放給一些合作伙伴共建這樣生態(tài)。
具體而言,搜狗的AI布局可以分為五個(gè)方面:聽覺、視覺、對(duì)話、問答、翻譯。
1、聽覺
包括語音識(shí)別、語音合成、聲紋識(shí)別。王小川介紹,搜狗語音識(shí)別是全球最大在線語音識(shí)別提供商,每天有三億次語音識(shí)別請(qǐng)求,服務(wù)量數(shù)據(jù)巨大,輸入法也有豐富的場(chǎng)景。
除語音識(shí)別以外,搜狗也會(huì)做語音合成技術(shù),在語音合成當(dāng)中也有個(gè)性化能力,還提供核心的情感遷移技術(shù)。
2、視覺
包括OCR/識(shí)圖、唇語識(shí)別和狗臉識(shí)別。圖像識(shí)別和合成也是和語言相關(guān)的能力,第一方面就是OCR,搜狗每天有超過兩百萬次OCR請(qǐng)求,搜狗提供語音輸入、輸入鍵盤和OCR,只要一拍一掃描,就能用文字高速識(shí)別和輸入。
唇語識(shí)別即將語音和圖像結(jié)合,去年在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會(huì)上搜狗發(fā)布了唇語識(shí)別系統(tǒng),這套系統(tǒng)通過圖像,不需要麥克風(fēng),只需要攝像頭打在你的嘴上,通過后面圖像模型和后面語言模型獲得所有內(nèi)容。今天唇語識(shí)別能力大大超越超過人。
跟圖像更多有關(guān)系的地方,是定向的個(gè)性優(yōu)化,做狗臉識(shí)別,給你愛犬拍照,系統(tǒng)會(huì)精確告訴你是什么狗,搜狗會(huì)把這個(gè)技術(shù)放在搜索引擎里面去提供能力。
3、 問答、對(duì)話
王小川說:“在過去十年中我們做了很多,包括問答技術(shù)、對(duì)話技術(shù),不斷跟我們搜索引擎和輸入法進(jìn)行結(jié)合?!?/p>
輸入法會(huì)走向?qū)υ?,IPO那會(huì)兒,他每天一起床就有上千條微信發(fā)過來,如果輸入法能夠根據(jù)上下文,以個(gè)性化方式生成有自己特色的回答,讓人選擇,會(huì)非常有幫助。
經(jīng)過高考人都知道,我們做填空題比選擇題難度更大,選擇題讓你選輕松很多,輸入法其中一個(gè)路徑是把這樣一個(gè)讓大家輸入的填空題,變成了選擇題。
4、翻譯
王小川表示,翻譯技術(shù)走向?qū)嵱没粊営谌祟惏l(fā)明電,同樣是歷史突破,今天各個(gè)國家沖突,各個(gè)之間不信任是因?yàn)檎Z言和文化引起,一旦翻譯技術(shù)被解決掉,我們可以很容易獲得全球信息,國外人也知道我們的內(nèi)容,世界會(huì)發(fā)生變化。
搜狗的使命是讓表達(dá)和獲取信息更簡單,有了翻譯技術(shù)之后有了新的更大的進(jìn)展,實(shí)現(xiàn)讓跨國表達(dá)和獲取信息變得更簡單。
發(fā)布兩大AI產(chǎn)品:搜狗旅行翻譯寶和搜狗速記翻譯筆
目前市場(chǎng)上的AI翻譯產(chǎn)品大部分是云端翻譯,難以解決上網(wǎng)要漫游費(fèi)和網(wǎng)絡(luò)不穩(wěn)定的問題。搜狗旅行翻譯寶、搜狗速記翻譯筆結(jié)合了神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯、語音識(shí)別、麥克風(fēng)陣列、圖像識(shí)別等多項(xiàng)技術(shù)。
王小川說,搜狗有自己的離線翻譯技術(shù),而且使得這樣一個(gè)技術(shù)在終端設(shè)備里面執(zhí)行,在離線模式下壓縮,使離線模型壓縮是在線模型的五分之一,在手機(jī)或者其它終端里面,壓縮程度為三十五分之一。這樣儲(chǔ)存問題和識(shí)別得到解決,模型精度接近無損,并且實(shí)時(shí)響應(yīng),這也是業(yè)界領(lǐng)先的神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)。
搜狗旅行翻譯寶主要解決了出境旅游時(shí)翻譯APP存在的“網(wǎng)絡(luò)不好”與“翻譯不準(zhǔn)”兩大痛點(diǎn),支持文本翻譯、對(duì)話翻譯、語音翻譯、實(shí)景翻譯等多種翻譯模式,中英離線翻譯能力讓用戶在未聯(lián)網(wǎng)時(shí)也能使用。
在離線圖像識(shí)別里面,要求服務(wù)器在沒有網(wǎng)絡(luò)情況下也可以工作,而且要解決很多實(shí)景問題,比如在拍路牌和菜單的時(shí)候,圖片里面會(huì)有復(fù)雜背景,有光線問題,圖片還可能扭曲有弧度,搜狗是先在翻譯APP里面做嘗試,進(jìn)行數(shù)據(jù)優(yōu)化,然后放在離線翻譯機(jī)里面。
翻譯筆則針對(duì)了外語學(xué)習(xí)場(chǎng)景,同傳語音翻譯實(shí)現(xiàn)實(shí)時(shí)對(duì)話,即說即翻的功能。兩款產(chǎn)品均搭配了雙麥克風(fēng)陣列降噪,讓語音識(shí)別與翻譯更準(zhǔn)確,同時(shí)提供英日韓俄德等17種翻譯語言,覆蓋主要出游國家。目前,搜狗旅行翻譯寶定價(jià)為1498元,搜狗速記翻譯筆定價(jià)299元,將于3月12日在京東首發(fā)。
-
搜狗
+關(guān)注
關(guān)注
0文章
90瀏覽量
13931 -
AI
+關(guān)注
關(guān)注
87文章
30898瀏覽量
269133 -
人工智能
+關(guān)注
關(guān)注
1791文章
47282瀏覽量
238536
原文標(biāo)題:王小川:搜狗以語言為核心的人工智能布局
文章出處:【微信號(hào):gh_211d74f707ff,微信公眾號(hào):重慶人工智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論