互聯(lián)網(wǎng)無疑成為我們生活、學(xué)習(xí)、工作不可缺少的平臺。而伴隨互聯(lián)網(wǎng)產(chǎn)生的搜索引擎,幾乎是每個人上網(wǎng)都會使用到的。搜索引擎自誕生以來,依托于爬蟲、檢索排序、大數(shù)據(jù)處理、自然語言處理等多種技術(shù),為檢索用戶提供信息服務(wù)。
目前,隨著人工智能技術(shù)的快速發(fā)展,得益于自然語言理解、知識圖譜等技術(shù)的支撐,傳統(tǒng)的信息檢索正在向新一代智能搜索轉(zhuǎn)變。“新一代搜索將主要分為兩個方向,一個方向是從通用搜索進(jìn)入行業(yè)企業(yè),成為行業(yè)的智能決策支撐;另一個方向則在更遙遠(yuǎn)的未來,搜索是在個人端的技術(shù)演進(jìn),成為個人智能信息助手?!?一覽群智CEO胡健表示。
那么,從傳統(tǒng)信息搜索到新一代智能搜索,底層技術(shù)有什么改變?從感知智能到認(rèn)知智能,企業(yè)又應(yīng)該從何入手?筆者近日采訪了一覽群智CEO胡健,就新一代智能搜索,以及其中涉及的人工智能技術(shù)進(jìn)行了深入探討。
傳統(tǒng)信息搜索的現(xiàn)狀與瓶頸
搜索技術(shù)的架構(gòu)和交互界面已經(jīng)有30年沒有改變過。由于搜索都是采用關(guān)鍵詞檢索的方法,無法做到完整的描述整個信息需求,因此,搜索系統(tǒng)不會主動進(jìn)行交互和引導(dǎo),只是高度依賴用戶的表達(dá)能力,因此人們得到的信息也是千人一面。
此外,搜索的核心技術(shù)也有10年沒有重大進(jìn)步,傳統(tǒng)信息檢索與挖掘算法缺乏對底層數(shù)據(jù)與認(rèn)知基礎(chǔ)的理解,并沒有充分解決該領(lǐng)域核心問題,導(dǎo)致搜索結(jié)果難以解釋,算法效率難以提升。
傳統(tǒng)的搜索是相對傻瓜化的通用決策引擎。搜索的本質(zhì)是整合了互聯(lián)網(wǎng)的海量、多源、異構(gòu)的數(shù)據(jù)理解網(wǎng)頁內(nèi)容,同時理解用戶的查詢需求,最終將兩方進(jìn)行匹配。在通用情況下,搜索引擎不會切分特別細(xì)致,這就造成交互形態(tài)是簡單的。此外,由于通用搜索引擎對于效率要求高,對網(wǎng)頁理解也相對簡單,因此,大家通過搜索引擎得到的結(jié)果也是近似的。
因此,搜索引擎需要升級轉(zhuǎn)型,下一代智能搜索應(yīng)運(yùn)而生。隨著人工智能技術(shù)的快速發(fā)展,新一代智能搜索正在成為可能。
新一代智能搜索加速探索
在一覽群智首席科學(xué)家文繼榮看來,智能信息檢索與挖掘是搜索的發(fā)展方向,而其具體表現(xiàn)現(xiàn)實(shí)是智能信息助手,它將取代搜索引擎成為連接人與信息的新工具,用存儲、計算和智能拓展人的能力,構(gòu)建具有超級記憶力、知識能力和分析能力的“超級助手”,能夠隨時、隨地方便地獲取高質(zhì)量相關(guān)信息和知識。文繼榮不僅是一覽群智首席科學(xué)家,還是中國人民大學(xué)信息學(xué)院院長、中國人民大學(xué)高瓴人工智能學(xué)院院長,他正在領(lǐng)導(dǎo)“智能信息檢索與挖掘”團(tuán)隊(duì),致力于做出“基于自然交互的個人智能信息助手”,取代傳統(tǒng)的搜索引擎,成為下一代信息獲取工具。并將在這個過程中,在理論基礎(chǔ)、算法模型、系統(tǒng)三個層面展開研究,進(jìn)行源頭創(chuàng)新。
智能信息助手是可以有多重形態(tài),可以是機(jī)器人,也可以是無形的。它有大腦,可以理解人們所提出的需求,給予回應(yīng),并且這種對話可以是多輪深度的。但是,現(xiàn)如今還達(dá)不到智能信息助手的狀態(tài),因?yàn)?,智能信息助手要與人形成溝通,理解人說話的意思,是需要有“腦子”。
“新一代搜索的另外一個形態(tài)我們將更快看到,那就是將通用搜索應(yīng)用在行業(yè)企業(yè)中?!焙≌f,當(dāng)前的人工智能的智力是相當(dāng)于12歲的孩子,推理能力還相對較弱,但是其腦容量特別大,記憶力特別好,可以結(jié)合其優(yōu)勢來找到適合的場景,也就是智能決策引擎。
智能決策引擎不是簡單的進(jìn)行搜索,而是將不同渠道、異構(gòu)的數(shù)據(jù)整合,將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù),再關(guān)聯(lián)企業(yè)業(yè)務(wù)流程,從而進(jìn)行分析預(yù)測,輔助企業(yè)進(jìn)行決策。胡健強(qiáng)調(diào),一定要加上“輔助”二字,因?yàn)楝F(xiàn)階段,完全通過機(jī)器自動完成還沒有實(shí)現(xiàn)。
目前,智能決策引擎可以替代中低端腦力勞動工作者,例如公安和司法領(lǐng)域,智能決策引擎能夠更好的整合案情案件數(shù)據(jù)、結(jié)構(gòu)化視頻數(shù)據(jù),做好事前預(yù)警、事中跟蹤和事后研判。其次,可以將專家的經(jīng)驗(yàn)變成模型,用模型來替代偏分析判斷類、輔助決策類的工作,從而可以替代偏重復(fù)性或半重復(fù)性的中檔腦力勞動者。
感知智能向認(rèn)知智能演進(jìn)
隨著移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術(shù)的快速發(fā)展,圖像、語音、視頻等與感知相關(guān)的感知能力在快速發(fā)展。目前,人工智能正在向能夠理解、思考、判斷、分析等認(rèn)知智能延伸。人工智能的發(fā)展到了由感知智能邁向認(rèn)知智能的界點(diǎn)。
如今的人工智能還是弱人工智能狀態(tài),沒有所謂的大腦,若想形成大腦,最核心的就是要有知識。將人類的各種經(jīng)驗(yàn)沉淀,形成模型,讓機(jī)器可以讀得懂并且使用,最終成為生產(chǎn)力,這就是認(rèn)知智能。認(rèn)知智能技術(shù)是智能信息助手實(shí)現(xiàn)基礎(chǔ)。
胡健表示,目前,認(rèn)知智能最大的難題就是構(gòu)建知識。如今知識有很多,可以構(gòu)建很多知識圖譜,但是開放性知識圖譜還很難形成。原因有二:一是關(guān)聯(lián)密度不足;二是知識的干凈程度不夠。但是,在專用領(lǐng)域,可以通過人工校驗(yàn)的方式,來構(gòu)建相對較準(zhǔn)確的行業(yè)知識圖譜。
過去,構(gòu)建知識圖譜基本都是依靠人工,隨著數(shù)據(jù)的在線化,知識圖譜可以由機(jī)器以自動的方式來進(jìn)行構(gòu)建,而機(jī)器構(gòu)建的知識圖譜的數(shù)量級也會更大。此外,圖數(shù)據(jù)庫的快速發(fā)展,也可以將知識圖譜中的圖數(shù)據(jù)進(jìn)行存儲。第三,得益于大數(shù)據(jù)的發(fā)展,海量數(shù)據(jù)的出現(xiàn)以及計算能力的提升,使得知識圖譜的構(gòu)建更加精準(zhǔn)。
胡健認(rèn)為,人工智能要形成閉環(huán),需要感知智能與認(rèn)知智能相結(jié)合才有價值。但是,現(xiàn)階段,認(rèn)知水平還有限,機(jī)器還不能完全像人一樣有大腦來進(jìn)行決策。因此,重復(fù)式的、推理要求較低、沒有歧義需求的封閉場景,是完全可以用認(rèn)知智能的技術(shù)來解決的。
一覽群智的“超”能力
除了在學(xué)術(shù)界有著超前的理論研究以外,一覽群智還將在現(xiàn)階段幫助用戶落地相關(guān)人工智能技術(shù)。
一覽群智于2015年11月成立,是一家以自然語言處理和知識圖譜等認(rèn)知智能技術(shù)為核心的人工智能公司,為客戶提供一站式AI產(chǎn)品和行業(yè)解決方案。在一覽群智公司里,除了有文繼榮教授帶領(lǐng)的技術(shù)研究團(tuán)隊(duì),為智能信息助手的未來發(fā)展奠定基礎(chǔ)以外,還有胡健帶領(lǐng)的產(chǎn)品應(yīng)用落地團(tuán)隊(duì),來確保行業(yè)智能決策引擎落地。
胡健將公司推出的四大產(chǎn)品稱作為智能搜索的四大底座,從感知智能到認(rèn)知智能形成閉環(huán)?;谧匀徽Z言處理平臺智語產(chǎn)品來理解用戶的意圖;知識圖譜構(gòu)建平臺智圖,讓機(jī)器學(xué)會知識;交互式關(guān)聯(lián)分析平臺智策,復(fù)制行業(yè)專家級分析推理能力,從而達(dá)到人機(jī)有效協(xié)同工作;最后通過機(jī)器學(xué)習(xí)與智能標(biāo)注平臺智慧來進(jìn)行學(xué)習(xí),最終打造成Elens智能決策平臺。
胡健表示,未來的搜索可以在企業(yè)或者行業(yè)內(nèi)部來使用。但是,并不是每家企業(yè)都適用。首先,企業(yè)需要有數(shù)據(jù)。數(shù)據(jù)是一切的基礎(chǔ),沒有數(shù)據(jù)是無法構(gòu)建知識圖譜,也就無法形成企業(yè)內(nèi)部的搜索。第二,企業(yè)信息化程度要相對較高,如果企業(yè)信息化程度較低,很多業(yè)務(wù)流程還沒有完善,在企業(yè)信息化程度不高時做出來的搜索也是徒勞。第三是資金實(shí)力相對雄厚,畢竟構(gòu)建知識圖譜并不是一件便宜的事情,因此企業(yè)需要有一定的資金支持才能完成。
目前,依托于Elens智能決策平臺,結(jié)合企業(yè)內(nèi)部以及行業(yè)公開數(shù)據(jù),一覽群智打造出金融智能決策解決方案和政企智能決策解決方案,滿足金融行業(yè)和政企用戶的需求。
結(jié)語
現(xiàn)如今的人工智能屬于初級的探索階段,就像十年前的云計算,業(yè)界也出現(xiàn)很多做人工智能的公司,頗有百花齊放的狀態(tài)。胡健認(rèn)為,人工智能的技術(shù)都只是一個點(diǎn),人工智能企業(yè)需要通過這一個點(diǎn),幫助用戶打造完整的解決方案,從而幫助企業(yè)進(jìn)行數(shù)字化轉(zhuǎn)型升級。
的確,如今從事人工智能領(lǐng)域的公司眾多,都在圍繞不同場景幫助用戶提供服務(wù),而此階段的人工智能尚處于初級階段,無論是學(xué)術(shù)研究、還是服務(wù)提供商,乃至企業(yè)應(yīng)用,都需要攜手推進(jìn),加速人工智能技術(shù)的落地,才能產(chǎn)生出更大的價值。
責(zé)任編輯:ct
評論
查看更多