0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種改變標(biāo)準(zhǔn)的谷歌關(guān)鍵詞搜索的新方式

DPVg_AI_era ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-04-17 11:28 ? 次閱讀

昨天,谷歌發(fā)布“Talk to Books”(撩書??)和一個(gè)名為Semantris的游戲。這兩項(xiàng)都是基于自然語(yǔ)言文本理解,用戶能夠憑語(yǔ)義而非關(guān)鍵詞來(lái)實(shí)現(xiàn)搜索功能。這些創(chuàng)新來(lái)源于“在向量空間中表示語(yǔ)言”想法的延伸,以及詞向量模型的發(fā)展。

未來(lái)的搜索,可能不需要輸入關(guān)鍵詞,直接表達(dá)想法就好。

谷歌昨晚放出大招:上線Semantic Experiences(語(yǔ)義體驗(yàn))網(wǎng)站,網(wǎng)站有兩項(xiàng)特殊功能,一個(gè)是“Talk to Books”(撩書??),一個(gè)是名為Semantris的語(yǔ)義聯(lián)想游戲。

這兩個(gè)大招都是基于自然語(yǔ)言文本理解,用戶能夠憑語(yǔ)義而非關(guān)鍵詞來(lái)實(shí)現(xiàn)搜索功能。

過(guò)去幾年里,自然語(yǔ)言理解(Natural language understanding)有了很大發(fā)展,部分原因是詞向量(word vectors)的發(fā)展使得算法能夠根據(jù)實(shí)際語(yǔ)言使用的例子來(lái)理解單詞之間的關(guān)系。這些向量模型根據(jù)概念和語(yǔ)言之間的等價(jià)性、相似性或相關(guān)性將語(yǔ)義上相似的短語(yǔ)映射到相近的點(diǎn)。去年,谷歌已經(jīng)使用語(yǔ)言的分層向量模型(hierarchical vector models)改進(jìn)了Gmail的智能回復(fù)。

當(dāng)“Talk to Books”時(shí),只需要輸入模糊的詞匯,算法模型會(huì)在超過(guò)10萬(wàn)本書中搜索對(duì)應(yīng)的每一個(gè)句子,以查找最有可能在對(duì)話中匹配的書籍,擺脫了以往通過(guò)書名或作者的搜索方式。

“Semantris”是一個(gè)單詞語(yǔ)義聯(lián)想游戲,當(dāng)輸入單詞時(shí),游戲會(huì)對(duì)屏幕中所有單詞進(jìn)行評(píng)分,簡(jiǎn)單有趣。

這篇博客由著名的未來(lái)學(xué)家、谷歌研究的工程總監(jiān)Ray Kurzweil和產(chǎn)品經(jīng)理Rachel Bernstein發(fā)布,博客地址:

https://research.googleblog.com/2018/04/introducing-semantic-experiences-with.html?m=1

游戲試玩地址:

https://research.google.com/semantris/

谷歌還公開(kāi)了論文“Universal Sentence Encoder”,論文中詳細(xì)描述了這些示例所使用的模型。此外,谷歌Semantic Experiences網(wǎng)站還在TensorFlow平臺(tái)上提供了一個(gè)預(yù)先訓(xùn)練好的模型供其他研究人員進(jìn)行實(shí)驗(yàn)。

不用關(guān)鍵詞,輕松去“撩書”

“Talk to Books”可以讓用戶與用機(jī)器學(xué)習(xí)訓(xùn)練的算法進(jìn)行對(duì)話,該算法可以從人寫的文本中找到相關(guān)段落的答案。

“撩書”的方法很簡(jiǎn)單:你只要輸入一句話,這句話可以是一個(gè)陳述句或一個(gè)疑問(wèn)句,然后而“Talk to Books”會(huì)在書中找到相應(yīng)的句子,完全不依賴于關(guān)鍵字匹配。

比如,問(wèn)“為什么天空是藍(lán)色的?”你會(huì)得到很多不同的答案,這些答案都是在清晰的文本中顯示出來(lái)的,并且顯示來(lái)自于關(guān)于這個(gè)主題的書籍。

這種做法改變了以往使用標(biāo)準(zhǔn)的谷歌關(guān)鍵詞搜索的方式,并且也不需要必須點(diǎn)擊鏈接并解析文章或網(wǎng)頁(yè)。

此外,“Talk to Books”的Web界面非常整潔、完美(更沒(méi)有競(jìng)價(jià)排名的醫(yī)療小廣告)。

Kurzweil和Berstein說(shuō),這個(gè)模型接受了10億次類似的訓(xùn)練,比如對(duì)句子進(jìn)行分析,并學(xué)會(huì)識(shí)別出好的反應(yīng)可能是什么樣的。“一旦你問(wèn)了你的問(wèn)題(或者做了一個(gè)陳述),這些工具就會(huì)在超過(guò)10萬(wàn)本書中搜索所有的句子,找出那些根據(jù)句子層面的語(yǔ)義含義對(duì)你的輸入做出反應(yīng)的句子。你輸入的和你得到的結(jié)果之間的關(guān)系沒(méi)有預(yù)先定義的規(guī)則。

不過(guò),“Talk to Books”并不是最完美的。TheVerge報(bào)道稱,這個(gè)工具更適合回答原始的事實(shí)問(wèn)題,而在處理復(fù)雜的地緣政治問(wèn)題或現(xiàn)代文化和歷史重要性的話題時(shí)表現(xiàn)不佳。

但是作為一個(gè)簡(jiǎn)單的Web工具,谷歌表示,這個(gè)技術(shù)能幫助改進(jìn)像Gmail智能回復(fù)這樣的產(chǎn)品,而且與書籍對(duì)話是一種以自然語(yǔ)義的方式搜索Web的有趣方式。更重要的是,它讓我們意識(shí)到,當(dāng)人工智能真正成熟到可以處理幾乎所有我們拋出的問(wèn)題時(shí),未來(lái)的界面會(huì)是什么樣子。

Semantris:開(kāi)腦洞、發(fā)散思維的小游戲

跟“撩書”一起推出的是一款叫做Semantris的游戲,它主要測(cè)試用戶單詞聯(lián)想能力。

舉個(gè)例子,如果你把“床”(Bed)這個(gè)單詞放在一個(gè)10個(gè)單詞的最上面,你可能會(huì)把“睡眠”(Sleep)作為一種反應(yīng)。Semantris將對(duì)這10個(gè)單詞進(jìn)行排序,并根據(jù)它認(rèn)為床與睡眠之間的語(yǔ)義關(guān)系與列表中的其他單詞之間的關(guān)系進(jìn)行比較,最后還可以打分。

應(yīng)該指出的是,很多谷歌實(shí)驗(yàn)也是公司收集用戶數(shù)據(jù)的方法,通過(guò)給用戶提供豐富的關(guān)于文字關(guān)系的信息,有助于信息技術(shù)的發(fā)展。這似乎是Semantris的案例,但無(wú)論如何,游戲是測(cè)試你自己能力的一種有趣的方式,看看軟件如何判斷單詞之間的聯(lián)系。

此外,你也可以玩一個(gè)類似tetris的游戲,它可以讓你輸入文字來(lái)清除屏幕上的文字塊,根據(jù)你自己的假設(shè),軟件可以在彩色方塊上的文字和你輸入的答案之間的文字之間畫出什么關(guān)聯(lián)。

建模方法

谷歌使用的方法是“在向量空間中表示語(yǔ)言”這一想法的延伸,方法是為更大的語(yǔ)言塊(如完整句子和小段落)創(chuàng)建向量。由于語(yǔ)言是由概念層次組成的,我們使用一個(gè)模塊層級(jí)結(jié)構(gòu)創(chuàng)建向量,每個(gè)模塊考慮與不同時(shí)間尺度的序列對(duì)應(yīng)的特征。如果以正確的方式訓(xùn)練,然后提出正確的“問(wèn)題”,那么就可以用向量空間語(yǔ)言模型來(lái)表示相關(guān)性、同義詞、反義詞、部分整體關(guān)系、同形異義詞以及其他許多類型的關(guān)系。谷歌在論文“Efficient Natural Language Response for Smart Reply”中描述了這種方法。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6218

    瀏覽量

    107049
  • 關(guān)鍵詞
    +關(guān)注

    關(guān)注

    0

    文章

    16

    瀏覽量

    9884
  • 自然語(yǔ)言
    +關(guān)注

    關(guān)注

    1

    文章

    291

    瀏覽量

    13553

原文標(biāo)題:谷歌發(fā)大招:搜索全面AI化,不用關(guān)鍵詞就能輕松“撩書”

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦

    探索AC自動(dòng)機(jī):多關(guān)鍵詞搜索的原理與應(yīng)用案例

    引言 目前,大多數(shù)自由文本搜索技術(shù)采用類似于Lucene的策略,通過(guò)解析搜索文本為各個(gè)組成部分來(lái)定位關(guān)鍵詞。這種方法在處理少量關(guān)鍵詞時(shí)表現(xiàn)良好。但當(dāng)
    的頭像 發(fā)表于 08-26 15:55 ?1148次閱讀
    探索AC自動(dòng)機(jī):多<b class='flag-5'>關(guān)鍵詞</b><b class='flag-5'>搜索</b>的原理與應(yīng)用案例

    [討論]提高網(wǎng)站關(guān)鍵詞排名的28個(gè)SEO小技巧

    ) 內(nèi)容中自然出現(xiàn)關(guān)鍵詞 內(nèi)容第段和最后段出現(xiàn)關(guān)鍵詞 H1,H2標(biāo)簽中出現(xiàn)關(guān)鍵詞 導(dǎo)出鏈接錨文本中包含
    發(fā)表于 12-01 17:08

    亞馬遜代運(yùn)營(yíng) amazon Search term 關(guān)鍵詞填寫的“神技”

    、轉(zhuǎn)化率,且與自己產(chǎn)品相關(guān)的關(guān)鍵詞,單獨(dú)拿出來(lái)放進(jìn) search term 里面進(jìn)行優(yōu)化 listing 的操作。2.自己利用些工具去篩選出些買家搜索詞,然后根據(jù)自己對(duì)產(chǎn)品的理解,
    發(fā)表于 06-05 15:41

    關(guān)鍵詞優(yōu)化有哪些實(shí)用的方法

    我們?cè)谧?b class='flag-5'>關(guān)鍵詞優(yōu)化排名的時(shí)候,有經(jīng)驗(yàn)的seo人員都會(huì)有自己的套關(guān)于關(guān)鍵詞應(yīng)該怎么去優(yōu)化排名的方法,但是對(duì)于些剛接觸seo的新手來(lái)說(shuō)就會(huì)比較迷茫,不知道應(yīng)該怎么去做好
    發(fā)表于 08-11 01:19

    百度關(guān)鍵詞排名掉完了怎么辦

    夜之間關(guān)鍵詞排名掉完了,沒(méi)有被K,也沒(méi)有出現(xiàn)違規(guī)操作,這是怎么回事呢?
    發(fā)表于 01-27 11:01

    #2023,你的 FPGA 年度關(guān)鍵詞是什么? #

    FPGA 年度關(guān)鍵詞,我的想法是“標(biāo)準(zhǔn)化”;今年的工作中遇到了不少同事的issues,本身都是小問(wèn)題或者很細(xì)節(jié)的東西但是卻反復(fù)出現(xiàn)問(wèn)題,目前想到的最好的辦法是做好設(shè)計(jì)規(guī)則的標(biāo)準(zhǔn)化才能避免,不知道大家有沒(méi)有更好的建議?
    發(fā)表于 12-06 20:31

    2010年10大流行搜索關(guān)鍵詞 Facebook居首

    2010年10大流行搜索關(guān)鍵詞 Facebook居首 據(jù)國(guó)外媒體報(bào)道,調(diào)研公司Hitwise數(shù)據(jù)顯示,2009年Facebook超越Myspace成為最流行的搜索關(guān)
    發(fā)表于 02-25 10:39 ?965次閱讀

    基于關(guān)鍵詞的最優(yōu)路徑查詢算法

    為改進(jìn)基于關(guān)鍵詞的最優(yōu)路徑查詢算法,在大規(guī)模圖以及多查詢關(guān)鍵詞下復(fù)雜度過(guò)高與可擴(kuò)展性不足的缺陷,依據(jù)查詢關(guān)鍵詞序列構(gòu)建候選路徑的策略提出一種高效查詢算法。該算法在路徑構(gòu)建過(guò)程中優(yōu)先滿足
    發(fā)表于 12-06 11:28 ?0次下載

    基于盲GDH簽名的無(wú)記憶模糊關(guān)鍵詞搜索

    在云計(jì)算中,用戶在計(jì)算過(guò)程中的數(shù)據(jù)安全問(wèn)題已經(jīng)成為制約云計(jì)算發(fā)展的個(gè)瓶頸。本文針對(duì)云計(jì)算中的加密搜索問(wèn)題,提出個(gè)有效的加密搜索方案。在搜索
    發(fā)表于 12-14 14:14 ?0次下載

    對(duì)加密電子醫(yī)療記錄的關(guān)鍵詞搜索

    被稱為MCKS I的簡(jiǎn)單的多域連接關(guān)鍵詞搜索(MCKS)方案,該方案僅支持連接相等查詢,為了實(shí)現(xiàn)更加靈活而復(fù)雜的多域關(guān)鍵詞連接查詢,例如子集查詢和范圍查詢,又提出了被稱為MCKS II的提高方案.該方案利用了分層屬性的矢量表示
    發(fā)表于 01-14 10:42 ?0次下載

    Chrome新增項(xiàng)功能 部分標(biāo)簽頁(yè)可顯示該頁(yè)面關(guān)鍵詞

    作為全球最受歡迎的互聯(lián)網(wǎng)瀏覽器,Chrome的功能仍在不斷豐富,從而為用戶提供更無(wú)縫的使用體驗(yàn)。近日谷歌在Chrome瀏覽器中新增了項(xiàng)新功能,在部分標(biāo)簽頁(yè)預(yù)覽中能夠顯示該頁(yè)面的關(guān)鍵詞。例如在
    的頭像 發(fā)表于 04-15 08:38 ?3386次閱讀

    融合BERT向量與TextRank的關(guān)鍵詞抽取方法

    結(jié)合文檔本身的結(jié)構(gòu)信息與外部詞語(yǔ)的語(yǔ)義信息,提出一種融合BERT向量與 Textrank的關(guān)鍵詞抽取方法。在基于網(wǎng)絡(luò)圖的 Textrank方法基礎(chǔ)上,引入語(yǔ)義差異性并利用BERT
    發(fā)表于 03-21 09:55 ?18次下載
    融合BERT<b class='flag-5'>詞</b>向量與TextRank的<b class='flag-5'>關(guān)鍵詞</b>抽取方法

    一種基于和文檔嵌入的關(guān)鍵詞抽取方法

    各類應(yīng)用領(lǐng)域的文本數(shù)據(jù)日益增多,如何從這些海量數(shù)據(jù)中迅速準(zhǔn)確地提取核心內(nèi)容,已成為關(guān)鍵詞抽取的主要任務(wù)。提出一種基于和文檔嵌入的關(guān)鍵詞抽取方法,通過(guò)計(jì)算單詞與文檔在同
    發(fā)表于 04-02 14:59 ?4次下載
    <b class='flag-5'>一種</b>基于<b class='flag-5'>詞</b>和文檔嵌入的<b class='flag-5'>關(guān)鍵詞</b>抽取方法

    一種基于位置信息的關(guān)鍵詞自動(dòng)化提取算法

    關(guān)鍵詞提取是進(jìn)行未知網(wǎng)絡(luò)協(xié)議逆向的關(guān)鍵步驟。鑒于現(xiàn)有的關(guān)鍵詞提取方法存在精確度不髙、需要較多先驗(yàn)知識(shí)、操作繁瑣等問(wèn)題,提出了一種基于位置信息的關(guān)鍵詞
    發(fā)表于 04-25 13:56 ?3次下載
    <b class='flag-5'>一種</b>基于位置信息的<b class='flag-5'>關(guān)鍵詞</b>自動(dòng)化提取算法

    ADI年度關(guān)鍵詞曝光,這些你肯定搜索過(guò)!

    大數(shù)據(jù)時(shí)代,每個(gè)人的搜索框在某種程度上都代表著這個(gè)人的所思所想。如果將時(shí)間放長(zhǎng),樣本量放大,那么 份年度搜索關(guān)鍵詞就會(huì)呈現(xiàn)出了這個(gè)世界上絕大部分人是如何走過(guò)這
    的頭像 發(fā)表于 12-30 00:05 ?1013次閱讀

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品