0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

chatgpt下非端到端方案是否還有意義

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CS的陋室 ? 2023-02-14 09:23 ? 次閱讀

最近c(diǎn)hatgpt逐漸變火,很多人也多少能夠發(fā)現(xiàn),chatgpt能夠成為一個(gè)相對(duì)可靠的端到端解決方案,大有干掉很多智能對(duì)話助手、搜索引擎的趨勢(shì),當(dāng)然現(xiàn)在已經(jīng)有不少用戶也在用這個(gè)來(lái)充當(dāng)搜索引擎來(lái)用了。然而,從技術(shù)角度,我們是否可以考慮去這么做了,或者說(shuō)現(xiàn)階段是否合適真的去這么嘗試了。來(lái)看我的看法吧。

先說(shuō)結(jié)論吧,我自己的分析結(jié)論是,大家都應(yīng)該去嘗試,但是不要指望短期內(nèi)徹底替換。

什么是端到端

先說(shuō)一下端到端和非端到端的意思,簡(jiǎn)單地說(shuō),就是一個(gè)模型完成全流程的任務(wù),而非端到端,就是通過(guò)多個(gè)模型或者模塊有機(jī)組合最終完成的任務(wù)。

舉個(gè)例子,對(duì)話系統(tǒng),可以用一個(gè)比較完善的生成模型來(lái)完成,也可以用一個(gè)系統(tǒng),里面有各種模型,例如意圖識(shí)別模塊、召回模塊、排序模塊等多個(gè)模塊協(xié)同合作來(lái)共同完成,前者就是端到端的方案,后者就是非端到端的方案。

端到端和非端到端的競(jìng)爭(zhēng)

其實(shí)端到端和非端到端的競(jìng)爭(zhēng),早在前幾年就有了,DSTC對(duì)話系統(tǒng)的比賽,榜單上就已經(jīng)分為了端到端和非端到端兩派進(jìn)行,從比賽的數(shù)據(jù)來(lái)看,非端到端的模型基本都能在A榜有個(gè)不錯(cuò)的成績(jī),而B榜上,端到端模型則能夠一舉超越非端到端模型獲得勝利,從這點(diǎn)我們其實(shí)可以推斷,非端到端模型更容易在已知情況達(dá)到更高的水平,但是因?yàn)槟P捅旧淼奶囟ǎ说蕉说哪J较?,則更容易頂?shù)礁叩纳舷?,泛化能力也能拉的比較高。

正因?yàn)槎说蕉四P透菀啄茼數(shù)礁叩纳暇€,所以在科研界,多半也是朝著端到端的方案去走的,配合預(yù)訓(xùn)練模型這股東風(fēng),絕大部分復(fù)雜任務(wù)的SOTA方案都是端到端模型的身影。

然而,與之相反的是工業(yè)界,在工業(yè)界,各大廠所采用的方案,基本都是非端到端的方案,前沿重器系列中我聊了很多場(chǎng)景下大廠的架構(gòu):

前沿重器[1] | 微軟小冰-多輪和情感機(jī)器人的先行者

前沿重器[2] | 美團(tuán)搜索理解和召回

前沿重器[3] | 平安智能問(wèn)答系統(tǒng)

前沿重器[4] | 騰訊搜索的Quer理解如何直擊心靈

大家都可以看到,這里面大家不約而同地選擇了這些方案,而沒有選擇比較直接的端到端方案,甚至,在一些小任務(wù)下,大家也傾向于拆解成非端到端的任務(wù)來(lái)進(jìn)行,例如糾錯(cuò)(NLP.TM[37] | 深入討論糾錯(cuò)系統(tǒng)),就拆解成3部分靈活處理。

為什么會(huì)選擇非端到端

我自己也經(jīng)常會(huì)對(duì)一些需求做技術(shù)方案,也會(huì)比較傾向于非端到端的方案,主要是出于這幾個(gè)原因吧:

非端到端出效果穩(wěn)定。拆解開的每個(gè)步驟都能監(jiān)控到,什么位置出問(wèn)題成為短板能快速定位修復(fù),且不影響其他模塊。

資源和需求多樣性導(dǎo)致必須拆分。不同的資源來(lái)源導(dǎo)致我們必須在內(nèi)部拆分,例如要出天氣要查天氣的庫(kù),此時(shí)就要拆分各模塊做識(shí)別等任務(wù)。

可控性和可更新性。國(guó)內(nèi)外其實(shí)都有很多不能發(fā)布的信息或者價(jià)值觀,這些是需要控制的,另一方面,有些內(nèi)容是需要可更新的,此時(shí)需要可更新的模塊來(lái)處理,每次直接更新整個(gè)模型成本很高。

這應(yīng)該也是大家會(huì)在現(xiàn)實(shí)落地情況選擇花時(shí)間拆分模塊,逐步完成的核心原因了,也側(cè)面映射出,非端到端的方案最終沒選擇的原因:

調(diào)優(yōu)成本和風(fēng)險(xiǎn)大,除了問(wèn)題后的效果調(diào)優(yōu)可控性其實(shí)不是很高,很依賴訓(xùn)練策略、資源等很多原因。

對(duì)現(xiàn)有資源的使用能力差,原來(lái)的端到端模型主要靠喂特定的樣本,現(xiàn)階段則是prompt,但是多種復(fù)雜的資源不見得能支持這樣的使用。

可控性和可更新性不足,一些風(fēng)險(xiǎn)問(wèn)題,需要實(shí)時(shí)更新的問(wèn)題(依舊舉天氣的例子),端到端模型的變化是不夠敏捷的,甚至在變化過(guò)程中可能引入新的不可控風(fēng)險(xiǎn)。

這些問(wèn)題不解決,我們很難完全放心把整個(gè)大的任務(wù)交給一個(gè)模型的。

端到端模型是否有可能克服缺點(diǎn)

我的答案是,現(xiàn)階段是有可能但是還需要發(fā)展迭代。

隨著prompt的出現(xiàn),大家會(huì)開始有一種錯(cuò)覺,prompt的方式能讓模型快速學(xué)會(huì)一些比較好的知識(shí),或者換個(gè)角度,prompt方案似乎能引導(dǎo)模型吐出我們想讓他吐出的東西,看起來(lái)非常有用,大家在體驗(yàn)chatgpt時(shí)多少有點(diǎn)這個(gè)感覺,然而仔細(xì)看過(guò)chatgpt有關(guān)原理的朋友們應(yīng)該會(huì)發(fā)現(xiàn),他們?cè)诘讓邮腔ㄙM(fèi)了很大成本來(lái)構(gòu)造很多prompt來(lái)讓模型學(xué)習(xí)的,標(biāo)注看著很簡(jiǎn)單,但chatgpt這里其實(shí)非常困難,總結(jié)而說(shuō)是有兩點(diǎn):

prompt的數(shù)量,prompt訓(xùn)練是需要一定的數(shù)據(jù)支撐的,別給我說(shuō)就幾條,那是一個(gè)類目下,但是類目層面就很多了,每個(gè)類幾條那也要很多條的對(duì)吧。

prompt的質(zhì)量,只有泛化的,多樣的prompt才能更好地引導(dǎo)模型訓(xùn)練,這種人工活動(dòng)不同于標(biāo)注,他是帶有一定創(chuàng)造性的,此時(shí)難度其實(shí)就很高了。

當(dāng)然,有關(guān)靈活可控性,大家會(huì)有說(shuō)adapter之類的結(jié)構(gòu),就是輕量化微調(diào)的方案,這點(diǎn)我在之前的輕量化微調(diào)文章里也有說(shuō)過(guò)(前沿重器[27] | 從遺忘問(wèn)題到預(yù)訓(xùn)練輕量化微調(diào)),雖然這種方案能一定程度緩解,但是敏捷性其實(shí)還可以提升的,有些緊急的公關(guān)問(wèn)題需要快速下線,類似天氣、新聞等需要快速更新的內(nèi)容,如果還需要慢慢吞吞地訓(xùn)adapter模塊,那速度大家肯定覺得會(huì)不太夠,還不如直接塞庫(kù)里,用dsl直接查的快對(duì)吧,當(dāng)然了,如果是實(shí)時(shí)性要求沒那么高的,這種控制起來(lái)其實(shí)已經(jīng)非常足夠了。

有關(guān)chatgpt的效果問(wèn)題

現(xiàn)階段,chatgpt的口碑有目共睹,但是盛名之下是否能副,這里我是想打一個(gè)問(wèn)號(hào)的。有幾個(gè)比較嚴(yán)謹(jǐn)?shù)膯?wèn)題需要被拋出來(lái):

開放域下的指標(biāo)如何。大家你一個(gè)我一個(gè)的試,從個(gè)人層面看就是超小樣本,統(tǒng)計(jì)能力不足,而把大家的都算上,基本一定程度算高頻問(wèn)題,可以說(shuō)是帶點(diǎn)偏的,然而拋開這批嘗試的用戶,只看用戶日常真正的提問(wèn),例如像百度那樣用戶當(dāng)做工具每天搜的情況,效果如何,這點(diǎn)還需要更為嚴(yán)格,數(shù)量更豐富的評(píng)測(cè)。

現(xiàn)階段大家的新鮮感還比較強(qiáng),其實(shí)容忍度還是比較高的,很難避免一些錯(cuò)誤可能會(huì)被我們縮小,如果對(duì)其他的一些軟件和產(chǎn)品,尤其是國(guó)產(chǎn)的,大家是否也能有這個(gè)容忍度呢,我自己看游戲領(lǐng)域、電影領(lǐng)域甚至一些奢飾品等領(lǐng)域的經(jīng)驗(yàn)來(lái)看,用戶多半對(duì)國(guó)產(chǎn)產(chǎn)品有著比同類外國(guó)產(chǎn)品更苛刻的要求的,例子就不舉了,相信大家都懂。

產(chǎn)品形態(tài)的問(wèn)題?,F(xiàn)階段的chatgpt的輸出形態(tài)其實(shí)還是比較局限的——文本和圖像,但是實(shí)際上我們需要的可能會(huì)更加復(fù)雜,例如智能家居的指令(幫我開燈),銷售場(chǎng)景的智能推薦(給我推薦一臺(tái)七千塊左右的電腦),天氣內(nèi)容展示(告訴我未來(lái)一周的天氣)等。

怎么做

講到這里,其實(shí)我們可以有這幾個(gè)共識(shí)吧:

非端到端模型在目前的落地場(chǎng)景下,仍有不可撼動(dòng)的地位,直接切換或者使用端到端模型應(yīng)該是激進(jìn)的。

端到端有自己獨(dú)特且突出的優(yōu)勢(shì),泛化能力強(qiáng),這點(diǎn)也是毋庸置疑的,

在對(duì)這個(gè)東西有基本的共識(shí)后,我們可以繼續(xù)來(lái)聊怎么做,整體思路可以參考很多系統(tǒng)所常見的嵌入方式:新增召回路,參與篩選和把控。

之前我有文章聊過(guò)“召回-排序”這種在多個(gè)系統(tǒng)中被廣泛使用的一個(gè)架構(gòu)(心法利器[79] | 對(duì)話系統(tǒng)中的多路召回和排序),我們可以考慮在內(nèi)容的召回上,把這種端到端的方式作為其中一種召回鏈路放入到召回池子里,增加一種回復(fù)的可能性,最終的篩選則是在排序?qū)?,和其他路召回的?nèi)容進(jìn)行綜合排序,并完成拒識(shí)判斷(嚴(yán)謹(jǐn)起見端到端方案在特定場(chǎng)景不合適,此時(shí)需要過(guò)濾拒絕),此時(shí)就可以相對(duì)安全地利用上這個(gè)好東西,算是“馴服”了。在后續(xù)階段,隨著逐漸優(yōu)化,我們可以慢慢放開排序和拒識(shí)模塊,讓端到端方案的采納率逐步提升,在提升到一定階段后,就可以考慮下掉其他模塊,最終完成了從非端到端到端到端的切換了,中間階段也比較可控安全。

chatgpt是否會(huì)替代嗎

最后想夾帶點(diǎn)私貨,回應(yīng)一下最近很多人后臺(tái)希望和我聊的問(wèn)題,簡(jiǎn)單地說(shuō)就是chatgpt是否能完全替代別的東西,尤其是人,最近c(diǎn)hatgpt逐漸變火,除了chatgpt很火之外,更多的聲音是“哀鴻遍野”,很多人覺得非常悲觀,很多工作都可能會(huì)被機(jī)器替代。不過(guò)從我自己的角度看,是兩個(gè)聲音:

chatgpt已經(jīng)能幫忙做很多事,能替代不少人了。

簡(jiǎn)單任務(wù)已經(jīng)可以做了,所以基礎(chǔ)人力肯定會(huì)被壓縮,但是因?yàn)樯罡袠I(yè)的人更了解具體流程和chatgpt能做的事,所以明白終究是需要有指導(dǎo)機(jī)器干活的,需要搭建架構(gòu)的人,因此讓自己成長(zhǎng)起來(lái),這塊壓力其實(shí)沒想象中的大,而且在這個(gè)趨勢(shì)下,資本進(jìn)一步了解到AI的重要性,說(shuō)不定對(duì)相應(yīng)從業(yè)人員的需求更多。

而且這兩個(gè)聲音的具有非常鮮明的特征,前者像是一些對(duì)有關(guān)領(lǐng)域了解不深的人,后者則是深耕某個(gè)領(lǐng)域時(shí)間比較久的老鳥。很多時(shí)候,老鳥的這個(gè)東西的理解很深,往往能參透這里的本質(zhì)。

說(shuō)個(gè)很簡(jiǎn)單的事吧,很多人發(fā)現(xiàn)了chatgpt會(huì)寫代碼,所以覺得程序員就要被淘汰了,其實(shí)這部分人只是單純的認(rèn)為程序員只有一個(gè)任務(wù)就是寫代碼罷了,但其實(shí)并非如此,以算法工程師為例,大家可以看看我的日常(心法利器[31] | 我的算法工程師日常),大家會(huì)發(fā)現(xiàn),真正寫代碼的時(shí)間可能就10%左右了,在這種情況下,chatgpt更多的是一個(gè)幫助我們工作的工具,而不是替代我們的對(duì)手。

我們不能說(shuō)外行如何如何,畢竟術(shù)業(yè)有專攻,但是對(duì)我們這些專業(yè)領(lǐng)域的人還是需要體現(xiàn)出自己的專業(yè)水準(zhǔn)的,冷靜思考,不能被不懂這個(gè)的人帶去了節(jié)奏,而是真正的深入了解某個(gè)東西的原理和優(yōu)缺點(diǎn),并且找到自己的優(yōu)劣勢(shì)和機(jī)會(huì),這個(gè)才是真正破局所需要的。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 搜索引擎
    +關(guān)注

    關(guān)注

    0

    文章

    117

    瀏覽量

    13354
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3244

    瀏覽量

    48847
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1561

    瀏覽量

    7683

原文標(biāo)題:chatgpt下非端到端方案是否還有意義

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    高通收購(gòu)NXP真的有意義嗎?

    市場(chǎng)傳言,Qualcomm收購(gòu)NXP Semiconductor的洽談已經(jīng)接近成交;但是,這樁交易對(duì)Qualcomm來(lái)說(shuō)真的有意義嗎?
    發(fā)表于 10-27 10:43 ?3208次閱讀

    芯片的datesheet直譯成中文對(duì)技術(shù)人員的參閱有沒有意義?

    的習(xí)慣么?如果你們參閱的是一些機(jī)翻直譯的中文資料,如用谷歌翻譯的,每個(gè)型號(hào)的PDF都有個(gè)中文直譯版,你們覺得有沒有意義?能不能對(duì)生產(chǎn)研發(fā)起到幫助作用?
    發(fā)表于 03-29 17:15

    橫河測(cè)量測(cè)試 對(duì)于要求較高的測(cè)試應(yīng)用,非常有意義

    增加儀器的開發(fā)難度和硬件成本,但卻能實(shí)現(xiàn)更精準(zhǔn)的測(cè)量,對(duì)于要求較高的測(cè)試應(yīng)用,非常有意義?! M河最新推出的新一代高精度功率分析儀WT5000就是采用了這樣的設(shè)計(jì):除輸入的線路濾波器外,還分別為常規(guī)
    發(fā)表于 01-21 20:32

    請(qǐng)問(wèn)stm32f103zet6搭配256Mbit SDRAM有意義嗎?

    stm32f103zet6搭配256Mbit SDRAM有意義么,看原子戰(zhàn)艦也才8M,是不是有點(diǎn)浪費(fèi),F(xiàn)1性能能消耗這么大內(nèi)存么?
    發(fā)表于 05-07 02:35

    在51單片機(jī)上跑RTOS有沒有意義?精選資料分享

    最近看見我的一個(gè)技術(shù)交流群在討論一個(gè)問(wèn)題:在51單片機(jī)上跑RTOS有沒有意義?今天就來(lái)圍繞51和RTOS展開講講。1關(guān)于51單片機(jī)及性能和資源51單片機(jī)可以說(shuō)是我們這一代人的經(jīng)典,因?yàn)樗Y...
    發(fā)表于 07-20 07:54

    請(qǐng)問(wèn)同步電機(jī)使用矢量變頻器拖動(dòng)有意義嗎?

    ,此時(shí)輸出電壓增加以求恢復(fù)轉(zhuǎn)速,同時(shí)內(nèi)環(huán)限制電流不能過(guò)載。但是在同步電機(jī)的情況,除非負(fù)載達(dá)到失步,其轉(zhuǎn)速是與電壓無(wú)關(guān)的,是否可以認(rèn)為此時(shí)外環(huán)是起不到作用的,只有內(nèi)環(huán)有作用,這豈不是可以認(rèn)為用矢量變頻器拖動(dòng)同步電動(dòng)機(jī)是沒有意義
    發(fā)表于 11-16 06:49

    應(yīng)用LonWorks控制技術(shù)的端方案

    應(yīng)用LonWorks控制技術(shù)的端方案 信息會(huì)聚正以末有的速度出現(xiàn)。因特網(wǎng)大大的加速多種形式的信息(數(shù)據(jù)、話音、視頻、聲頻、控制)的合并,從而為解決日
    發(fā)表于 03-18 10:02 ?16次下載

    智能與智能:何時(shí)為電源增加智能功能才有意義

    無(wú)論控制回路是模擬的還是數(shù)字的,只要其正常工作,用戶便不會(huì)了解其中的差別。如果應(yīng)用優(yōu)勢(shì)不存在,則使用數(shù)字控制回路或數(shù)字化控制器可能是沒有意義的。在這些情況,有許多模擬電源解決方案可以滿足電路更小
    的頭像 發(fā)表于 08-24 12:49 ?3554次閱讀

    Reddit熱議MIT新發(fā)現(xiàn) 對(duì)抗樣本是有意義的數(shù)據(jù)特征

    對(duì)抗樣本不是Bug, 它們實(shí)際上是有意義的數(shù)據(jù)分布特征。來(lái)自MIT的最新研究對(duì)神經(jīng)網(wǎng)絡(luò)的對(duì)抗樣本問(wèn)題給出了非常新穎的解釋和實(shí)驗(yàn)論證。
    的頭像 發(fā)表于 05-13 16:01 ?1939次閱讀
    Reddit熱議MIT新發(fā)現(xiàn) 對(duì)抗樣本是<b class='flag-5'>有意義</b>的數(shù)據(jù)特征

    蘋果造車真的有意義

    本周有三個(gè)話題值得我們關(guān)注,首先,近兩天蘋果的造車的消息引起了大家熱烈的關(guān)注,眾多類似“看到裝了四個(gè)輪子的手機(jī)長(zhǎng)什么樣”的評(píng)論也是鋪天蓋地的傳來(lái),所以蘋果造車真的有意義嗎?其次,豐田掌門人豐田章男
    的頭像 發(fā)表于 12-28 10:23 ?1857次閱讀

    在51單片機(jī)上跑RTOS有沒有意義?

    關(guān)注+星標(biāo)公眾號(hào),不錯(cuò)過(guò)精彩內(nèi)容作者 | strongerHuang微信公眾號(hào)|嵌入式專欄最近看見我的一個(gè)技術(shù)交流群在討論一個(gè)問(wèn)題:在51單片機(jī)上跑RTOS有沒有意義?今天就來(lái)圍繞51...
    發(fā)表于 11-19 11:51 ?32次下載
    在51單片機(jī)上跑RTOS有沒<b class='flag-5'>有意義</b>?

    基于Arduino的矯枉過(guò)正但具有意義的COVID流行病展示

    電子發(fā)燒友網(wǎng)站提供《基于Arduino的矯枉過(guò)正但具有意義的COVID流行病展示.zip》資料免費(fèi)下載
    發(fā)表于 11-01 09:38 ?0次下載
    基于Arduino的矯枉過(guò)正但具<b class='flag-5'>有意義</b>的COVID流行病展示

    ChatGPT是怎么實(shí)現(xiàn)的

    ChatGPT 能夠自動(dòng)生成類似于人類寫作的文本,這一點(diǎn)非常引人注目,也令人意外。但它是如何實(shí)現(xiàn)的?為什么它能夠如此出色地生成我們認(rèn)為有意義的文本?我的目的是在這里概述ChatGPT內(nèi)部的運(yùn)行
    的頭像 發(fā)表于 10-16 11:31 ?947次閱讀
    <b class='flag-5'>ChatGPT</b>是怎么實(shí)現(xiàn)的

    雙電源無(wú)擾動(dòng)快切裝置的小型化設(shè)計(jì)是否有意義?

    快切裝置的小型化設(shè)計(jì)對(duì)于安裝空間有限的改造場(chǎng)景是非常有意義的,DCM635系列是目前業(yè)內(nèi)體積最小的快切裝置,前面板長(zhǎng)266mm,寬146mm,裝置深210.5mm,安裝與進(jìn)線柜或母聯(lián)柜上層二次控制室面板上,小型化設(shè)計(jì)節(jié)省安裝空間,尤其適用于改造項(xiàng)目中,開關(guān)柜前面板開孔尺寸有限的場(chǎng)景。
    的頭像 發(fā)表于 07-19 11:30 ?384次閱讀
    雙電源無(wú)擾動(dòng)快切裝置的小型化設(shè)計(jì)<b class='flag-5'>是否</b><b class='flag-5'>有意義</b>?

    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻數(shù)據(jù)更有意義

    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻數(shù)據(jù)更有意義
    的頭像 發(fā)表于 12-16 10:59 ?153次閱讀
    安防監(jiān)控NTP校時(shí)服務(wù)器:讓視頻數(shù)據(jù)更<b class='flag-5'>有意義</b>