AI奪權(quán),“備胎轉(zhuǎn)正”的戲碼,在媒體行業(yè)再次上演。
5月底,微軟宣布將解雇50名從事新聞報(bào)道篩選和策劃的編輯,取代他們的正是已經(jīng)與這些人類編輯們共同工作了一段時(shí)間的AI編輯。
受此影響,英國(guó)新聞協(xié)會(huì)負(fù)責(zé)在MSN網(wǎng)站及微軟Edge瀏覽器上維護(hù)其新聞主頁(yè)的約27名編輯,被告知將在6月底被解雇。
盡管微軟特別聲明,此次裁員和新冠疫情大流行導(dǎo)致的新聞媒體的廣告收入下滑,沒有直接相關(guān),但通過AI技術(shù)來(lái)削減新聞團(tuán)隊(duì)的人力成本則已經(jīng)是一個(gè)不爭(zhēng)的事實(shí)了。
對(duì)于這些無(wú)奈“中槍”的新聞編輯來(lái)說(shuō),曾經(jīng)為他們提供各種新聞、篩選建議的AI算法推薦,竟然是這樣一個(gè)“暗中磨刀”的心機(jī)AI。
在報(bào)道中,一位即將被辭退的編輯人員強(qiáng)調(diào),完全用AI替代人工是有風(fēng)險(xiǎn)的,因?yàn)橹挥腥斯ぞ庉嫴拍艽_保網(wǎng)站不會(huì)向用戶顯示暴力或不適當(dāng)?shù)膬?nèi)容。這對(duì)于AI來(lái)說(shuō),這確實(shí)會(huì)是一個(gè)問題,因?yàn)樗瞄L(zhǎng)推薦那些符合人性的內(nèi)容,但卻無(wú)法識(shí)別一些潛在的社會(huì)倫理風(fēng)險(xiǎn)。
當(dāng)然,微軟自從1995年推出MSN新聞業(yè)務(wù)以來(lái)已有25年的時(shí)間。現(xiàn)在在全球至少有800多名編輯仍然在從事著新聞的篩選和推薦工作。未來(lái)微軟的新聞團(tuán)隊(duì)仍然還會(huì)以人工編輯和AI編輯共同協(xié)作的方式,只是AI取代人工編輯的趨勢(shì)可能在明顯加速。
站在普通吃瓜群眾的角度,我們也正被各種新聞資訊、視頻平臺(tái)的算法推薦所支配,最顯著的體會(huì)就是我們花費(fèi)越來(lái)越多的時(shí)間在那些讓我們“欲罷不能”的內(nèi)容上面。
難道說(shuō),AI將在取代人類編輯的戰(zhàn)斗中取得最后的勝利嗎?我們從AI算法推薦的上位和爭(zhēng)議中,來(lái)探究下AI算法與人工編輯推薦可能的勝負(fù)結(jié)果。
信息分發(fā):從“人找信息”進(jìn)入“信息找人”
“太陽(yáng)底下無(wú)新事”。算法推薦,盡管只是近幾年隨著移動(dòng)互聯(lián)網(wǎng)內(nèi)容應(yīng)用的爆發(fā)才興起,但其實(shí)質(zhì)上仍然只是人類進(jìn)行信息分發(fā)的一種新形式,而我們對(duì)信息分發(fā)的需求自古就有了。
赫拉利在《人類簡(jiǎn)史》中提出一種智人種之所以戰(zhàn)勝其他物種的新“假說(shuō)”,那就是我們特別擅于“八卦”和“聊天”?!鞍素浴庇兄谧屨麄€(gè)社群建立情感紐帶,團(tuán)結(jié)起來(lái)共進(jìn)退,“聊天”有助于經(jīng)驗(yàn)的傳授,外出的告訴村里人哪里有危險(xiǎn),老獵人教會(huì)小獵人如何抓獵物。這就是最天然的信息的社交分發(fā),極大提升了人類之間的協(xié)作效率和文明的延續(xù)。
此后我們經(jīng)歷了口耳相傳的史詩(shī),結(jié)繩記事、甲骨篆刻的符號(hào)記錄,以及再后面的文章典籍;現(xiàn)代文明的興盛得益于印刷術(shù)的不斷升級(jí),而到了近兩百年左右,新聞報(bào)紙、圖書出版、廣播電視等全新的信息分發(fā)媒介誕生,構(gòu)成了當(dāng)代社會(huì)的信息分發(fā)的基本版圖。
互聯(lián)網(wǎng)的出現(xiàn)又突破了信息分發(fā)的時(shí)空界限,讓信息可以實(shí)現(xiàn)永遠(yuǎn)在線、全球同步的傳遞。不過傳統(tǒng)互聯(lián)網(wǎng)的信息傳遞仍然延續(xù)了物理世界的范式。比如,互聯(lián)網(wǎng)早期興起的門戶網(wǎng)站和搜索引擎,就是借鑒了圖書館的目錄分類和和百科全書的條目索引。
新聞資訊等信息的分發(fā)依賴權(quán)威化、中心化組織的采集和報(bào)道,用戶的信息知識(shí)的獲取依賴主動(dòng)地瀏覽和篩查。
隨著信息的爆炸式增長(zhǎng)和人們信息消費(fèi)的碎片化趨勢(shì)增長(zhǎng),“人找信息”的方式遭遇了全新挑戰(zhàn)。算法推薦和相應(yīng)的內(nèi)容分發(fā)的平臺(tái)的出現(xiàn),開啟了通過人類通過機(jī)器算法推薦的方式進(jìn)行“信息找人”的全新模式。
1995年,尼古拉·尼葛洛龐帝在《數(shù)字化生存》當(dāng)中帶有預(yù)言般的“我的日?qǐng)?bào)”的想法,現(xiàn)在成為了現(xiàn)實(shí)。信息分發(fā)正在朝著滿足受眾用戶個(gè)性化的需求的方向發(fā)展。
幾乎就在同時(shí),美國(guó)明尼蘇達(dá)大學(xué)的團(tuán)隊(duì)開發(fā)出了第一個(gè)自動(dòng)化推薦系統(tǒng)GroupLens,成為協(xié)同過濾推薦算法的最早提出者。此后,算法推薦系統(tǒng)在亞馬遜的電商平臺(tái)、Netflix的視頻流媒體服務(wù)當(dāng)中也很早便投入了使用。
2016年,可以算是新聞算法推薦崛起的元年。這一年,YouTube將深度神經(jīng)網(wǎng)絡(luò)應(yīng)用到內(nèi)容推薦系統(tǒng)中。這一年,我國(guó)新聞資訊信息分發(fā)市場(chǎng)上,算法推送的內(nèi)容第一次超過50%。
也正是這一年,率先應(yīng)用信息算法推薦的今日頭條,終于從四大門戶和BAT支持的媒體平臺(tái)中突圍,實(shí)現(xiàn)了6000萬(wàn)的日活。
但此后算法推薦本身一直爭(zhēng)議不斷。在2017年9月,人民網(wǎng)特意用三篇社評(píng)的篇幅批評(píng)了今日頭條這類新聞應(yīng)用的“算法推薦”。社評(píng)里自然首先肯定了算法推薦順應(yīng)時(shí)代潮流,滿足人們個(gè)性化、多元化的信息獲取需求,但又專門指出了以下的問題:
算法推薦會(huì)縱容低劣內(nèi)容的泛濫。一些推薦算法只會(huì)迎合大眾的獵奇心理,最后只會(huì)反復(fù)推送那些低質(zhì)量?jī)?nèi)容,最終“劣幣驅(qū)逐良幣”,使得傳統(tǒng)媒體的優(yōu)質(zhì)、全面的資訊信息無(wú)法觸達(dá)大眾用戶。
推薦算法中所謂的“個(gè)性化”推薦,只會(huì)機(jī)械式地推薦一些關(guān)聯(lián)性強(qiáng),但內(nèi)容單一的信息,甚至?xí)^濾掉那些不熟悉、不認(rèn)同的信息,造成“信息繭房”。
算法推薦的信息抓取不僅可能涉及到大量的版權(quán)問題,甚至還可能走向“創(chuàng)新的反面”。就是智能推薦將走向媚俗化和庸俗化,充斥大量缺乏獨(dú)立思考、深度觀察的膚淺內(nèi)容,反過來(lái)破壞社會(huì)的創(chuàng)新發(fā)展。
人民網(wǎng)的批評(píng),同樣也代表了眾多傳統(tǒng)媒體和眾多精英人士的觀點(diǎn),而且這些現(xiàn)象確實(shí)也符合我們大多數(shù)人的直觀印象。但是在附和之前,我們?nèi)匀恍枰M(jìn)一步了解下算法推薦的基本方法和發(fā)展,搞清楚人們?yōu)槭裁磿?huì)如此容易被算法“馴服”。算法推薦又該如何突破自己的局限而持續(xù)進(jìn)化?
算法推薦:人性的,太人性
信息分發(fā)的本質(zhì),就是有效地聯(lián)接人和信息。而算法推薦的本質(zhì)就是運(yùn)用機(jī)器算法實(shí)現(xiàn)大規(guī)模的自動(dòng)化信息分發(fā),讓信息自動(dòng)找到人。
因此,算法推薦需要解決三個(gè)問題:了解信息,了解人,了解人何時(shí)何地需要這些信息。不過,歸根到底,算法推薦的核心還是了解人,即了解人的使用習(xí)慣、興趣愛好,再通過算法預(yù)測(cè)用戶可能感興趣的信息和話題進(jìn)行加權(quán)推薦。
新聞信息的主要推薦算法都是來(lái)自于一些數(shù)學(xué)算法。在各大新聞資訊聚合類應(yīng)用上主要使用以下這些算法:
1、內(nèi)容推薦。這是資訊類推薦最常用到的算法。算法系統(tǒng)通過對(duì)文本內(nèi)容進(jìn)行標(biāo)簽設(shè)定,一旦用戶對(duì)相關(guān)內(nèi)容進(jìn)行過點(diǎn)擊、瀏覽、點(diǎn)贊、評(píng)論、分享等操作,系統(tǒng)就會(huì)對(duì)用戶打上相應(yīng)的興趣標(biāo)簽。這樣就可以將更多相關(guān)標(biāo)簽的文本進(jìn)行用戶標(biāo)簽的匹配。比如,一個(gè)看過“德甲”內(nèi)容的用戶,就會(huì)得到更多關(guān)于“德甲”的信息推送。
內(nèi)容推薦,如果先期無(wú)法獲取到用戶的興趣標(biāo)簽特征,就會(huì)容易遭遇冷啟動(dòng)問題。因此,內(nèi)容推薦之外還需要其他推薦方式。
2、協(xié)同過濾推薦。這是推薦系統(tǒng)中應(yīng)用最早和最為成功的技術(shù)之一,采用了我們常識(shí)理解的“人以類聚,物以群分”的思路,即找到用戶的好友或者與其相似特征的其他用戶那里,將他們感興趣的內(nèi)容來(lái)推薦給該用戶。
協(xié)同過濾推薦采取了經(jīng)驗(yàn)共享的方式,避免了內(nèi)容推薦中存在著內(nèi)容分析不準(zhǔn)確、過度單一等問題,可以為用戶發(fā)現(xiàn)潛在的興趣偏好的內(nèi)容。
3、熱門推薦。熱門推薦來(lái)自于傳統(tǒng)媒體的思維方式,主要是基于當(dāng)前熱點(diǎn)新聞事件和話題進(jìn)行的內(nèi)容推薦。區(qū)別于傳統(tǒng)媒體由新聞編輯進(jìn)行的人工篩選,新聞聚合平臺(tái)的自動(dòng)算法推薦更在于通過數(shù)據(jù)統(tǒng)計(jì)的方式將一段時(shí)間內(nèi)點(diǎn)擊量、關(guān)注度最高的新聞推送給用戶。
此外,還有像一系列基于規(guī)則、效用、知識(shí)以及各類組合的推薦算法來(lái)實(shí)現(xiàn)對(duì)于用戶的個(gè)性化推薦。
也就是說(shuō),對(duì)于那些使用了算法推薦的內(nèi)容平臺(tái),相當(dāng)于有了一手“秘密武器”來(lái)對(duì)付處在信息焦慮和信息饑渴的移動(dòng)互聯(lián)網(wǎng)用戶。即使你是一個(gè)新手用戶,平臺(tái)對(duì)你了解甚少,它也會(huì)很快通過讓你定制興趣標(biāo)簽、嘗試不同類型的內(nèi)容推送,AB測(cè)試等方式來(lái)實(shí)現(xiàn)所謂“冷啟動(dòng)”,找到你的真正愛好。
但是,最根本上來(lái)說(shuō),像今日頭條這樣的內(nèi)容平臺(tái)存在著一個(gè)最基本的“原罪”就是,平臺(tái)存在的目的是為了攫取盡可能多的用戶時(shí)間和注意力,而不是為了讓用戶獲得基本的資訊信息之后就轉(zhuǎn)身走人。
新聞聯(lián)播還有個(gè)準(zhǔn)時(shí)準(zhǔn)點(diǎn)的結(jié)束,而這些內(nèi)容平臺(tái)卻可以隨時(shí)刷新、無(wú)限供應(yīng),獲得流量才是其運(yùn)營(yíng)的本質(zhì)。所以,平臺(tái)的推薦算法就會(huì)盡可能討好用戶,利用用戶的人性弱點(diǎn)來(lái)進(jìn)行信息的喂養(yǎng)。
這也正是內(nèi)容平臺(tái)經(jīng)常為人們所詬病的問題:標(biāo)題黨橫行、洗稿文章泛濫,低俗這類深諳人性弱點(diǎn)的內(nèi)容層出不窮。一旦因?yàn)楹闷鏋g覽相關(guān)內(nèi)容,算法就會(huì)全力推薦更多相關(guān)信息。這也是所謂“信息繭房”的根本原因,算法縱容了人性,人性又反過來(lái)固化了認(rèn)知,導(dǎo)致一個(gè)用戶就在自己熟悉的信息圈里打轉(zhuǎn)。這也是很多人對(duì)內(nèi)容平臺(tái)深惡痛絕,但看起來(lái)又欲罷不能的深層原因。
但是需要指出的是,算法推薦本身不必為內(nèi)容平臺(tái)的這些問題背鍋,道理就如同“人用刀殺人,而罪責(zé)在人而不在刀”一樣簡(jiǎn)單。其實(shí),通過算法推薦本身的演化,是可以消解這種用戶的信息“偏食”行為和“信息繭房”問題的。
算法推薦的自救:人機(jī)協(xié)作是正途
無(wú)論對(duì)于算法推薦的批評(píng)有多么嚴(yán)重,但是算法推薦的流行和普及已經(jīng)是一個(gè)不爭(zhēng)的事實(shí)。算法推薦的真正進(jìn)步之處就在于改變了信息分發(fā)的方式,即從一種中心化的“責(zé)編把關(guān)”的分發(fā)方式變成基于用戶個(gè)性化的機(jī)器智能推薦的“算法把關(guān)”的分發(fā)方式。
這種分發(fā)方式帶來(lái)的是信息分發(fā)效率的極大提升,當(dāng)然同時(shí)也帶來(lái)了傳統(tǒng)權(quán)威、專業(yè)媒體的分發(fā)“算法”的失效和分發(fā)內(nèi)容權(quán)重的下降。但是從目前來(lái)看,傳統(tǒng)權(quán)威媒體已經(jīng)不再抱有一開始的否定和打壓態(tài)度,而是以積極的姿態(tài)擁抱新媒體平臺(tái),參與到這場(chǎng)算法推薦的流量爭(zhēng)奪當(dāng)中,并且正在憑借其官方身份和專業(yè)內(nèi)容,在新媒體時(shí)代重新獲得用戶認(rèn)可。
對(duì)于算法推薦帶來(lái)的“劣幣驅(qū)逐良幣”的問題,這之前確實(shí)是算法推薦的弱項(xiàng),最早的一些機(jī)器學(xué)習(xí)算法和推薦算法是無(wú)法識(shí)別文章內(nèi)容是否涉嫌標(biāo)題黨、假新聞、洗稿、低俗、黃暴等內(nèi)容。這些低劣內(nèi)容其實(shí)對(duì)于平臺(tái)而言,也是一直在努力清除的隱患。
畢竟平臺(tái)的發(fā)展不能僅靠這些內(nèi)容來(lái)支撐,反而會(huì)帶來(lái)眾多的版權(quán)、投訴和負(fù)面輿情。現(xiàn)在的平臺(tái)都已經(jīng)加大對(duì)內(nèi)容安全機(jī)制的建設(shè),其中包括高風(fēng)險(xiǎn)內(nèi)容的識(shí)別模型技術(shù)的廣泛應(yīng)用以及大規(guī)模人工審查核驗(yàn)。去年,就連同樣執(zhí)著于算法推薦的Facebook也因?yàn)榧傩侣劮簽E而開始使用人工編輯來(lái)對(duì)內(nèi)容進(jìn)行審查。
對(duì)于“信息繭房”而言,正如近日北師大教授喻國(guó)明在一篇《算法推薦必然導(dǎo)致“信息繭房”效應(yīng)嗎》的論文中指出的,算法推薦不是“信息繭房”形成的必要條件,算法推薦在“信息繭房”生成后并不起增效作用,甚至還起到了一定的消解作用。
簡(jiǎn)單來(lái)說(shuō),“信息繭房”的存在并不是因?yàn)樗惴ㄍ扑]的出現(xiàn)而出現(xiàn)的,傳統(tǒng)社會(huì)的單一信息、嚴(yán)格的媒介控制以及個(gè)人的信息“偏食”傾向都是造成“信息繭房”的原因。反而,在算法推薦時(shí)代,個(gè)體用戶還有著來(lái)自傳統(tǒng)媒體渠道、社交媒體渠道等多重信息來(lái)源,更加不容易制造這種“信息繭房”的生成機(jī)制;同時(shí),隨著算法推薦技術(shù)的不斷迭代,用戶的潛在信息需求也在不斷的挖掘和豐富。
最終,在算法推薦和人工編輯推薦的取舍較量中,我們其實(shí)更應(yīng)該推崇一種帶有“人文理性”和“技術(shù)理性”的可信算法推薦系統(tǒng)。顯然,算法仍然更容易給用戶提供一種“沉浸式”的信息閱讀體驗(yàn),而算法和人的互動(dòng)關(guān)系,本質(zhì)上是“算法背后設(shè)計(jì)者的價(jià)值邏輯或意識(shí)形態(tài)與用戶的互動(dòng)”。這就要求在算法設(shè)計(jì)者意識(shí)到“信息繭房”可能帶來(lái)的危害之后,主動(dòng)尋求一種更加優(yōu)化的解決方案,來(lái)建立可信的算法推薦的系統(tǒng)。
最主要的是在算法推薦之外,堅(jiān)持人機(jī)協(xié)同,即重視人工編輯在算法推薦基礎(chǔ)之上發(fā)揮應(yīng)用的作用,包括提供新聞專業(yè)主義的理念,設(shè)置更多的公共議題;提供更具權(quán)重的正反觀點(diǎn)信息;提供更多隨機(jī)視角的信息等等。
回到微軟新聞部門的裁員問題,之前是模式是AI算法來(lái)輔助人類新聞編輯,而未來(lái)更可能是人類新聞編輯來(lái)輔助AI算法,來(lái)優(yōu)化內(nèi)容推薦的質(zhì)量。顯然,AI算法推薦不可能完全取代人類編輯的工作。平臺(tái)也不會(huì)放心將自身的信譽(yù)和內(nèi)容的全部選擇權(quán)都交給AI算法。
一項(xiàng)技術(shù)的發(fā)明和應(yīng)用在人類的發(fā)展歷史上從來(lái)只起到一種助燃劑或催化劑的作用。
對(duì)于AI的算法推薦來(lái)說(shuō),它既不會(huì)毀掉傳統(tǒng)媒體的生存根基,也不會(huì)徹底將人類變成鼠目寸光、各自為營(yíng)的傻瓜。
其實(shí),如果我們認(rèn)真觀察,當(dāng)你發(fā)現(xiàn)身邊的老人開始整天盯著手機(jī),關(guān)注自己城市發(fā)生的各種事情,關(guān)心政府出臺(tái)的各種政策,關(guān)心自媒體里各種奇葩狗血的故事,未嘗不是對(duì)他們生活和精神的一種解放,至少更加開闊了眼界,不用再盯著家里的雞毛蒜皮。
而對(duì)于那些因?yàn)锳I而事業(yè)的媒體人,更加不必悲觀嘆氣。夜深人靜的時(shí)候,筆耕不輟地開始你的創(chuàng)作,這些內(nèi)容平臺(tái)可能會(huì)應(yīng)許你更加光明的前景。
評(píng)論
查看更多