現(xiàn)有研究方法存在哪些問題?
“大數(shù)據(jù)”已儼然成為時(shí)代熱詞,社會(huì)學(xué)家說它是一座蘊(yùn)含了大量信息的富礦,統(tǒng)計(jì)學(xué)家卻認(rèn)為龐雜的結(jié)構(gòu)為數(shù)據(jù)分析帶來了巨大的挑戰(zhàn),從中提取有用信息猶如大海撈針。
相比于傳統(tǒng)數(shù)據(jù)類型,大數(shù)據(jù)的分析難度不言而喻。
如何用好這些數(shù)據(jù),高效提取有價(jià)值的信息,是在數(shù)據(jù)豐富的今天需要探討的話題。
大數(shù)據(jù)輿情分析面臨著數(shù)據(jù)量大、維度多樣、結(jié)構(gòu)復(fù)雜等問題。研究對(duì)象也從受眾個(gè)體發(fā)展到了受眾之間、傳受之間的復(fù)雜網(wǎng)絡(luò)關(guān)系,甚至雜糅了時(shí)間、空間維度等場(chǎng)景化信息。但現(xiàn)有的研究仍以數(shù)量統(tǒng)計(jì)和詞頻分析為主,難以深入挖掘大數(shù)據(jù)的潛在價(jià)值。
不同維度的數(shù)據(jù)都需要專業(yè)的分析方法,繼而革新了輿情研究的思維方式?;谪S富的輿情分析理論和經(jīng)驗(yàn),科學(xué)研究方法才能使輿情研究如虎添翼。
科學(xué)分析大數(shù)據(jù)有助于研究者打開視野,從更開闊的角度切入研究。根據(jù)不同研究意圖搭建復(fù)雜模型檢驗(yàn),深入因果推論,可以實(shí)現(xiàn)輿情研究的數(shù)據(jù)化、動(dòng)態(tài)化,也可以加強(qiáng)趨勢(shì)研判的延展性、科學(xué)性。
采用科學(xué)的研究方法、納入大數(shù)據(jù)模型,也是互聯(lián)網(wǎng)環(huán)境下輿情研究的發(fā)展趨勢(shì),為更加全面立體地掌握輿情動(dòng)態(tài)奠定了科學(xué)基礎(chǔ)。
科學(xué)研究方法的3大“用武之地”
筆者結(jié)合日常實(shí)踐,梳理了科學(xué)輿情研究方法在大數(shù)據(jù)層面的具體運(yùn)用。
1、基礎(chǔ)統(tǒng)計(jì)分析方法:掌握輿情全貌
基礎(chǔ)統(tǒng)計(jì)分析方法是掌握輿情全貌的重要基礎(chǔ)。
輿情發(fā)展是一個(gè)分階段的動(dòng)態(tài)過程,通過對(duì)數(shù)據(jù)所包含的維度進(jìn)行基礎(chǔ)統(tǒng)計(jì)計(jì)算,能夠獲得橫向切面和縱向發(fā)展的雙向描述,進(jìn)而掌握輿情全貌。
一是橫向比較橫截面數(shù)據(jù),描繪當(dāng)下輿論情況。
例如,在國際傳播研究中,首先要了解國際輿情。通過統(tǒng)計(jì)給定時(shí)間內(nèi)的輿情數(shù)量規(guī)模、情感傾向、話題細(xì)分等數(shù)據(jù),能夠快速勾勒基本輪廓,便于研究者了解某一時(shí)段的靜態(tài)輿情特征。
二是縱向?qū)Ρ葧r(shí)間序列數(shù)據(jù),動(dòng)態(tài)追蹤輿情態(tài)勢(shì)。
為深入研究國際輿情,還需長(zhǎng)期追蹤基礎(chǔ)統(tǒng)計(jì)量。持續(xù)累積同口徑數(shù)據(jù)列,便能回溯其發(fā)展趨勢(shì),并通過時(shí)間序列模型預(yù)測(cè)輿情發(fā)展態(tài)勢(shì)。
2、傳統(tǒng)量化研究方法:推動(dòng)輿情研判
傳統(tǒng)量化研究方法是推動(dòng)輿情研判的重要保障。
輿情研判是指通過特定方法對(duì)輿情信息的特性、態(tài)勢(shì)、走向進(jìn)行研究判斷的專業(yè)工作。大數(shù)據(jù)輿情研判需要借力傳統(tǒng)量化研究方法,采用相關(guān)分析探索不同變量間相互作用的關(guān)系,采用回歸分析探索變量間的依賴關(guān)系,并預(yù)測(cè)變量的發(fā)展趨勢(shì)。
一方面,將相關(guān)分析用于輿情研究,適用于分辨看似無關(guān)的信息間潛在的相互關(guān)聯(lián),能夠從龐雜的數(shù)據(jù)中發(fā)掘足以影響全局的非確定關(guān)系,從而確定如何在復(fù)雜環(huán)境中精準(zhǔn)研判輿情態(tài)勢(shì)。
2018年6月23日,泰國一支青少年足球隊(duì)被困洞穴,7月10日獲救。該事件引發(fā)全球媒體和公眾廣泛持續(xù)的關(guān)注。筆者在分析該事件時(shí)發(fā)現(xiàn),傳統(tǒng)媒體報(bào)道和社交平臺(tái)熱議話題間存在相關(guān)關(guān)系,兩個(gè)輿論場(chǎng)相互影響的復(fù)雜漸變關(guān)系還原了輿論觸發(fā)和影響機(jī)制。
另一方面,回歸分析應(yīng)用到輿情分析領(lǐng)域,能夠探究相關(guān)變量間的因果關(guān)系及發(fā)展走勢(shì),尋找輿情演變規(guī)律模型。通過建模分析,不僅可以判斷不同議題、國家、媒體間的關(guān)系,還能進(jìn)一步探究相關(guān)輿論的未來走勢(shì)。
例如,以各國媒體就新冠肺炎疫情的報(bào)道為素材建模,能夠從宏觀角度把握國際輿論,并直觀展現(xiàn)各國媒體新聞敘事的關(guān)系,探明媒體報(bào)道與國際輿論的相互影響,找到國際輿情的演變路徑。
3、量化文本分析方法:深度挖掘輿情
量化文本分析方法是深度挖掘輿情的重要助力。
大數(shù)據(jù)背后隱藏著肉眼難以識(shí)別的深層信息,尤其是在面對(duì)大量文本數(shù)據(jù)時(shí),難以靠傳統(tǒng)分析方法直接獲得全面信息。
以往針對(duì)文本的分析方法分析周期長(zhǎng)、研究耗時(shí)長(zhǎng)、人工工作量大,難以適應(yīng)輿情研究求快求全的現(xiàn)實(shí)要求。因此便需借力量化文本分析方法,集中處理數(shù)十萬乃至數(shù)千萬量級(jí)的文本內(nèi)容。
筆者在實(shí)踐中總結(jié)了適用于輿情研究的部分量化文本分析方法:
LDA主題模型算法
LDA(Latent Dirichlet Allocation)是統(tǒng)計(jì)學(xué)中常用的一種降維分析方法,即降低復(fù)雜的文本數(shù)據(jù)包含的維度。通過運(yùn)算歸類,具有相同特性的文本被識(shí)別為一組,進(jìn)而實(shí)現(xiàn)文本主題的機(jī)器分類。這一算法常用來提取子話題。
這種方法能夠大大縮短文本處理時(shí)間,通過計(jì)算實(shí)現(xiàn)文本內(nèi)容歸類,提高輿情子話題提取效率。
文本位置估計(jì)模型
文本位置估計(jì)模型是政治學(xué)領(lǐng)域的成熟算法,旨在通過計(jì)算文本中包含的政治學(xué)詞匯特征,判斷文本的左右派傾向。輿情研究可以借用該算法原理,通過計(jì)算詞頻、詞距、詞語間共現(xiàn)關(guān)系等信息,計(jì)算特定文本的相對(duì)位置,判斷研究對(duì)象的態(tài)度傾向差異。
例如,以此分析中美關(guān)系輿情,可以直觀看到中美受眾的不同立場(chǎng)表達(dá),并根據(jù)文本位置距離判斷未來發(fā)展趨勢(shì)。
基于社會(huì)網(wǎng)絡(luò)分析方法的詞語共現(xiàn)關(guān)系分析
如前文所述,文本之中也隱藏著復(fù)雜的詞語網(wǎng)絡(luò)。探詢文本的共現(xiàn)網(wǎng)絡(luò),是還原語境的重要路徑。
前文的分析方法多將文本分裂為詞組,計(jì)算使用的矩陣也常常忽略了語句連接在一起的整體含義。采用社會(huì)網(wǎng)絡(luò)分析方法,可以描繪出詞語間的距離與聯(lián)系,可以在一定程度上探索其出現(xiàn)的語境,還原斷裂的文本。
數(shù)據(jù)輿情時(shí)代,研究方法的3大變遷
把握輿論脈搏,洞悉輿情走向,是信息化社會(huì)了解民意的重要因素。數(shù)據(jù)與輿情結(jié)合的產(chǎn)物——數(shù)據(jù)輿情也已應(yīng)時(shí)代要求而生,亟待從業(yè)人員理論結(jié)合實(shí)踐,吸納科學(xué)分析方法,提升數(shù)據(jù)處理和輿情研判能力。
1、加強(qiáng)數(shù)據(jù)挖掘能力
數(shù)據(jù)是所有分析的原材料,沒有數(shù)據(jù)再精巧的方法也難為無米之炊。
數(shù)據(jù)輿情行業(yè)研究,需要以數(shù)據(jù)積累為目的長(zhǎng)期挖掘和存儲(chǔ),注重日常數(shù)據(jù)的挖掘和積累,不斷拓展數(shù)據(jù)邊緣。搭建龐大的數(shù)據(jù)倉庫,提升數(shù)據(jù)使用效率,是發(fā)展數(shù)據(jù)輿情的首要條件。
2、提升數(shù)據(jù)分析能力
在掌握了大量數(shù)據(jù)之后,分析能力便成為了挖掘輿情的主要難題。
在輿情研究領(lǐng)域,數(shù)據(jù)分析能力具體體現(xiàn)為科學(xué)研究方法的掌握和使用能力。為進(jìn)一步提高輿情分析的效率和質(zhì)量,強(qiáng)化量化研判與輿情工作的深度融合,提升數(shù)據(jù)分析能力,是發(fā)展數(shù)據(jù)輿情的必要條件。
3、強(qiáng)化數(shù)據(jù)合作共享
數(shù)據(jù)是取之不盡的可再生資源,研究者根據(jù)日常工作的專長(zhǎng)和角度不同,掌握的數(shù)據(jù)形式大為不同。
因此,強(qiáng)化以行業(yè)實(shí)踐為基礎(chǔ)的合作機(jī)制,是推動(dòng)數(shù)據(jù)輿情化和輿情數(shù)據(jù)化的大勢(shì)所趨。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11184瀏覽量
103729 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1460瀏覽量
34129 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8908瀏覽量
137711
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論