0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)環(huán)境下,輿情研究方法存在哪些問題?如何迭代?

如意 ? 來源:網(wǎng)易新聞 ? 作者:《網(wǎng)絡(luò)傳播》雜志 ? 2020-08-17 17:52 ? 次閱讀

現(xiàn)有研究方法存在哪些問題?

“大數(shù)據(jù)”已儼然成為時(shí)代熱詞,社會(huì)學(xué)家說它是一座蘊(yùn)含了大量信息的富礦,統(tǒng)計(jì)學(xué)家卻認(rèn)為龐雜的結(jié)構(gòu)為數(shù)據(jù)分析帶來了巨大的挑戰(zhàn),從中提取有用信息猶如大海撈針。

相比于傳統(tǒng)數(shù)據(jù)類型,大數(shù)據(jù)的分析難度不言而喻。

如何用好這些數(shù)據(jù),高效提取有價(jià)值的信息,是在數(shù)據(jù)豐富的今天需要探討的話題。

大數(shù)據(jù)輿情分析面臨著數(shù)據(jù)量大、維度多樣、結(jié)構(gòu)復(fù)雜等問題。研究對(duì)象也從受眾個(gè)體發(fā)展到了受眾之間、傳受之間的復(fù)雜網(wǎng)絡(luò)關(guān)系,甚至雜糅了時(shí)間、空間維度等場(chǎng)景化信息。但現(xiàn)有的研究仍以數(shù)量統(tǒng)計(jì)和詞頻分析為主,難以深入挖掘大數(shù)據(jù)的潛在價(jià)值。

不同維度的數(shù)據(jù)都需要專業(yè)的分析方法,繼而革新了輿情研究的思維方式?;谪S富的輿情分析理論和經(jīng)驗(yàn),科學(xué)研究方法才能使輿情研究如虎添翼。

科學(xué)分析大數(shù)據(jù)有助于研究者打開視野,從更開闊的角度切入研究。根據(jù)不同研究意圖搭建復(fù)雜模型檢驗(yàn),深入因果推論,可以實(shí)現(xiàn)輿情研究的數(shù)據(jù)化、動(dòng)態(tài)化,也可以加強(qiáng)趨勢(shì)研判的延展性、科學(xué)性。

采用科學(xué)的研究方法、納入大數(shù)據(jù)模型,也是互聯(lián)網(wǎng)環(huán)境下輿情研究的發(fā)展趨勢(shì),為更加全面立體地掌握輿情動(dòng)態(tài)奠定了科學(xué)基礎(chǔ)。

科學(xué)研究方法的3大“用武之地”

筆者結(jié)合日常實(shí)踐,梳理了科學(xué)輿情研究方法在大數(shù)據(jù)層面的具體運(yùn)用。

1、基礎(chǔ)統(tǒng)計(jì)分析方法:掌握輿情全貌

基礎(chǔ)統(tǒng)計(jì)分析方法是掌握輿情全貌的重要基礎(chǔ)。

輿情發(fā)展是一個(gè)分階段的動(dòng)態(tài)過程,通過對(duì)數(shù)據(jù)所包含的維度進(jìn)行基礎(chǔ)統(tǒng)計(jì)計(jì)算,能夠獲得橫向切面和縱向發(fā)展的雙向描述,進(jìn)而掌握輿情全貌。

一是橫向比較橫截面數(shù)據(jù),描繪當(dāng)下輿論情況。

例如,在國際傳播研究中,首先要了解國際輿情。通過統(tǒng)計(jì)給定時(shí)間內(nèi)的輿情數(shù)量規(guī)模、情感傾向、話題細(xì)分等數(shù)據(jù),能夠快速勾勒基本輪廓,便于研究者了解某一時(shí)段的靜態(tài)輿情特征。

二是縱向?qū)Ρ葧r(shí)間序列數(shù)據(jù),動(dòng)態(tài)追蹤輿情態(tài)勢(shì)。

為深入研究國際輿情,還需長(zhǎng)期追蹤基礎(chǔ)統(tǒng)計(jì)量。持續(xù)累積同口徑數(shù)據(jù)列,便能回溯其發(fā)展趨勢(shì),并通過時(shí)間序列模型預(yù)測(cè)輿情發(fā)展態(tài)勢(shì)。

2、傳統(tǒng)量化研究方法:推動(dòng)輿情研判

傳統(tǒng)量化研究方法是推動(dòng)輿情研判的重要保障。

輿情研判是指通過特定方法對(duì)輿情信息的特性、態(tài)勢(shì)、走向進(jìn)行研究判斷的專業(yè)工作。大數(shù)據(jù)輿情研判需要借力傳統(tǒng)量化研究方法,采用相關(guān)分析探索不同變量間相互作用的關(guān)系,采用回歸分析探索變量間的依賴關(guān)系,并預(yù)測(cè)變量的發(fā)展趨勢(shì)。

一方面,將相關(guān)分析用于輿情研究,適用于分辨看似無關(guān)的信息間潛在的相互關(guān)聯(lián),能夠從龐雜的數(shù)據(jù)中發(fā)掘足以影響全局的非確定關(guān)系,從而確定如何在復(fù)雜環(huán)境中精準(zhǔn)研判輿情態(tài)勢(shì)。

2018年6月23日,泰國一支青少年足球隊(duì)被困洞穴,7月10日獲救。該事件引發(fā)全球媒體和公眾廣泛持續(xù)的關(guān)注。筆者在分析該事件時(shí)發(fā)現(xiàn),傳統(tǒng)媒體報(bào)道和社交平臺(tái)熱議話題間存在相關(guān)關(guān)系,兩個(gè)輿論場(chǎng)相互影響的復(fù)雜漸變關(guān)系還原了輿論觸發(fā)和影響機(jī)制。

另一方面,回歸分析應(yīng)用到輿情分析領(lǐng)域,能夠探究相關(guān)變量間的因果關(guān)系及發(fā)展走勢(shì),尋找輿情演變規(guī)律模型。通過建模分析,不僅可以判斷不同議題、國家、媒體間的關(guān)系,還能進(jìn)一步探究相關(guān)輿論的未來走勢(shì)。

例如,以各國媒體就新冠肺炎疫情的報(bào)道為素材建模,能夠從宏觀角度把握國際輿論,并直觀展現(xiàn)各國媒體新聞敘事的關(guān)系,探明媒體報(bào)道與國際輿論的相互影響,找到國際輿情的演變路徑。

3、量化文本分析方法:深度挖掘輿情

量化文本分析方法是深度挖掘輿情的重要助力。

大數(shù)據(jù)背后隱藏著肉眼難以識(shí)別的深層信息,尤其是在面對(duì)大量文本數(shù)據(jù)時(shí),難以靠傳統(tǒng)分析方法直接獲得全面信息。

以往針對(duì)文本的分析方法分析周期長(zhǎng)、研究耗時(shí)長(zhǎng)、人工工作量大,難以適應(yīng)輿情研究求快求全的現(xiàn)實(shí)要求。因此便需借力量化文本分析方法,集中處理數(shù)十萬乃至數(shù)千萬量級(jí)的文本內(nèi)容。

筆者在實(shí)踐中總結(jié)了適用于輿情研究的部分量化文本分析方法:

LDA主題模型算法

LDA(Latent Dirichlet Allocation)是統(tǒng)計(jì)學(xué)中常用的一種降維分析方法,即降低復(fù)雜的文本數(shù)據(jù)包含的維度。通過運(yùn)算歸類,具有相同特性的文本被識(shí)別為一組,進(jìn)而實(shí)現(xiàn)文本主題的機(jī)器分類。這一算法常用來提取子話題。

這種方法能夠大大縮短文本處理時(shí)間,通過計(jì)算實(shí)現(xiàn)文本內(nèi)容歸類,提高輿情子話題提取效率。

文本位置估計(jì)模型

文本位置估計(jì)模型是政治學(xué)領(lǐng)域的成熟算法,旨在通過計(jì)算文本中包含的政治學(xué)詞匯特征,判斷文本的左右派傾向。輿情研究可以借用該算法原理,通過計(jì)算詞頻、詞距、詞語間共現(xiàn)關(guān)系等信息,計(jì)算特定文本的相對(duì)位置,判斷研究對(duì)象的態(tài)度傾向差異。

例如,以此分析中美關(guān)系輿情,可以直觀看到中美受眾的不同立場(chǎng)表達(dá),并根據(jù)文本位置距離判斷未來發(fā)展趨勢(shì)。

基于社會(huì)網(wǎng)絡(luò)分析方法的詞語共現(xiàn)關(guān)系分析

如前文所述,文本之中也隱藏著復(fù)雜的詞語網(wǎng)絡(luò)。探詢文本的共現(xiàn)網(wǎng)絡(luò),是還原語境的重要路徑。

前文的分析方法多將文本分裂為詞組,計(jì)算使用的矩陣也常常忽略了語句連接在一起的整體含義。采用社會(huì)網(wǎng)絡(luò)分析方法,可以描繪出詞語間的距離與聯(lián)系,可以在一定程度上探索其出現(xiàn)的語境,還原斷裂的文本。

數(shù)據(jù)輿情時(shí)代,研究方法的3大變遷

把握輿論脈搏,洞悉輿情走向,是信息化社會(huì)了解民意的重要因素。數(shù)據(jù)與輿情結(jié)合的產(chǎn)物——數(shù)據(jù)輿情也已應(yīng)時(shí)代要求而生,亟待從業(yè)人員理論結(jié)合實(shí)踐,吸納科學(xué)分析方法,提升數(shù)據(jù)處理和輿情研判能力。

1、加強(qiáng)數(shù)據(jù)挖掘能力

數(shù)據(jù)是所有分析的原材料,沒有數(shù)據(jù)再精巧的方法也難為無米之炊。

數(shù)據(jù)輿情行業(yè)研究,需要以數(shù)據(jù)積累為目的長(zhǎng)期挖掘和存儲(chǔ),注重日常數(shù)據(jù)的挖掘和積累,不斷拓展數(shù)據(jù)邊緣。搭建龐大的數(shù)據(jù)倉庫,提升數(shù)據(jù)使用效率,是發(fā)展數(shù)據(jù)輿情的首要條件。

2、提升數(shù)據(jù)分析能力

在掌握了大量數(shù)據(jù)之后,分析能力便成為了挖掘輿情的主要難題。

在輿情研究領(lǐng)域,數(shù)據(jù)分析能力具體體現(xiàn)為科學(xué)研究方法的掌握和使用能力。為進(jìn)一步提高輿情分析的效率和質(zhì)量,強(qiáng)化量化研判與輿情工作的深度融合,提升數(shù)據(jù)分析能力,是發(fā)展數(shù)據(jù)輿情的必要條件。

3、強(qiáng)化數(shù)據(jù)合作共享

數(shù)據(jù)是取之不盡的可再生資源,研究者根據(jù)日常工作的專長(zhǎng)和角度不同,掌握的數(shù)據(jù)形式大為不同。

因此,強(qiáng)化以行業(yè)實(shí)踐為基礎(chǔ)的合作機(jī)制,是推動(dòng)數(shù)據(jù)輿情化和輿情數(shù)據(jù)化的大勢(shì)所趨。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    工程大數(shù)據(jù)平臺(tái)

    由于無人駕駛系統(tǒng)開發(fā)需要長(zhǎng)期迭代優(yōu)化,其過程需要大量的路試數(shù)據(jù)支撐,經(jīng)緯恒潤(rùn)針對(duì)無人駕駛系統(tǒng)持續(xù)運(yùn)營(yíng)和持續(xù)迭代的需求,開發(fā)并在云端部署了車路云工程大數(shù)據(jù)平臺(tái),依托5G網(wǎng)絡(luò),具有遠(yuǎn)程
    的頭像 發(fā)表于 01-10 17:00 ?131次閱讀
    工程<b class='flag-5'>大數(shù)據(jù)</b>平臺(tái)

    緩存對(duì)大數(shù)據(jù)處理的影響分析

    緩存對(duì)大數(shù)據(jù)處理的影響顯著且重要,主要體現(xiàn)在以下幾個(gè)方面: 一、提高數(shù)據(jù)訪問速度 在大數(shù)據(jù)環(huán)境中,數(shù)據(jù)存儲(chǔ)通常采用分布式存儲(chǔ)系統(tǒng),
    的頭像 發(fā)表于 12-18 09:45 ?230次閱讀

    數(shù)據(jù)驅(qū)動(dòng)AI工具在哪

    數(shù)據(jù)驅(qū)動(dòng)AI工具并不遙遠(yuǎn),它們就存在于我們的日常生活中,只是我們可能沒有意識(shí)到。這些工具通常被嵌入到各種應(yīng)用程序、軟件和服務(wù)中,為我們提供便利。接下來,AI部落小編為您詳細(xì)介紹數(shù)據(jù)驅(qū)動(dòng)AI工具
    的頭像 發(fā)表于 12-09 10:52 ?174次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    的具體應(yīng)用: 一、提高性能 并行讀寫 :RAID技術(shù)通過并行讀寫多個(gè)磁盤,可以顯著提高數(shù)據(jù)的讀寫速度。在大數(shù)據(jù)分析環(huán)境中,數(shù)據(jù)讀寫速度是影響分析效率的關(guān)鍵因素之一。RAID 0(條帶化
    的頭像 發(fā)表于 11-12 09:44 ?298次閱讀

    智慧城市與大數(shù)據(jù)的關(guān)系

    智慧城市與大數(shù)據(jù)之間存在著密切的關(guān)系,這種關(guān)系體現(xiàn)在大數(shù)據(jù)對(duì)智慧城市建設(shè)的支撐和推動(dòng)作用,以及智慧城市產(chǎn)生的大量數(shù)據(jù)對(duì)大數(shù)據(jù)技術(shù)的應(yīng)用需求。
    的頭像 發(fā)表于 10-24 15:27 ?828次閱讀

    RF功率檢波器芯片都存在哪些噪聲?

    RF功率檢波器芯片都存在哪些噪聲?熱噪聲?寬帶噪聲?如果分析,在數(shù)據(jù)手冊(cè)上并沒有找到相應(yīng)的說明,文獻(xiàn)也沒有,請(qǐng)大神指導(dǎo),麻煩~
    發(fā)表于 08-20 07:16

    大數(shù)據(jù)采集系統(tǒng)分為幾類

    大數(shù)據(jù)采集系統(tǒng)是大數(shù)據(jù)生態(tài)系統(tǒng)中的重要組成部分,它負(fù)責(zé)從各種數(shù)據(jù)源收集、整合和存儲(chǔ)數(shù)據(jù)。根據(jù)不同的數(shù)據(jù)源、采集
    的頭像 發(fā)表于 07-01 15:44 ?1687次閱讀

    “Spark+Hive”在DPU環(huán)境的性能測(cè)評(píng) | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分節(jié)選

    在奇點(diǎn)云2024年版《OLAP數(shù)據(jù)庫引擎選型白皮書》中,中科馭數(shù)聯(lián)合奇點(diǎn)云針對(duì)Spark+Hive這類大數(shù)據(jù)計(jì)算場(chǎng)景的主力引擎,測(cè)評(píng)DPU環(huán)境
    的頭像 發(fā)表于 05-30 16:09 ?573次閱讀
    “Spark+Hive”在DPU<b class='flag-5'>環(huán)境</b><b class='flag-5'>下</b>的性能測(cè)評(píng) | OLAP<b class='flag-5'>數(shù)據(jù)</b>庫引擎選型白皮書(24版)DPU部分節(jié)選

    stm8的ADC工作在掃描模式時(shí),如果順次掃描通道1,通道2,通道3,轉(zhuǎn)換完成后的數(shù)據(jù)分別存在哪個(gè)數(shù)據(jù)緩存器中呢?

    stm8的adc工作在單次掃描模式時(shí),如果順次掃描通道1,通道2,通道3,那么轉(zhuǎn)換完成后的數(shù)據(jù)分別存在哪個(gè)數(shù)據(jù)緩存器中呢?有ADC_DB0到ADC_DB9九個(gè)數(shù)據(jù)緩存器呢,路過的高手
    發(fā)表于 05-13 06:52

    云手機(jī)的境外輿情監(jiān)控應(yīng)用——助力品牌公關(guān)

    在當(dāng)今數(shù)字化時(shí)代,社交媒體已成為品牌傳播和互動(dòng)的主要平臺(tái)。隨之而來的是海量的信息涌入,品牌需要及時(shí)了解并應(yīng)對(duì)海外社交媒體上的輿情變化。本文將介紹如何通過云手機(jī)進(jìn)行境外輿情監(jiān)控,更好地幫助企業(yè)公關(guān)及時(shí)作出決策。
    的頭像 發(fā)表于 03-04 16:23 ?639次閱讀

    用云手機(jī)進(jìn)行輿情監(jiān)測(cè)有什么作用?

    在信息爆炸的時(shí)代,輿情監(jiān)測(cè)成為企業(yè)和政府決策的重要工具。通過結(jié)合云手機(jī)技術(shù),輿情監(jiān)測(cè)系統(tǒng)在品牌形象維護(hù)、市場(chǎng)競(jìng)爭(zhēng)、產(chǎn)品研發(fā)、政府管理以及市場(chǎng)營(yíng)銷等方面發(fā)揮著關(guān)鍵作用,為用戶提供更智能、高效的輿情解決方案。
    的頭像 發(fā)表于 03-04 16:13 ?644次閱讀

    CYBT-343026傳輸大數(shù)據(jù)時(shí)會(huì)丟數(shù)據(jù)的原因?

    我正在使用 CYBT-343026 (CYW-20706 Silicon) 模塊。 我根據(jù) SPP 樣本制作了一個(gè)操作 SPP 的應(yīng)用程序。 但是,傳輸大數(shù)據(jù)時(shí)有時(shí)會(huì)丟失數(shù)據(jù)。 它從
    發(fā)表于 03-01 15:04

    請(qǐng)問節(jié)點(diǎn)上藍(lán)牙網(wǎng)狀網(wǎng)絡(luò)的信息保存在哪里?

    另一個(gè)帶有 “Mesh Demo Dimmer Self Config” 示例的目標(biāo)時(shí),它必須保存網(wǎng)絡(luò)數(shù)據(jù)。 但是,我想知道它保存在哪里,以及哪個(gè)函數(shù)負(fù)責(zé)保存數(shù)據(jù)。 我已經(jīng)搜索過它,但我 CAN找不到它。 當(dāng) “網(wǎng)狀演示嵌入式配
    發(fā)表于 03-01 08:09

    淺析大數(shù)據(jù)時(shí)代數(shù)據(jù)中心運(yùn)維管理

    淺析大數(shù)據(jù)時(shí)代數(shù)據(jù)中心運(yùn)維管理 張穎姣 安科瑞電氣股份有限公司?上海嘉定201801 摘要:本文將從數(shù)據(jù)中心運(yùn)維管理的角度,聯(lián)系現(xiàn)實(shí)情況,對(duì)運(yùn)維管理進(jìn)行
    的頭像 發(fā)表于 02-22 14:40 ?430次閱讀
    淺析<b class='flag-5'>大數(shù)據(jù)</b>時(shí)代<b class='flag-5'>下</b>的<b class='flag-5'>數(shù)據(jù)</b>中心運(yùn)維管理

    大數(shù)據(jù)技術(shù)是干嘛的 大數(shù)據(jù)核心技術(shù)有哪些

    大數(shù)據(jù)技術(shù)是指用來處理和存儲(chǔ)海量、多類型、高速的數(shù)據(jù)的一系列技術(shù)和工具。現(xiàn)如今,大數(shù)據(jù)已經(jīng)滲透到各個(gè)行業(yè)和領(lǐng)域,對(duì)企業(yè)決策和業(yè)務(wù)發(fā)展起到了重要作用。本文將詳細(xì)介紹大數(shù)據(jù)技術(shù)的概念、發(fā)展
    的頭像 發(fā)表于 01-31 11:07 ?3787次閱讀