美國總統(tǒng)競選前,一些國外的大數(shù)據(jù)預(yù)測公司預(yù)測特朗普將連任,但是最終拜登當選了,現(xiàn)實打了臉。有些人疑問,大數(shù)據(jù)預(yù)測難道和算命術(shù)一樣不準嗎?
什么是大數(shù)據(jù)預(yù)測?
一般解釋,大數(shù)據(jù)是指海量的數(shù)據(jù)集。如今,萬物互聯(lián),尤其是移動互聯(lián)網(wǎng)的普及,工作和生活都已經(jīng)離不開信息設(shè)備,使用過程中無疑會產(chǎn)生大量的數(shù)據(jù),大數(shù)據(jù)時代早就來臨。
我國網(wǎng)民數(shù)量全球第一,各種上網(wǎng)活動都會產(chǎn)生數(shù)據(jù),這其中包括網(wǎng)購,每天千萬次以上級別的交易量。網(wǎng)頁搜索,同樣產(chǎn)生巨量的數(shù)據(jù)。即使我們不使用網(wǎng)絡(luò),城市里各種各樣持續(xù)運行的監(jiān)控以及傳感器,銀行、醫(yī)院、地鐵等單位處理業(yè)務(wù)的應(yīng)用系統(tǒng),都在產(chǎn)生大數(shù)據(jù)。大數(shù)據(jù)無處不在。
大數(shù)據(jù)預(yù)測則是大數(shù)據(jù)的核心應(yīng)用,埃里克?西格爾在關(guān)于大數(shù)據(jù)預(yù)測的書中曾指出,大數(shù)據(jù)預(yù)測是通過學(xué)習(xí)和分析數(shù)據(jù),來預(yù)測未來的一種科學(xué)技術(shù),可以幫助執(zhí)行人更好地決策。
大數(shù)據(jù)預(yù)測失效
這次美國大選,特朗普和拜登分屬的共和黨、民主黨都有自己固定的票倉,在這些州大數(shù)據(jù)預(yù)測也比較準。但是,往往決定總統(tǒng)競選結(jié)果的是那些搖擺州,搖擺州的民意調(diào)查也經(jīng)常不精準,如何建立有效的預(yù)測模型,成了預(yù)測結(jié)果是否準確的關(guān)鍵。
一家預(yù)測特朗普連任的大數(shù)據(jù)公司,他們建立的模型是,分析網(wǎng)民搜索特朗普和拜登丑聞的比例。數(shù)據(jù)顯示搜索拜登丑聞的網(wǎng)民遠多于特朗普,通過丑聞搜索來預(yù)測競選結(jié)果,前幾次大選都顯示了這種模型的準確性。
大數(shù)據(jù)預(yù)測失效是因為建立的模型準確性有偏差。
但是,此次特朗普團隊對美國疫情的控制不力成為他很大的丑聞,網(wǎng)民查看新冠疫情,或者通過其他途徑知曉新冠疫情,其實也是在查看特朗普的丑聞。如果該公司考慮到新冠疫情的搜索情況,重新建立模型,大數(shù)據(jù)預(yù)測就將變?yōu)榘莸莿龠x。
所以,不是大數(shù)據(jù)預(yù)測不準,是設(shè)計大數(shù)據(jù)模型的人沒有充分考慮到新冠疫情,也沒有把它納入預(yù)測模型中。另外數(shù)據(jù)源不準確,也會影響預(yù)測結(jié)果。例如有些人在做民意調(diào)查時,隱藏自己真正內(nèi)心想法,這些都會變成錯誤的數(shù)據(jù)源。
國內(nèi)一家大數(shù)據(jù)預(yù)測機構(gòu)宣布,他們充分考慮了各種因素,建立了正確的預(yù)測模型,預(yù)測結(jié)果拜登勝選,說明大數(shù)據(jù)預(yù)測還是可信的。大數(shù)據(jù)預(yù)測模型的建立非常難,結(jié)果沒出來前,我們都沒法知道誰的模型正確,所以大數(shù)據(jù)預(yù)測有優(yōu)點也有不足,企業(yè)決策需要全面均衡考慮。
應(yīng)用領(lǐng)域多
數(shù)據(jù)每時每刻都在產(chǎn)生和被記錄,大數(shù)據(jù)預(yù)測也正在成為各個領(lǐng)域的關(guān)鍵技術(shù),在我們社會中發(fā)揮重要作用。
1.天氣預(yù)報
大數(shù)據(jù)預(yù)測應(yīng)用的典型案例是天氣預(yù)報,在信息技術(shù)日趨發(fā)達的今天,在云計算和人工智能的幫助下,用先進的大數(shù)據(jù)技術(shù)處理和融合數(shù)據(jù),氣象預(yù)測會越來越準確。
氣象數(shù)據(jù),主要來源于氣象衛(wèi)星、氣象雷達、氣象站,以及各個專業(yè)機構(gòu)的數(shù)據(jù)。天氣預(yù)報即在海量的“大數(shù)據(jù)”基礎(chǔ)下進行預(yù)測。
中國氣象局高級工程師唐千紅指出,不久的將來,地理信息和社會大數(shù)據(jù)均會為氣象服務(wù),我們可以精準了解任何時間和空間的氣象信息。
2.軍事預(yù)測
“知己知彼,百戰(zhàn)不殆”。在軍事領(lǐng)域,大數(shù)據(jù)結(jié)合云計算和人工智能技術(shù)發(fā)揮著重要作用,可以提高軍事預(yù)測準確度,為戰(zhàn)略和戰(zhàn)術(shù)提供科學(xué)依據(jù)。
現(xiàn)代武器的信息化程度越來越高,智能化裝備也在增加,這些軍事裝備可以源源不斷采集各種戰(zhàn)場數(shù)據(jù)。例如,軍事衛(wèi)星和雷達等系統(tǒng)會監(jiān)測到各種數(shù)據(jù);各種用電設(shè)備會產(chǎn)生電磁輻射,這也是戰(zhàn)場數(shù)據(jù)的一種來源,將各種數(shù)據(jù)匯集,利用大數(shù)據(jù)技術(shù),可以對敵我雙方情況掌握更清楚,對戰(zhàn)爭狀況進行有效預(yù)測,并制定更加有效的作戰(zhàn)計劃。
“兵馬未動,糧草先行”,后勤補給在戰(zhàn)爭中非常重要,基于大數(shù)據(jù)的預(yù)測模型,可以采集作戰(zhàn)對象和作戰(zhàn)環(huán)境等數(shù)據(jù),然后更科學(xué)預(yù)測出彈藥補給、傷亡情況等,以便很大程度地提供后勤保障。
3.交通預(yù)測
在城市修路,大數(shù)據(jù)可以分析出合適的路線,建設(shè)單位也可以利用大數(shù)據(jù)預(yù)測,得出未來的車流量,就知道該建幾條車道等,交通管理部門也可通過大數(shù)據(jù)預(yù)測,掌握各個時間段和區(qū)域的車流量,實施智能化的車輛調(diào)度。
我們經(jīng)常使用的導(dǎo)航軟件,后臺也開啟了大數(shù)據(jù)系統(tǒng),可預(yù)測出合適的路線,隨著技術(shù)的完善,預(yù)測的路線已經(jīng)越來越精準。
4.疫情預(yù)測
2009年,一家互聯(lián)網(wǎng)科技巨頭利用美國人在互聯(lián)網(wǎng)的搜索數(shù)據(jù),與歷史上流感傳播期的數(shù)據(jù)進行對比,并用預(yù)測模型進行分析,成功預(yù)測了2009年的美國流感,并把位置精細到州和地區(qū),比官方數(shù)據(jù)更精準,時間更早。
此次新冠疫情,也有大數(shù)據(jù)預(yù)測公司根據(jù)某些國家的行政政策、人文環(huán)境、衛(wèi)生習(xí)慣、醫(yī)療條件和隔離措施等數(shù)據(jù),預(yù)測出哪些國家疫情會比較嚴重些。
5.其他應(yīng)用
賽果預(yù)測,有些互聯(lián)網(wǎng)公司利用大數(shù)據(jù)平臺,預(yù)測體育賽事,也有些和博彩相關(guān)的公司,正在用大數(shù)據(jù)預(yù)測彩票的結(jié)果。
金融市場預(yù)測,有些金融公司希望借大數(shù)據(jù)預(yù)測知曉金融市場走向,有個別公司獲得了一定成功。
物價指數(shù)預(yù)測,大數(shù)據(jù)預(yù)測可以更加精準預(yù)測物價趨勢,能提前發(fā)現(xiàn)通貨膨脹或經(jīng)濟危機的蛛絲馬跡。
用戶需求預(yù)測,通過收集消費者的上網(wǎng)行為數(shù)據(jù),大數(shù)據(jù)可以分析和洞察消費者的需求,相關(guān)的公司可以利用這些分析數(shù)據(jù),推出和優(yōu)化商品。
自然災(zāi)害預(yù)測,在物聯(lián)網(wǎng)時代,傳感器、攝像頭和無線通訊遍布全球,利用各種監(jiān)測設(shè)備采集的大數(shù)據(jù),可以更加有效地預(yù)測將要發(fā)生的洪澇、高溫等自然災(zāi)害,有利于我們提前做好預(yù)防措施。
除了上面列舉的多個領(lǐng)域之外,在環(huán)境變化預(yù)測、污染排放預(yù)測、未來健康預(yù)測、行業(yè)發(fā)展預(yù)測、風(fēng)險評估等領(lǐng)域,大數(shù)據(jù)預(yù)測正在發(fā)揮著重要作用,雖然大數(shù)據(jù)預(yù)測也未必百分百準確,但是這是預(yù)測領(lǐng)域比較好的方法。
處理好隱私,發(fā)展更廣
中研普華研究報告指出,44.1%的受訪企業(yè)表示,隱私保護成為制約大數(shù)據(jù)發(fā)展的第一障礙,既要保護好隱私,又要利用這些數(shù)據(jù)做預(yù)測,是大數(shù)據(jù)預(yù)測公司必須面對并解決好的難題。
中國科學(xué)院院士王小云教授指出,在信息時代,大數(shù)據(jù)面臨嚴峻的安全問題,個人隱私如何更好的保護面臨挑戰(zhàn)。舉例說,我們在超市和網(wǎng)上都會留下購物信息,在手機里存儲個人秘密,在醫(yī)院里有就診記錄。智慧城市系統(tǒng)有很多傳感器記錄,我們的指紋、臉部識別照片經(jīng)常被其他機構(gòu)獲取。而這些信息如果被泄露,可能會為黑色產(chǎn)業(yè)鏈提供財富。
大數(shù)據(jù)預(yù)測公司使用這些數(shù)據(jù)時,需要格外小心,既要做到不侵犯他人隱私,也要有足夠的措施保護好數(shù)據(jù)。
王小云教授強調(diào),保護個人隱私,法律保障是基礎(chǔ)。在我國,已有了三部法律,分別是電子簽名法、網(wǎng)絡(luò)安全法和電子商務(wù)法,另外,個人信息保護法有望出臺,通過這些法律可為大數(shù)據(jù)保駕護航。
大數(shù)據(jù)預(yù)測公司,應(yīng)在符合法律的基礎(chǔ)上,開展更多的預(yù)測應(yīng)用。在未來,大數(shù)據(jù)預(yù)測的市場會越來越大。
責(zé)編AJX
-
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1451瀏覽量
34071 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8894瀏覽量
137483 -
特朗普
+關(guān)注
關(guān)注
1文章
288瀏覽量
19823
發(fā)布評論請先 登錄
相關(guān)推薦
評論