0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用機(jī)器學(xué)習(xí)識(shí)別加密項(xiàng)目風(fēng)險(xiǎn)

姚小熊27 ? 來源:今日頭條 ? 作者:今日頭條 ? 2021-01-22 10:18 ? 次閱讀

加密貨幣是一種存在于數(shù)字世界的交易媒介(另一種支付形式),依靠加密技術(shù)使交易安全。加密貨幣背后的技術(shù)允許用戶直接向他人發(fā)送貨幣,而不需要通過第三方,如銀行。為了進(jìn)行這些交易,用戶需要設(shè)置一個(gè)數(shù)字錢包,而不需要提供身份證號(hào)碼或信用評(píng)分等個(gè)人細(xì)節(jié),因此可以讓用戶偽匿名。

對(duì)于普通的加密貨幣用戶來說,這種匿名性可以讓他們放心,因?yàn)樗麄兊膫€(gè)人信息或交易數(shù)據(jù)不會(huì)被黑客竊取。然而,這種交易匿名性的提高,也容易被犯罪分子濫用,進(jìn)行洗錢、恐怖融資等非法活動(dòng)。這種非法活動(dòng)給區(qū)塊鏈錢包用戶以及加密貨幣實(shí)體都造成了巨大的損失。雖然金融行動(dòng)特別工作組(FATF)等監(jiān)管機(jī)構(gòu)已經(jīng)在這些實(shí)體的監(jiān)管中引入了標(biāo)準(zhǔn)化的指導(dǎo)方針,但由于每天都有大量的加密貨幣實(shí)體和交易發(fā)生,監(jiān)控加密貨幣空間是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。

解決方案

因此,人們有興趣利用開源信息,例如新聞網(wǎng)站或社交媒體平臺(tái),來識(shí)別可能的安全漏洞或非法活動(dòng)。在與Lynx Analytics的合作中,我們(來自新加坡國(guó)立大學(xué)的一個(gè)學(xué)生團(tuán)隊(duì))已經(jīng)致力于開發(fā)一個(gè)自動(dòng)工具,以刮取開源信息,預(yù)測(cè)每篇新聞文章的風(fēng)險(xiǎn)分?jǐn)?shù),并標(biāo)記出風(fēng)險(xiǎn)文章。這個(gè)工具將被整合到Cylynx平臺(tái)(https://www.cylynx.io/)中,這是Lynx Analytics開發(fā)的一個(gè)工具,用于幫助監(jiān)管機(jī)構(gòu)通過使用各種信息源監(jiān)控區(qū)塊鏈活動(dòng)。

開源信息的數(shù)據(jù)獲取

我們確定了3類開源數(shù)據(jù),這些數(shù)據(jù)可以提供有價(jià)值的信息,幫助檢測(cè)加密貨幣領(lǐng)域的可疑活動(dòng)。這些類別是:

傳統(tǒng)的新聞網(wǎng)站,如谷歌新聞,它將報(bào)告重大的黑客事件。

加密貨幣專用新聞網(wǎng)站,如Cryptonews和Cointelegraph,它們更有可能報(bào)道小型實(shí)體和小型安全事件的新聞。

社交媒體網(wǎng)站,如Twitter和Reddit,在官方發(fā)布黑客新聞之前,加密貨幣所有者可能會(huì)在那里發(fā)布有關(guān)黑客的消息。

檢索文章和社交媒體帖子的內(nèi)容,然后建立情緒分析模型。該模型為文章中提到的實(shí)體分配了一個(gè)風(fēng)險(xiǎn)活動(dòng)的概率。

情緒分析模型

我們嘗試了四種不同的自然語言處理工具進(jìn)行情緒分析,即VADER、Word2Vec、fastText和BERT模型。在通過選定的關(guān)鍵指標(biāo)(召回率、精度和F1)對(duì)這些模型進(jìn)行評(píng)估后,RoBERTa模型(BERT的一個(gè)變種)表現(xiàn)最佳,被選為最終模型。

RoBERTa模型對(duì)新聞文章(標(biāo)題和摘錄)或社交媒體帖子的文本進(jìn)行處理,并為特定文本分配一個(gè)風(fēng)險(xiǎn)分?jǐn)?shù)。由于該文本在數(shù)據(jù)收集過程中已經(jīng)被標(biāo)記為實(shí)體,我們現(xiàn)在已經(jīng)有了加密實(shí)體的相關(guān)風(fēng)險(xiǎn)指標(biāo)。在后期,我們將多個(gè)文本的風(fēng)險(xiǎn)分?jǐn)?shù)結(jié)合起來,給出一個(gè)實(shí)體的整體風(fēng)險(xiǎn)分?jǐn)?shù)。

RoBERTa原本是一個(gè)使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的情感分析模型,我們將最后一層與我們標(biāo)注的風(fēng)險(xiǎn)分?jǐn)?shù)進(jìn)行映射,以適應(yīng)風(fēng)險(xiǎn)評(píng)分的環(huán)境。為了提高模型在未來文本數(shù)據(jù)上的通用性,我們進(jìn)行了幾種文本處理方法,即替換實(shí)體、刪除url和替換hash。然后我們使用這個(gè)表現(xiàn)最好的模型進(jìn)行風(fēng)險(xiǎn)評(píng)分。

風(fēng)險(xiǎn)評(píng)分

現(xiàn)在,每篇文章都有一個(gè)相關(guān)的來源(news/reddit/twitter),一個(gè)風(fēng)險(xiǎn)概率和一個(gè)計(jì)數(shù),指的是文章被轉(zhuǎn)發(fā)、分享或轉(zhuǎn)發(fā)的次數(shù)。為了將這些風(fēng)險(xiǎn)概率轉(zhuǎn)換為加密貨幣實(shí)體的單一風(fēng)險(xiǎn)得分,我們首先將文章的概率值縮放到0到100的范圍內(nèi),并獲得每個(gè)來源的加權(quán)平均值,結(jié)合文章的風(fēng)險(xiǎn)得分和計(jì)數(shù)。加權(quán)平均數(shù)用于對(duì)計(jì)數(shù)較高的文章給予更大的重視,因?yàn)榉蓊~數(shù)量很可能表明文章的相關(guān)性或重要性。

在計(jì)算出各來源的風(fēng)險(xiǎn)得分后,我們對(duì)各來源的風(fēng)險(xiǎn)得分進(jìn)行加權(quán)求和,得到綜合得分,公式如下:

傳統(tǒng)的新聞來源被賦予了更高的權(quán)重,因?yàn)檫@些來源更有可能報(bào)道重大的安全漏洞(相對(duì)于單個(gè)用戶的黑客事件)。

該解決方案的有效性

我們?cè)?020年1月1日至2020年10月30日的174個(gè)加密貨幣實(shí)體的名單上測(cè)試了我們的解決方案,并將結(jié)果與該時(shí)間段內(nèi)的已知黑客案例進(jìn)行了比較。我們發(fā)現(xiàn),我們的風(fēng)險(xiǎn)評(píng)分方法表現(xiàn)相當(dāng)出色,在37個(gè)已知的黑客案例中識(shí)別了32個(gè)。我們還分析了我們的解決方案對(duì)單個(gè)實(shí)體的有效性。下圖顯示了Binance從2020年1月1日至2020年10月30日的風(fēng)險(xiǎn)評(píng)分。虛線紅線代表已知的黑客案例。從圖中我們觀察到,我們的解決方案報(bào)告了5個(gè)已知黑客中的4個(gè)黑客的風(fēng)險(xiǎn)得分增加。也有幾個(gè)峰值與已知黑客案例不一致。然而,這并不構(gòu)成一個(gè)主要問題,因?yàn)閷?duì)我們的模型來說,更重要的是識(shí)別盡可能多的黑客,減少未識(shí)別的黑客數(shù)量。

有趣的發(fā)現(xiàn)

在風(fēng)險(xiǎn)評(píng)分過程中,我們注意到,與規(guī)模較小的實(shí)體相比,規(guī)模較大的實(shí)體的風(fēng)險(xiǎn)評(píng)分往往有較大比例的假陽性記錄。這是因?yàn)榇笮蛯?shí)體被談?wù)摰酶?,因此?huì)有更多的負(fù)面帖子和虛假謠言,從而導(dǎo)致更高的不準(zhǔn)確率。

另一個(gè)值得強(qiáng)調(diào)的有趣趨勢(shì)是,圍繞著黑客攻擊通常有幾個(gè)明顯的高峰。這是由于不同數(shù)據(jù)源的反應(yīng)時(shí)間不同。社交媒體網(wǎng)站Twitter和Reddit通常是第一個(gè)看到高風(fēng)險(xiǎn)事件發(fā)生時(shí)的高峰,因?yàn)橛脩魰?huì)發(fā)帖提出他們觀察到的異常情況,比如一個(gè)實(shí)體的網(wǎng)站在沒有事先通知用戶的情況下宕機(jī)。官方消息一般是在官方聲明之后,稍后才會(huì)發(fā)布。

局限性

我們發(fā)現(xiàn),我們的解決方案有兩個(gè)潛在的局限性,首先是需要不斷地維護(hù)收集器。網(wǎng)站設(shè)計(jì)可能會(huì)隨著時(shí)間的推移而改變,這些網(wǎng)站的刮擦器需要更新,以確保相關(guān)信息仍能被檢索到,從而達(dá)到風(fēng)險(xiǎn)評(píng)分的目的。

第二個(gè)限制是,驗(yàn)證一篇文章是否已被正確地標(biāo)記為加密貨幣實(shí)體是具有挑戰(zhàn)性的。例如,一篇報(bào)道Bancor可疑活動(dòng)的文章可能也會(huì)因?yàn)橐粋€(gè)不相關(guān)的事件提到Binance。我們的解決方案會(huì)錯(cuò)誤地將新聞標(biāo)記為兩個(gè)實(shí)體,并將Binance標(biāo)記為風(fēng)險(xiǎn),即使它不是文本中的關(guān)鍵主題。然而,這并不是一個(gè)主要的限制,因?yàn)槲覀冎皇褂眯侣勎恼碌臉?biāo)題和摘錄來進(jìn)行風(fēng)險(xiǎn)評(píng)分,這通常只包含文章的關(guān)鍵信息。

結(jié)語

我們的項(xiàng)目讓監(jiān)管機(jī)構(gòu)可以輕松挖掘開源信息,更好地識(shí)別加密貨幣領(lǐng)域發(fā)生的風(fēng)險(xiǎn)事件。我們提供了一個(gè)分析文章并預(yù)測(cè)風(fēng)險(xiǎn)分?jǐn)?shù)的語言模型,以及根據(jù)實(shí)體和來源信息匯總這些分?jǐn)?shù)的方法。這些方法都被編織成一個(gè)可以端到端運(yùn)行的自動(dòng)化流水線。將該項(xiàng)目整合到Cylynx平臺(tái)中,將對(duì)其現(xiàn)有功能進(jìn)行補(bǔ)充,并為監(jiān)管機(jī)構(gòu)識(shí)別高風(fēng)險(xiǎn)加密貨幣實(shí)體提供巨大的幫助。

責(zé)任編輯:YYX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 加密貨幣
    +關(guān)注

    關(guān)注

    21

    文章

    4522

    瀏覽量

    39692
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ElfBoard開源項(xiàng)目|百度智能云平臺(tái)的人臉識(shí)別項(xiàng)目

    百度智能云平臺(tái)的人臉識(shí)別項(xiàng)目,旨在利用其強(qiáng)大的人臉識(shí)別服務(wù)實(shí)現(xiàn)自動(dòng)人臉識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實(shí)現(xiàn)人臉
    的頭像 發(fā)表于 12-24 10:54 ?238次閱讀
    ElfBoard開源<b class='flag-5'>項(xiàng)目</b>|百度智能云平臺(tái)的人臉<b class='flag-5'>識(shí)別項(xiàng)目</b>

    【實(shí)戰(zhàn)】人工智能0基礎(chǔ)入門:基于Python+OpenCV的車牌識(shí)別項(xiàng)目(課程+平臺(tái)實(shí)踐)

    的車牌識(shí)別系統(tǒng)項(xiàng)目。02項(xiàng)目功能本項(xiàng)目致力于利用攝像頭捕獲的圖像數(shù)據(jù),通過先進(jìn)的圖像處理和模式識(shí)別
    的頭像 發(fā)表于 12-16 10:43 ?296次閱讀
    【實(shí)戰(zhàn)】人工智能0基礎(chǔ)入門:基于Python+OpenCV的車牌<b class='flag-5'>識(shí)別項(xiàng)目</b>(課程+平臺(tái)實(shí)踐)

    ElfBoard開源項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

    車牌識(shí)別項(xiàng)目基于百度智能云平臺(tái),旨在利用其強(qiáng)大的OCR服務(wù)實(shí)現(xiàn)車牌號(hào)碼的自動(dòng)識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開發(fā)者快速實(shí)現(xiàn)車牌識(shí)別應(yīng)用。這個(gè)開源
    的頭像 發(fā)表于 12-06 10:30 ?260次閱讀
    ElfBoard開源<b class='flag-5'>項(xiàng)目</b>|車牌<b class='flag-5'>識(shí)別項(xiàng)目</b>技術(shù)文檔

    ASR和機(jī)器學(xué)習(xí)的關(guān)系

    自動(dòng)語音識(shí)別(ASR)技術(shù)的發(fā)展一直是人工智能領(lǐng)域的一個(gè)重要分支,它使得機(jī)器能夠理解和處理人類語言。隨著機(jī)器學(xué)習(xí)(ML)技術(shù)的迅猛發(fā)展,ASR系統(tǒng)的性能和準(zhǔn)確性得到了顯著提升。 ASR
    的頭像 發(fā)表于 11-18 15:16 ?331次閱讀

    什么是機(jī)器學(xué)習(xí)?通過機(jī)器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?408次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    IP風(fēng)險(xiǎn)畫像詳細(xì)接入規(guī)范、API參數(shù)(Ipdatacloud)

    IP數(shù)據(jù)云的IP風(fēng)險(xiǎn)畫像是基于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù)的產(chǎn)品。工作原理是對(duì)IP地址的多維度數(shù)據(jù)進(jìn)行綜合分析,進(jìn)而為企業(yè)提供全面的IP風(fēng)險(xiǎn)評(píng)估和畫像。? IP
    的頭像 發(fā)表于 11-15 11:11 ?278次閱讀
    IP<b class='flag-5'>風(fēng)險(xiǎn)</b>畫像詳細(xì)接入規(guī)范、API參數(shù)(Ipdatacloud)

    NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

    緊密。 NPU的起源與特點(diǎn) NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項(xiàng)目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設(shè)計(jì)目標(biāo)是提高機(jī)器學(xué)習(xí)算法的運(yùn)行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?458次閱讀

    eda在機(jī)器學(xué)習(xí)中的應(yīng)用

    機(jī)器學(xué)習(xí)項(xiàng)目中,數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析(EDA)是這一過程中不可或缺的一部分。 1. 數(shù)據(jù)清洗 數(shù)據(jù)清洗 是機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 11-13 10:42 ?304次閱讀

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了一個(gè)他一直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)器人原理是一個(gè)連接到開關(guān)的電機(jī),通過邏輯門控制。當(dāng)開關(guān)被推到“開”時(shí),
    發(fā)表于 09-03 09:34

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無用機(jī)器

    簡(jiǎn)介 作者在完成碩士論文答辯后,利用空閑時(shí)間制作了一個(gè)他一直想做的機(jī)器人——可愛無用機(jī)器人。 無用機(jī)器人原理是一個(gè)連接到開關(guān)的電機(jī),通過邏輯門控制。當(dāng)開關(guān)被推到“開”時(shí),
    發(fā)表于 08-30 14:50

    【《軟件開發(fā)珠璣》閱讀體驗(yàn)】居安思危之風(fēng)險(xiǎn)

    感謝電子發(fā)燒友論壇提供的讀書機(jī)會(huì)。 本書分享了關(guān)于軟件開發(fā)和管理的 60 條經(jīng)驗(yàn)教訓(xùn),第32條提到面對(duì)風(fēng)險(xiǎn),要么控制項(xiàng)目風(fēng)險(xiǎn),要么被它反殺。 1.什么是風(fēng)險(xiǎn)? 知名理財(cái)顧問卡爾理查茲曾說:所謂
    發(fā)表于 07-09 12:48

    如何利用CNN實(shí)現(xiàn)圖像識(shí)別

    卷積神經(jīng)網(wǎng)絡(luò)(CNN)是深度學(xué)習(xí)領(lǐng)域中一種特別適用于圖像識(shí)別任務(wù)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。它通過模擬人類視覺系統(tǒng)的處理方式,利用卷積、池化等操作,自動(dòng)提取圖像中的特征,進(jìn)而實(shí)現(xiàn)高效的圖像識(shí)別。本
    的頭像 發(fā)表于 07-03 16:16 ?1391次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1389次閱讀

    請(qǐng)問PSoC? Creator IDE可以支持IMAGIMOB機(jī)器學(xué)習(xí)嗎?

    我的項(xiàng)目使用 POSC62 MCU 進(jìn)行開發(fā),由于 UDB 模塊是需求的重要組成部分,所以我選擇了PSoC? Creator IDE 來進(jìn)行項(xiàng)目開發(fā)。 但現(xiàn)在,由于需要擴(kuò)展,我不得不使用機(jī)器學(xué)
    發(fā)表于 05-20 08:06

    機(jī)器學(xué)習(xí)怎么進(jìn)入人工智能

    ,人工智能已成為一個(gè)熱門領(lǐng)域,涉及到多個(gè)行業(yè)和領(lǐng)域,例如語音識(shí)別機(jī)器翻譯、圖像識(shí)別等。 在編程中進(jìn)行人工智能的關(guān)鍵是使用機(jī)器學(xué)習(xí)算法,這是
    的頭像 發(fā)表于 04-04 08:41 ?325次閱讀