0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習應用及數(shù)據(jù)集

MqC7_CAAI_1981 ? 來源:ZF ? 2019-04-21 11:01 ? 次閱讀

【導讀】本文介紹了包括圖像分類、交易預測、情感分類、推薦系統(tǒng)、股票預測等在內(nèi)的若干個機器學習應用及數(shù)據(jù)集。

1.鳶尾花分類

Iris Flowers數(shù)據(jù)集被視為ML的“Hello World”,因為它是分類的典型例子。這個數(shù)據(jù)集的好處是它只有四個屬性:花瓣長度,花瓣寬度,萼片長度和萼片寬度,可加載到內(nèi)存中。

該項目涉及使用四種已知特的不同種類的鳶尾花。

分類類型?這里使用多類分類。這意味著我們應該能夠準確地預測數(shù)據(jù)點屬于哪個類。

目標:根據(jù)花的特性對三種花進行分類:花瓣和萼片的尺寸。

2. 交易預測

GNY的小組發(fā)布了一個演示程序,展示了該平臺如何通過其強大的神經(jīng)網(wǎng)絡預測零售交易組,并且該平臺的完全可下載和可定制版本將在今年夏天推出。GNY將有一個可選擇的機器學習代碼集庫,可以根據(jù)每個人的要求進行選擇,并可以應用于他們的側鏈(因為GNY將使用Lisk的側鏈技術)。

為什么這個這么重要?幾乎所有企業(yè)都在尋找一種經(jīng)濟實惠的方式來挖掘其數(shù)據(jù)中的隱藏價值,但是如果它將它們暴露給安全風險則不會。區(qū)塊鏈的固有結構有助于控制數(shù)據(jù)一致性,并保持對數(shù)據(jù)的控制

性能提高,因為在前一個塊仍處于活動狀態(tài)時,已經(jīng)可以為后續(xù)塊啟動驗證。驗證包括檢查用戶是否有足夠的余額。只有錯誤預測的交易,才需要重做這項工作。

這個演示是一個有趣的入門項目,適合想要預測簡單數(shù)字的人,今年夏天推出的完整平臺應該為開發(fā)人員提供更多功能和定制??梢栽贛LWave找到一個好的數(shù)據(jù)集,用于使用購買歷史來預測重復購買者。

目標:根據(jù)支出歷史預測未來交易。

3. Twitter的情感分析

機器學習的一個有趣應用是情感分析。隨著加密貨幣的興起,情緒分析取得了重大突破。許多人試圖建立包含情緒分析的交易機器人,以做出更好的交易決策。

還有許多其他平臺可用于情緒分析,如Reddit,F(xiàn)acebook或LinkedIn,因為它們都提供易于使用的API來檢索數(shù)據(jù)。但是,由于Twitter平臺上數(shù)據(jù)的格式一致,這是機器學習的首選數(shù)據(jù)。由于推文主要由文本,URL和主題標簽組成,因此預處理也更容易。

Twitter API知道許多可用于集成到項目中的API庫??梢允褂?!pip install python-twitter通過pip安裝Python的包裝器。

分析幾個有趣的例子:

圍繞新發(fā)布的電影的評論,并將其與IMDB和其他評級網(wǎng)站上的評論進行比較。

圍繞特定選舉或任何其他趨勢政治話題的情緒。

根據(jù)推文的情緒預測前50種加密貨幣價格的未來方向。

目標:情緒分析器學習一段內(nèi)容背后的各種情緒。此任務可幫助您考慮設計各種模型以將推文標記為正面或負面。在后期階段,我們可以用更加細致的方式標記推文,如“中性”,“憤怒”,“樂觀”,......

4.使用Movielens的推薦系統(tǒng)

推薦系統(tǒng)是機器學習技術在商業(yè)中最成功和最廣泛的應用之一。您可以在日常生活中隨處找到推薦系統(tǒng)。例如,在觀看Youtube視頻時,Youtube算法會根據(jù)您的觀看習慣向您推薦視頻,同時也會根據(jù)觀察運行ML算法的模式對全世界人們的觀看行為提出關鍵見解。

我們可以為推薦系統(tǒng)找到兩種算法:

基于內(nèi)容:它尋找內(nèi)容的相其與其他人進行比較以找到類似的行為/喜好。下圖說明了這一點。

目前,Movielens提供了最受歡迎的電影評級數(shù)據(jù)集之一,這是初學者試驗的理想數(shù)據(jù)集。

目標:根據(jù)評分,預測用戶喜歡哪些電影。

5. Quandl股票價格預測

股票價格預測器是一個了解公司業(yè)績并預測未來股票價格的系統(tǒng)。股票價格預測的問題是可以使用許多類型和數(shù)據(jù)來源:

波動率指數(shù)

歷史價格

全球宏觀經(jīng)濟指標

基本面分析

使用指標的技術分析

分析股票市場的好處是它具有更短的反饋周期,這使得更容易驗證您的預測。如果您不了解市場周期,我建議您閱讀有關此主題的內(nèi)容,以了解典型周期的情況。

為了簡單起見,您可以選擇一個簡單的機器學習示例,如根據(jù)組織的季度報告預測6個月的價格變動。

目標:使用基本和技術指標預測未來價格。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    90

    瀏覽量

    11918
  • 股票預測
    +關注

    關注

    0

    文章

    2

    瀏覽量

    6797
  • 機器學習
    +關注

    關注

    66

    文章

    8418

    瀏覽量

    132646
  • 推薦系統(tǒng)

    關注

    1

    文章

    43

    瀏覽量

    10078

原文標題:機器學習如何入門?這五大機器學習項目帶你飛

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    #硬聲創(chuàng)作季 2-數(shù)據(jù)demo

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月11日 16:42:00

    #硬聲創(chuàng)作季 5-數(shù)據(jù)制作

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月11日 16:43:20

    #硬聲創(chuàng)作季 人工智能基礎—機器學習入門完整版教程:7.數(shù)據(jù)獲取和屬性介紹

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月21日 09:59:49

    #硬聲創(chuàng)作季 人工智能基礎—機器學習入門完整版教程:9.數(shù)據(jù)的劃分

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月21日 10:12:29

    #硬聲創(chuàng)作季 機器學習入門到精通:1-構建實驗數(shù)據(jù)

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 08:56:43

    #硬聲創(chuàng)作季 機器學習入門到精通:2-數(shù)據(jù)demo

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 09:21:04

    #硬聲創(chuàng)作季 機器學習入門到精通:2-數(shù)據(jù)切分

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 09:21:52

    #硬聲創(chuàng)作季 機器學習入門到精通:5-數(shù)據(jù)切分

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 10:14:05

    #硬聲創(chuàng)作季 機器學習入門到精通:5-數(shù)據(jù)制作

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 10:14:45

    #硬聲創(chuàng)作季 機器學習入門到精通:5-鳶尾花數(shù)據(jù)集聚類任務

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 10:20:05

    #硬聲創(chuàng)作季 機器學習入門到精通:8-鳶尾花數(shù)據(jù)多分類任務

    人工智能機器學習數(shù)據(jù)
    Mr_haohao
    發(fā)布于 :2022年09月24日 11:09:48

    八大機器學習數(shù)據(jù)

    網(wǎng)頁中也有一個搜索框來幫助用戶尋找想要的數(shù)據(jù),還有所有數(shù)據(jù)的描述和使用示例,這些數(shù)據(jù)信息豐
    的頭像 發(fā)表于 01-18 09:52 ?8017次閱讀
    八大<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>

    還在愁到哪里找到需要的機器學習數(shù)據(jù)嗎?

    斯坦福問答數(shù)據(jù) (Stanford Question answer Dataset, SQuAD) 是一個全新的閱讀理解數(shù)據(jù),由眾包工作者根據(jù)維基百科文章提出的問題組成,其中每個問
    的頭像 發(fā)表于 03-29 11:45 ?2401次閱讀
    還在愁到哪里找到需要的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>集</b>嗎?

    如何用PHP做一個機器學習數(shù)據(jù)

    機器學習是一門通過數(shù)據(jù)來教計算機解決問題的科學,而不是編寫序列算法,讓指令逐個執(zhí)行。 一般來說,數(shù)據(jù)準備是機器
    的頭像 發(fā)表于 08-25 11:09 ?1748次閱讀