0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何利用好機器學習,數(shù)據(jù)分析與處理很重要

獨愛72H ? 來源:網(wǎng)絡(luò)整理 ? 作者:佚名 ? 2020-04-12 22:44 ? 次閱讀

(文章來源:網(wǎng)絡(luò)整理)
機器學習涉及到很多的學科和門類,在我看來,它更像是各個學科的集合體,因此想要學好機器學習,你需要具備很多方面的知識,不過也并不是所有人會用到機器學習的每個細節(jié),因此可以根據(jù)自己的專長有針對性的學習。

我目前也在學習相關(guān)的技術(shù)資料,再加上之前也接觸過這方面的工作,所以對于機器學習方面還是有一定的了解,在我看來無論是什么樣的機器學習模型、分類、算法都是依托于原始數(shù)據(jù)的,原始數(shù)據(jù)的分析和處理是前提也是很重要的部分。

通常我身邊的工程師在進行相關(guān)設(shè)計的時候有一個慣性的思維,先采集一大堆的數(shù)據(jù)然后用工具分析特征和生成模型,之后通過大量的數(shù)據(jù)采集來實現(xiàn)模型的修正和完善,這種方式應該也是很多設(shè)計人員通常的思路,而且一般的情況下要求硬件采集設(shè)備盡可能的提供多種參數(shù),這樣可以豐富算法模型的輸入?yún)?shù),理論上可以更好地接近實際的結(jié)果,在純技術(shù)的角度上這個是可行的,而且隨著樣本量的增加,采用機器學習的思路,最終的模型和算法會越來越精確。

這樣的設(shè)計方法對于已有理想樣本或是可以很容易獲取樣本數(shù)據(jù)的前提下是非常高效的,但是如果已有樣本不是很理想,存在大量干擾成分,樣本數(shù)據(jù)受人為因素或者必須由人工采集獲取數(shù)據(jù)時,傳統(tǒng)的方法就沒有太大優(yōu)勢了。這個時候需要對數(shù)據(jù)進行預處理和必要的分析,需要確定幾個問題:

一、預先確定幾個需要研究的參數(shù),選擇參數(shù)時需要有一定的依據(jù)和相關(guān)性,拿紅外信號輸出信號分析舉例,可以從公開的資料中知道紅外傳感器會受到溫度和光譜范圍的影響導致輸出曲線的變化,那么溫度和光譜范圍就是需要研究的參數(shù)。

二、確定了參數(shù)之后,先不要對所有參數(shù)進行樣本數(shù)據(jù)采樣,而是針對單一參數(shù)進行數(shù)據(jù)采樣,徹底明確單一參數(shù)對于最終結(jié)果的影響程度,也就是權(quán)重,用函數(shù)關(guān)系表示即:Y = F(X), Y為結(jié)果,X為樣本數(shù)據(jù)參數(shù),數(shù)據(jù)處理過程包括平滑、篩選、剔除、插入等基本操作,也就是預處理過程,之后可以生成基本的函數(shù)關(guān)系或?qū)φ毡?,為后續(xù)的大模型的建立提供數(shù)據(jù)支持。

三、將每種數(shù)據(jù)參數(shù)的影響程度量化之后,我們就獲取了所有的參數(shù)對照表和函數(shù)對應關(guān)系,利用這些已有的結(jié)果建立整個算法模型和框架結(jié)構(gòu),在模型中將每種數(shù)據(jù)的權(quán)重設(shè)計好,最終形成一個初步的機器學習模式。

四、在實現(xiàn)了以上三步之后,我們最終可以通過大數(shù)據(jù)樣本的采集來實現(xiàn)整個機器學習模型的完善,最終實現(xiàn)之前制定的目標。
(責任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8438

    瀏覽量

    132905
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1460

    瀏覽量

    34109
收藏 人收藏

    評論

    相關(guān)推薦

    絕緣電阻測試儀數(shù)據(jù)分析處理

    絕緣電阻測試儀主要用于檢查電氣設(shè)備或電氣線路對地及相間的絕緣電阻。將所測得的結(jié)果與有關(guān)數(shù)據(jù)比較,這是對實驗結(jié)果進行分析判斷的重要方法。以下是對絕緣電阻測試儀的數(shù)據(jù)分析
    的頭像 發(fā)表于 12-10 15:00 ?368次閱讀

    LLM在數(shù)據(jù)分析中的作用

    的游戲規(guī)則。 1. 數(shù)據(jù)處理 數(shù)據(jù)處理數(shù)據(jù)分析的第一步,也是至關(guān)重要的一步。LLM在這一階
    的頭像 發(fā)表于 11-19 15:35 ?389次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統(tǒng)自身的性能”。事實上,由于“經(jīng)驗”在計算機系統(tǒng)中主要以數(shù)據(jù)的形式存在,因此機器學習需要設(shè)法對數(shù)據(jù)進行分析
    的頭像 發(fā)表于 11-16 01:07 ?483次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    RNN在實時數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,實時數(shù)據(jù)分析變得越來越重要。在眾多的機器學習模型中,遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,
    的頭像 發(fā)表于 11-15 10:11 ?363次閱讀

    SUMIF函數(shù)在數(shù)據(jù)分析中的應用

    在商業(yè)和科學研究中,數(shù)據(jù)分析是一項基本且關(guān)鍵的技能。Excel作為最常用的數(shù)據(jù)分析工具之一,提供了多種函數(shù)來幫助用戶處理分析數(shù)據(jù)。SUMI
    的頭像 發(fā)表于 11-11 09:14 ?387次閱讀

    數(shù)據(jù)分析在數(shù)字化中的作用

    重要數(shù)據(jù)分析是指使用統(tǒng)計和邏輯方法對數(shù)據(jù)進行處理和解釋的過程。它涉及到數(shù)據(jù)的收集、清洗、轉(zhuǎn)換、建模和解釋,目的是發(fā)現(xiàn)
    的頭像 發(fā)表于 10-27 17:35 ?674次閱讀

    云計算在大數(shù)據(jù)分析中的應用

    云計算在大數(shù)據(jù)分析中的應用廣泛且深入,它為用戶提供了存儲、計算、分析和預測的強大能力。以下是對云計算在大數(shù)據(jù)分析中應用的介紹: 一、存儲和處理海量數(shù)
    的頭像 發(fā)表于 10-24 09:18 ?557次閱讀

    使用AI大模型進行數(shù)據(jù)分析的技巧

    使用AI大模型進行數(shù)據(jù)分析的技巧涉及多個方面,以下是一些關(guān)鍵的步驟和注意事項: 一、明確任務(wù)目標和需求 在使用AI大模型之前,首先要明確數(shù)據(jù)分析的任務(wù)目標,這將直接影響模型的選擇、數(shù)據(jù)收集和
    的頭像 發(fā)表于 10-23 15:14 ?1032次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時間序列進行大
    發(fā)表于 08-11 17:55

    機器學習中的數(shù)據(jù)處理與特征工程

    機器學習的整個流程中,數(shù)據(jù)處理與特征工程是兩個至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量,進而影響模型的訓練效果和泛化能力。本文將從
    的頭像 發(fā)表于 07-09 15:57 ?563次閱讀

    數(shù)據(jù)分析除了spss還有什么

    Sciences)是一款非常流行的統(tǒng)計分析軟件,但除了SPSS之外,還有許多其他數(shù)據(jù)分析工具和方法。 引言 數(shù)據(jù)分析是一個跨學科的領(lǐng)域,涉及到統(tǒng)計學、計算機科學、數(shù)據(jù)挖掘、
    的頭像 發(fā)表于 07-05 15:01 ?701次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個涉及收集、處理分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個過程中,使用正確的工具至關(guān)重要。以下是一些主要的
    的頭像 發(fā)表于 07-05 14:54 ?987次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性
    的頭像 發(fā)表于 07-05 14:51 ?712次閱讀

    機器學習數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從
    的頭像 發(fā)表于 07-02 11:22 ?751次閱讀

    串口接收不等長的數(shù)據(jù)如何處理的呢?

    串口是一個很重要的通信方式,但是要用好串口并不是那么簡單,比如如何接收不等長的數(shù)據(jù)等。你們是如何處理的呢?大家來說說你們的做法。
    發(fā)表于 05-15 08:02