數(shù)據(jù)挖掘的功能
1、數(shù)據(jù)分類
數(shù)據(jù)分類為數(shù)據(jù)挖掘中常見的功能之一,顧名思義即是將分析對象依不同的屬性分類加以定義,建立不同的類組。數(shù)據(jù)挖掘中的分類是指針對未發(fā)生的結果進行預測分類,主要包括歸納和推論兩步驟,其主要目的在于提高分類的準確度,建立分類規(guī)則,再評估準則的優(yōu)劣。常用“判定樹”算法。
2、數(shù)據(jù)估計
根據(jù)不同相關屬性數(shù)據(jù)的連續(xù)性數(shù)值,找出各屬性間的關聯(lián)性,以了解并獲得某一特定屬性未知的連續(xù)性數(shù)值,常用“回歸分析”及“類神經(jīng)網(wǎng)絡算法”。
3、數(shù)據(jù)預測
預測工作的目的在于以其他屬性的值為基礎來預測特定屬性的值。而這個被預測屬性的值通常稱為目標變量或是因變量;而其他屬性則稱為解釋變量或自變量,預測的主要方法在于建立數(shù)據(jù)當中因變量與自變量間的關系。常用“回歸分析”“時間序列分析”及“類神經(jīng)網(wǎng)絡”算法。
4、數(shù)據(jù)關聯(lián)分組
數(shù)據(jù)關聯(lián)分組主要用來發(fā)現(xiàn)數(shù)據(jù)中特征屬性間具有高度關聯(lián)性的一種模式,其所發(fā)現(xiàn)的模式通常是用規(guī)則來表現(xiàn)。常用“關聯(lián)規(guī)則(又稱購物藍分析)”算法。
5、數(shù)據(jù)聚類
數(shù)據(jù)聚類主要是利用數(shù)據(jù)中類似或相同的項目,將同構型較高的數(shù)據(jù)區(qū)隔為不同的聚類,聚類內(nèi)數(shù)據(jù)相似度越高越好,聚類間差異度越大越好。在一大群的研究對象中,根據(jù)不同的研究目的必定會有異質化的現(xiàn)象,但異質化的現(xiàn)象可能是幾個同質化的群組所造成,數(shù)據(jù)聚類的主要目的便是將不同的同質化的組別差異找出來,常用“判別分析”與聚類分析“算法。
-
數(shù)據(jù)挖掘
+關注
關注
1文章
406瀏覽量
24239
發(fā)布評論請先 登錄
相關推薦
評論