
無線電網(wǎng)格化管理系統(tǒng)運(yùn)用數(shù)據(jù)挖掘技術(shù),該技術(shù)通過預(yù)測未來趨勢及行為,做出前攝的、基于知識的決策。數(shù)據(jù)挖掘技術(shù)的目標(biāo)是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的,、有意義的知識,金鵬信息網(wǎng)格化專家小組就數(shù)據(jù)挖掘技術(shù),闡述主要有以下五類功能:
1、自動預(yù)測趨勢和行為
數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,,以往需要進(jìn)行大量手工分析的問題,如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論,。例如市場預(yù)測問題,,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報最大的用戶,其它可預(yù)測的問題包括預(yù)報破產(chǎn)以及認(rèn)定對指定事件最可能作出反應(yīng)的群體,。
2,、關(guān)聯(lián)分析
數(shù)據(jù)關(guān)聯(lián),是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識,。若兩個或多個變量的取值之間存在某種規(guī)律性,,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián),、時序關(guān)聯(lián),、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),,即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度,。
3,、聚類
數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類,。聚類增強(qiáng)了人們對客觀現(xiàn)實的認(rèn)識,,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學(xué)分類學(xué),。
4,、概念描述
概念描述,就是對某類對象的內(nèi)涵進(jìn)行描述,,并概括這類對象的有關(guān)特征,。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,,后者描述不同類對象之間的區(qū)別,。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,,如決策樹方法,、遺傳算法等。
5,、偏差檢測
數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,,如分類中的反常實例,、不滿足規(guī)則的特例,、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等,。偏差檢測的基本方法是,,尋找觀測結(jié)果與參照值之間有意義的差別。