Data Mining探索(下)
|
Data Mining的利器 根據上期在本刊所做的分析, Data mining是一個知識發現的重要過程,需要許多工具來支援。在產學界合作下,近二年有驚人的發展,而各種工具只在某些領域下有特別的效能,也就是說尚無適用所有業種、用途的工具問世。本文介紹一般常用的工具分類,列於表一:
表一 Data mining分析工具
從表一可以發現資料挖掘技術的多樣化,從傳統分析工具,例如統計迴歸預測模型、資料庫分割、連接分析、偏差偵測等。但是,重要的是這些產品應用新的技術,如類神經網路、機器學習、專家系統等人工智慧的工具,使 AI找到新的應用Domain。但是,近年浮現的新技術:遺傳演算法(Ggenetic algroithrms),卻無確切證據顯示在Data Mining工具產品中使用,本文認為遺傳演算法的特性,必然在Data Mining領域中有出色的演出。
從本文的分析,可知 Data Mining技術的導入企業體,它的重點不是資料庫本身,而在於以企業領域為主。現代的企業體經常蒐集了大量資料,包括市場、客戶、供應商、競爭對手以及未來趨勢等重要資訊,但是資訊超載與無結構化,使得企業決策單位無法有效利用現存的資訊,甚至使決策行為產生混亂與誤用。如果能透過資料發掘技術,從巨量的資料庫中,發掘出不同的資訊與知識出來,作為決策支援之用,必能產生企業的競爭優勢。本文認為人工智慧( AI)可以在Data Mining發揮最大功用。例如,以模糊理論建立推論庫,把企業知識建立決策法則,配合類神經網路具有學習功能,把一些環境變數導入,成為類神經網路的輸入變項,經過學習調整;使模糊決策法則庫能適應環境變遷而調整,則從資料中挖掘寶藏的機會精確度將提高。另外,遺傳演算法(genetic algorithms)的搜尋空間最佳化技術,可以利用它去找尋類神經網路之輸入變數,一決定多少輸入變數與多少網路層,會使網路學習、預測精確度最高。總之, Data Mining是一個浮現中的新領域。企業應該把焦點集中在商業利益上,而學術界應集中在知識發掘技術與方法論上。企業界建立在投資報酬循環中,應保持資料的品質,設定實際的目標,而利用其淬取智慧有用的資訊,使用於企業過程中,以獲取利益,而這正是Data Mining發展的原動力。(全文完) |