數據挖掘是壹個計算機科學術語。shù jù wā jué的發音壹般是指通過算法從大量數據中搜索隱藏信息的過程。數據挖掘通常與計算機科學有關,通過統計學、聯機分析處理、信息檢索、機器學習、專家系統(依靠過去的經驗規則)、模式識別等多種方法來實現上述目標。
數據挖掘分為有監督數據挖掘和無監督數據挖掘。引導式數據挖掘是利用可用數據建立模型,模型是對特定屬性的描述。無監督數據挖掘就是在所有屬性之間尋找某種關系。具體來說,分類、估值、預測屬於引導式數據挖掘;關聯規則和聚類屬於無監督數據挖掘。?
數據挖掘簡單分為:頻繁模式挖掘、序列挖掘、數據流挖掘、文本挖掘、Web挖掘、圖形挖掘和時空挖掘等。具體來說:
數據流挖掘是針對數據流的數據挖掘,數據的特點是數據隨時間變化快,數據量大。