離群點有許多别名,如離群點、孤立點、噪聲和偏離點等,本文通稱為離群點。離群點出現的原因很多,但可歸結為3類:
數據變量固有變化引起;
測量錯誤引起;
執行錯誤引起。
當今,數據挖掘和知識發現的研究更多地關注發現常規模式。但是,在信用卡欺詐識别、入侵檢測、軍事偵察、災害天氣預報和醫療分析等應用中,離群模式比常規模式包含更多有用信息。離群點檢測就是旨在發現偏離常規模式的小模式——離群模式。
代表性的離群點檢測算法已有的離群點檢測方法大多建立在統計學的基礎上,從算法使用的主要技術路線角度,大緻分為基于統計模型的方法、基于深度的方法、基于距離的方法、基于密度的方法、基于偏差的方法以及其它方法(如基于聚類的方法、基于小波變換的方法、基于圖的方法、基于規則或專家數據庫的方法和基于神經網絡的方法等),如下圖所示。
離群點檢測算法分類
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!