tft每日頭條

 > 知識

 > 數據預處理的主要方法有哪些

數據預處理的主要方法有哪些

知識 更新时间:2024-11-17 01:28:53

  數據的預處理是指對所收集數據進行分類或分組前所做的審核、篩選、排序等必要的處理;主要方法有數據清理,數據集成,數據變換,數據歸約等。

  數據清理;數據清理例程通過填寫缺失的值、光滑噪聲數據、識别或删除離群點并解決不一緻性來“清理”數據。主要是達到如下目标:格式标準化,異常數據清除,錯誤糾正,重複數據的清除。數據集成;數據集成例程将多個數據源中的數據結合起來并統一存儲,建立數據倉庫的過程實際上就是數據集成。數據變換;通過平滑聚集,數據概化,規範化等方式将數據轉換成适用于數據挖掘的形式。數據歸約;數據挖掘時往往數據量非常大,在少量數據上進行挖掘分析需要很長的時間,數據歸約技術可以用來得到數據集的歸約表示,它小得多,但仍然接近于保持原數據的完整性,并結果與歸約前結果相同或幾乎相同。

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关知識资讯推荐

热门知識资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved