聚類分析:将個體(樣品)或者對象(變量)按相似程度(距離遠近)劃分類别,使得同一類中的元素之間的相似性比其他類的元素的相似性更強。目的在于使類間元素的同質性最大化和類與類間元素的異質性最大化。其主要依據是聚到同一個數據集中的樣本應該彼此相似,而屬于不同組的樣本應該足夠不相似。
常用聚類方法:
1、系統聚類法;
2、K-均值法;
3、模糊聚類法;
4、有序樣品的聚類,
5、分解法;
6、加入法。
注意事項:
1、系統聚類法可對變量或者記錄進行分類,K-均值法隻能對記錄進行分類;
2、K-均值法要求分析人員事先知道樣品分為多少類;
3、對變量的多元正态性,方差齊性等要求較高。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!