答:(1)相關:聚類分析和判别都是多元統計中研究事物分類的基本方法。
(2)區别:
①基本思想不同。
聚類分析:根據研究對象特征對研究對象進行分類的一種多元分析技術。把性質相近的個體歸為一類,使得同一類中的個體都具有高度的同質性,不同類之間的個體具有高度的異質性。
判别分析:對已知分類的數據建立由數值指标構成的分類規則即判别函數,然後将其應用到未知分類的樣本中進行判别分類。
②已知條件不同。
聚類分析:在進行聚類分析之前,對總體到底分成幾種類型并不知道。
判别分析:判别分析則是在總體類型劃分已知時,判斷當前新樣本屬于哪個類别。
③分類不同。
聚類分析:根據分類對象不同,聚類分析可以分為樣品聚類(Q聚類)和變量聚類(R聚類)。
判别分析:根據判别标準不同,判别分析可以分為距離判别、Fisher判别和Bayes判别。
2. 聚類分析的基本思想和功能?答:(1)基本思想:聚類分析是根據研究對象特征對研究對象進行分類的一種動員分析技術。把性質相近的個體歸為一類,使得同一類中的個體都具有高度的同質性,不同類之間的個體具有高度的異質性。根據分類對象不同,可以分為樣品聚類(Q聚類)和變量聚類(R聚類)。
(2)聚類分析的目的或功能就是把相似的研究對象歸成類,即使類間對象的同質性最大化和類與類間對象的異質性最大化。
3. 系統聚類法的原理和步驟?答:(1)系統聚類法的基本思想:距離相近的樣品(或變量)先聚成類,距離相遠的後聚成類,這個過程一直進行下去,每個樣品(或變量)總能聚到合适的類中。
(2)步驟:假設共有n個樣品(或變量),
①将每個樣品(或變量)獨自聚成一類,共有n類;
②計算類與類之間的距離,把距離最近的兩類歸為一新類,并重新計算新類與當前各類的距離;
③重複②,直到最後将所有的樣品(或變量)聚成一類。
4. 均值聚類的步驟?答:k均值聚類算法是一種叠代求解的聚類分析算法。
①預将數據分成k組,随機選取k個對象作為初始的聚類中心;
②計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類;
③每分配一個樣本,聚類的聚類中心會根據聚類中現有的對象被重新計算。這個過程不斷重複,直到沒有對象被重新分配給不同的聚類,聚類中心不再發送變化,誤差評分和局部最小。
5. 判别分析的思想和步驟?答:(1)判别分析的基本原理:對已知分類的數據建立由數值指标構成的分類規則即判别函數,然後将其應用到未知分類的樣本中進行分類。根據判别标準不同,可以分為距離判别、Fisher判别和Bayes判别。
(2)步驟:
①判别分析的對象:根據判别分析的目的定義觀測變量;
②判别分析的研究設計:主要包括解釋變量和被解釋變量的選擇,估計判别函數所需要的樣本量和為了驗證目的對樣本的分隔;
③假定條件的驗證:檢驗解釋變量的正态分布性、協方差是否相等以及解釋變量間是否存在多重共線性;
④估計判别模型和評估整體拟合:确定估計的方法和保留的函數個數,根據估計的函數可用多種方法來評估模型拟合;
⑤結果的解釋:說明在判别分析中每個解釋變量的相對重要性;
⑥結果的驗證:通常采用分隔樣本或者交叉驗證法。
6. 主成分分析的思想和步驟?答:(1)主成分分析的思想:主成分分析是研究将原來多個變量重新組合成一組新的互相無關的綜合指标的一種統計分析方法,而且這些新變量在反映課題的信息方面盡可能保持原有的信息。也是用來降維的一種方法。
(2)步驟:
①根據研究問題選取初始分析變量;
②根據初始變量特性判斷由協方差陣還是相關陣求主成分;
③求協方差陣或相關陣的特征根與相應标準特征向量;
④判斷是否存在明顯的多重共線性,若存在,則回到第①步;
⑤得到主成分的表達式并确定主成分個數,選取主成分;
⑥結合主成分對研究問題進行分析并深入研究。
7. 因子分析的思想和步驟?答:(1)因子分析的基本思想是根據相關性大小把原始變量分組,使得同組内的變量之間相關性較高,而不同組的變量間的相關性則較低。
(2)步驟:
①根據研究問題選取原始變量;
②對原始變量進行标準化并求其相關陣,分析變量之間的相關性;
③求解初始公共因子及因子載荷矩陣;
④因子旋轉;
⑤計算因子得分;
⑥根據因子得分做進一步分析。
8. 主成分分析與因子分析的關聯與區别?答:(1)關聯:主成分分析與因子分析都常用于數據降維和信息濃縮,分析多個變量的基本結構。因子分析是主成分分析的進一步推廣,主成分分析是因子分析的一個特例。
(2)區别:
①因子分析中,把變量表示成各因子的線性組合;而在主成分分析中,把主成分表示成各變量的線性組合。
②主成分分析中不需要一些專門假設,因子分析則需要一些假設(各個共同因子之間不相關,特殊因子之間也不相關,共同因子和特殊因子之間也不相關。)
③主成分分析隻有主成分法;因子分析中有主成分因子法、主軸因子法和極大似然法等。
④主成分分析中,當給定的協方差矩陣或相關矩陣的特征根唯一時,主成分一般是固定的;而因子分析中,因子不是固定的,可以旋轉得到不同的因子。
⑤主成分分析中得到的主成分數量一般等于原始變量數目;而因子分析中得到的因子數量一般由人為事先确定。
⑥因子分析是主成分分析的推廣,相對于主成分分析,更傾向于描述原始變量之間的相關關系。
⑦主成分分析沒有實質意義,隻是一個綜合指數,隻需要對主成分進行經濟解釋;因子分析具有客觀的實質意義,需要對因子進行命名。
⑧主成分分析不要求數據來自總體,因子分析一般要求服從多元正态分布。
9. 典型相關分析的基本理論及分析方法?答:(1)基本理論:典型相關分析是研究兩組變量之間相關關系的多元分析方法。借用主成分分析降維的思想,分别對兩組變量提取主成分,且使從兩組變量提取的主成分之間的相關程度達到最大,而從同一組内部提取的各主成分之間互不相關,用從兩組分别提取的主成分的相關性來描述兩組變量整體的線性相關關系。
(2)分析方法:
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!