從商務數據分析的角度看,因子分析是主成分分析的擴展和推廣,它也是利用降維的思想,由研究原始變量相關矩陣内部的依賴關系出發,把一些具有錯綜複雜關系的變量歸結為少數幾個綜合因子的一種多變量統計分析方法。近年來,随着計算機技術的高速發展,因子分析在生物學、心理學、醫學、氣象、地質、經濟學等各個領域得到廣泛地應用。
通過這部分的學習,了解因子分析的基本原理和方法,認識因子分析的基本步驟;掌握因子分析在SPSS Statistics 24.0軟件中的具體操作;并通過實際案例分析幫助理解因子分析。
1 因子分析概述
1.1 因子分析概念和原理
因子分析于1931年由Thurstone首次提出,其概念起源于20世紀初Karl Pearson和Charles Spearman等人關于智力測驗的統計分析。因子分析就是利用降維的思想,通過研究衆多變量之間的内部依賴關系,探求觀測數據中的基本結構,并用少數幾個抽象的變量來表示其基本的數據結構。因子分析是一種通過顯示變量測評潛在變量,通過具體指标測評抽象因子的統計分析方法。
因子分析的核心是用較少的互相獨立的因子反映原有變量的絕大部分信息。可以将這一思想用數學模型來表示。
式(1)是因子分析的數學模型,也可用矩陣的形式表示為
其中F稱為因子,由于它們出現在每個原有變量的線性表達式中,因此又稱為公共因子,其均值為0,方差為1。因子可理解為高維空間中互相垂直的k個坐标軸。
由因子分析的數學模型可引入以下幾個相關概念。這些概念有利于把握因子與原有變量間的關系,明确因子的重要程度以及評價因子分析的效果。
(1)因子載荷
對于因子模型:
因子載荷越大,則說明第i個變量與第j個因子的關系越密切,反之亦然。
(2)變量共同度
設因子載荷矩陣為A,則稱第i行元素的平方和為變量共同度,其數學定義為
如果大部分原有變量的變量共同度均較高(如高于0.7),則說明所抽取的因子能夠反映原有變量的大部分信息(如70%以上),僅有較少的信息丢失。也就是說,因子分析的效果較好。因此,變量共同度是衡量因子分析效果的重要指标。
(3)因子的方差貢獻
因子方差貢獻的值越高,說明相應因子的重要性越高。因此,因子的方差貢獻和方差貢獻率是衡量每一個因子相對重要性的一個尺度。
參考文獻:
樊重俊等. 基于SPSS的商務數據分析方法(M). 上海:立信會計出版社. 2018.
何曉群. 多元統計分析(第四版)[M]. 北京: 中國人民大學出版社, 2015.
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!