tft每日頭條

 > 生活

 > 因子分析怎麼抽取兩個因子

因子分析怎麼抽取兩個因子

生活 更新时间:2024-08-23 05:22:18

已知參與計算的各個feature,如何去确定每個feature的權重呢?本文将為大家介紹一種相對科學的辦法,來處理這種多因子權重設置的問題。

因子分析怎麼抽取兩個因子(如何處理多因子權重賦值的問題)1

數據處理領域,在進行相關指标計算的時候,一個指标通常有若幹了因子(通常稱之為feature,下同)參與計算,而每個因子對該指标的貢獻度(通常稱之為weight或contribution,下同)又不同,比如GMV,商品人氣分,用戶滿意度等等。通常可以表示為如下公式:

這時,我們通常遇到下面這個問題:

夏唬人目前在做電商推薦策略相關的事情,經常遇到這種問題。

比如在物品(通常稱之為item,下同)召回的時候,如何對每個item進行排序呢?

比如以人氣分作為排序依據,那麼通常會考慮銷量,評價,浏覽次數,下單次數,收藏次數,加購次數等等。

如果一味的按照經驗去進行初始化權重,然後不停的A/B測試、權重調整,是一件研發成本特别高的事情。

今天就給大家介紹一種相對科學的辦法來處理這種多因子權重設置的問題。

AHP

簡單介紹一下什麼是AHP

層次分析法,簡稱AHP,它是一種運籌學理論。

是指将與決策總是有關的元素分解成目标、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。

“該方法是美國運籌學家匹茨堡大學教授薩蒂于20世紀70年代初,在為美國國防部研究”根據各個工業部門對國家福利的貢獻大小而進行電力分配”課題時,應用網絡系統理論和多目标綜合評價方法,提出的一種層次權重決策分析方法。”

所以,AHP理論本質是通過把一個複雜的問題拆解為多個目标或準則,并且通過定性量化的方式為每個目标進行賦權的一個過程。

簡單來說AHP就是拆解加賦權,下面詳細講一下過程。

AHP多因子賦權應用

1. 構造判斷矩陣

什麼是判斷矩陣?

判斷矩陣就是以參與指标計算的所有ferture組成的一個方陣,并且給出兩兩“比較量化值”。舉例如下:

對于A和B兩個因子,1表示:A和B一樣重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B極其重要,具體标準如下圖所示:

因子分析怎麼抽取兩個因子(如何處理多因子權重賦值的問題)2

這其實就是一個典型的小組投票的過程,通過在方陣行列元素的兩兩比較,最終可以生成一個判斷矩陣。比如對于有A,B,C,D四個feature的判斷矩陣如下圖所示:

因子分析怎麼抽取兩個因子(如何處理多因子權重賦值的問題)3

2. 一緻性校驗

所謂一緻性校驗是指在進行投票的時候的公平性和一緻性。

比如你認為A比B重要,B比C重要,但是從最後的結果來看是C比A重要,這樣即為不一緻。

一緻性校驗是通過計算校驗系數來實現的,通常用CR來表示,小于0.1即表示一緻性校驗通過。

CR包含一緻性指标(CI)和随機一緻性指标(RI)兩部分,CR=CI/RI。

CI和RI是一個固定值,與矩陣的階數有關。

剩下的是一個比較複雜的數學過程,簡單介紹幾個概念,計算過程大家可以百度一下即可。

下圖是通過excel進行計算的:

因子分析怎麼抽取兩個因子(如何處理多因子權重賦值的問題)4

通過進行小組投票和自動計算,最終CR的值為0.06,因此一緻性檢驗通過。

權重Wi列即為每個feature的權重,因此最終我們可以得出該指标的計算公式為:

完美解決!

說在最後

大家這裡或許會有個疑問:

采用AHP的方法進行賦權,小組投票階段是主觀判斷重要性的,所以是不是會帶來誤差?

會,一定會。

不過還是我之前說的,策略一定是建立在業務之上的,撇開業務談策略都是僞策略。

采用AHP模型進行多因子賦權,

需要對該業務有足夠的了解,更需要對該target下的多個feature有足夠的了解,哪個對于target的貢獻度是最大的

比如對于一個商品,什麼樣的商品是用戶喜歡的?用戶喜歡的商品有哪些feature?每個feature對于用戶喜歡的貢獻程度是什麼樣的?這些都是需要業務經驗參與的。

如果說科學的方法都有一個前提假設,那麼AHP也有一個前提,就是先了解業務,再談策略

以上,希望能幫助到大家。

作者:夏唬人。公衆号:夏唬人,某廠推薦策略産品經理。

本文由 @夏唬人 原創發布于人人都是産品經理。未經許可,禁止轉載

題圖來自Unsplash,基于CC0協議

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved