遷移是機器學習中一種常見的方法,可以通過遷移學習,将一些建好的學習模型通過遷移的方式來加速訓練過程。
遷移學習概述
遷移學習是人工智能機器學習中的一種(除了遷移學習還有深度學習、強化學習),将一個開發模型應用到其他任務或是類型中,也就是在機器處理全新的領域時,難以獲取大量數據取構建模型時可以通過遷移學習的方法,通過少量數據訓練從而适用于新領域。通俗來講,遷移學習就是一種舉一反三的學習方法。
比如:我們學會了彈吉他,我們再去學習鋼琴、小提琴等其他樂器,可以節約好多時間,我們可以從學習吉他中的樂理知識、音階等相關知識,遷移到其他樂器中,從而降低我們學習的成本,節約學習的時間。
遷移是機器學習中一種常見的方法,通常應用到計算機視覺、自然語言處理等相關人工智能領域,通過神經網路學習需要大量數據、長時間的計算,某些情況下我們難以獲取足夠的資源,所以我們通過遷移學習的方式,将一些建好的學習模型通過遷移的方式來加速訓練過程。
如何進行遷移學習?
在理解如何進行遷移學習中,我們先了解一下如下定義:
域:一個域 D 由一個特征空間 X 和特征空間上的邊際概率分布 P(X) 組成,其中 X=x1,x2,…xn 。舉個例子:對于一個有文檔,其有很多詞袋表征(bag-of-words representation)X 是所有文檔表征的空間,而 xi 是第 i 個單詞的二進制特征。P(X)代表對X的分布。
任務:在給定一個域 D={X,P(X)} 之後,一個任務 T 由一個标簽空間 y 以及一個條件概率分布 P(Y/X) 構成,其中,這個條件概率分布通常是從由特征—标簽對 xi,yi組成的訓練數據中學習得到。
源域:在遷移學習中,我們已有的知識叫做源域。
目标域:在遷移學習中,要學習的新知識叫目标域。
以上概念如果不是專門做AI技術的同學可能很難理解,那我們舉個例子來解釋一下:
有一個養狗的高手,對不同的狗狗的類型都能分辨出來,能夠識别不同狗狗的特征。有一天想去賣賣貓貓了,他就從養狗狗的經驗上去學習貓貓,分辨貓貓,發現按照狗狗狗的特征是難以正确的分辨貓貓的,因此他又重新學習了貓貓的特征。
在以上案例中:域就是貓貓或狗狗,源域就是狗狗,目标域就是貓貓,任務就是貓貓或狗狗的特征或是特點,這樣說就好理解了。
在遷移學習中有不同的方法:
1. 基于實例的遷移學習方法
意思是說在源域中找到與目标域相似的數據,把這個數據的權值進行調整,讓目标域與源域權值數據進行匹配,然後對調整的數據進行訓練學習,不斷的調整權值,最終形成目标域的模型。
這種屬于源域中的樣本進行遷移,也就是樣本與樣本之間相似度較高的情況,我們看如下圖片(以下圖片來自于百度):
2. 基于特征的遷移學習方法
意思是說通過源域與目标域相同的特征進行提取,找到共同特征,然後學習。它與基于實例的遷移學習方法,不同在于——基于實例的是從實際數據中進行選擇來匹配與目标域相似的部分,進行學習,基于特征的是找到源域與目标域的相同交集特征,進行學習。
如下圖所示(圖片來自于百度):
3. 基于模型的遷移學習方法
意思是說通過源域訓練好的模型,直接應用到目标域中,通過目标域中少量數據去訓練此模型,進行學習,比如:你有一個識别狼狗的模型,這個模型可以男出來訓練哈士奇。
4.基于關系的遷移學習方法
意思是說當兩個域是有某些相似的時候,他們之間存在某種關系,我們可以根據域中的相同的關系背後邏輯進行遷移,比如:生物病毒傳播的規律遷移到電腦病毒的傳播規律。
遷移學習對我們産品經理的啟發
通過對遷移學習的概述以及遷移學習的方法的介紹,我們總結一下遷移學習使用場景:
- 數據量不足的問題:一方面是因為某些領域,數據量比較少;一方面是因為收集大量數據需要較高的資源和成本,我們需要考慮通過遷移學習的方法。
- 個性化方面的問題:通過群體數據,難以反映一個個體的特征。
對于我們産品經理,我們在設計産品或是設計某些邏輯的時候,可以看一下我們設計場景是否符合遷移學習的使用場景,我們如果通過遷移學習的方法,去解決我們的産品設計問題。
比如以下案例:
數據量成本案例
比如:不同産品用戶評價模型的遷移,一個産品好或者壞,我們需要分析大量用戶的評價,通過對評價的标注,建立評價模型但。是如果我們有大量産品,并且不同用戶有不同的用戶評價習慣,不同的用語,來表達對産品的好或是壞,我們很難收集到全面的用戶評價數據。
因此,我們隻需要從少量産品大量數據評價中去标注,去訓練,找打标注模型,通過此模型應用到其他産品中,我們就可以迅速分辨出這個産品的在用戶眼裡是好或者是壞。
個性化推薦案例
比如:我們有一個售賣書籍的電商平台,根據用戶偏好、行為等對其做了智能推薦,然後我們想在電商平台上新增了電影推薦内容。
假如我們想在這個産品一上線就能智能推薦給用戶,這時候我們可以使用書籍的智能推薦方案遷移到電影内容推薦這個産品上,比如:某一用戶群體喜歡懸疑類書籍,那我們可以推薦一些懸疑類電影内容。
再比如:我們一個新APP冷啟動時的個性化推薦,是否可以利用之前已上線APP的用戶畫像描述,通過特征遷移的方式,做個性化推薦?
本文通過對遷移學習的介紹,希望我們産品經理我們設計産品在考慮後台設計邏輯時有一些啟發!
本文由 @ 羅飛 原創發布于人人都是産品經理。未經許可,禁止轉載
題圖來自Unsplash,基于CC0協議
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!