tft每日頭條

 > 生活

 > 推薦算法評價的基本标準

推薦算法評價的基本标準

生活 更新时间:2024-11-26 22:28:14

  從《電子商務法》到《個人信息保護法》,再到最新出台的《互聯網信息服務算法推薦管理規定》,我國關于算法治理的法律規範體系逐步建立,在各類算法中,個性化推薦類算法與人們日常生活聯系最為緊密,也是引發争議較多的算法類型之一。

推薦算法評價的基本标準(個性化推薦算法的解釋路徑)1

  随着諸多以Web2.0技術為基礎的網絡平台的湧現,普通用戶制作和傳播信息的技術門檻大幅降低,社會信息總量也因此呈幾何級數增長。然而面對海量的信息,依靠人工采編或以固定規則(如點擊量、時間線、關鍵詞)為基礎的信息分發方式,卻隻能做到“弱水三千隻取一瓢”,信息篩選的質量雖然有所保障,但絕大多數增量信息都因無法有效觸達用戶而被束之高閣,信息市場中的“二八定律”并不會因為供給端的增長而發生實質性改變。

  個性化推薦算法正是為解決上述問題應運而生。通過個性化推薦服務,網絡服務提供者可以根據用戶偏好在海量信息中進行篩選,并優先呈現與用戶需求相契合的信息内容。此種信息分發方式顯著提高了信息供需雙方的匹配效率,使得單位時間内的信息曝光總量得以大幅提升,為激活更多細分市場創造條件。細分市場的活躍無疑将極大擴展市場的總體容量,在為社會創造大量就業機會的同時,不斷豐富市場中的商品和服務供給。例如,短視頻平台中的視頻博主、信息平台中的自媒體等無不需要依托于個性化推薦算法,在海量信息和茫茫人海中實現供需雙方的精準匹配,并由此獲得經濟收益。此外,從信息接收方角度看,個性化推薦算法也有助于其高效獲得有真正價值的信息,減少在信息檢索方面的精力消耗。好的推薦算法還會根據用戶的既有偏好,在恰當的範圍内拓展其信息邊界,從而發現或激發新的信息需求。

  在理想狀态下,一個運轉良好的個性化推薦算法将為信息提供者、信息接收者以及信息平台帶來三方供應的良好格局。然而現實情況并非總是如此,個性化推薦算法的内在風險同樣不容忽視。在實踐中,掌握規則主導權的算法服務提供者可能因為技術能力欠缺,或者出于自身利益的考量,使相關主體乃至社會公共利益因算法失衡而受到負面影響,其中最為典型的便是為了獲得更強用戶黏性,而不斷向用戶推薦同類信息所造成的“信息繭房”效應。事實上,正是為了避免處于被動接受地位的用戶在無法做出有意義選擇的情況下因算法存在的瑕疵或缺陷受到損害,立法者賦予了其算法解釋權。立法者希望通過增加算法運行機制的透明度,使用戶有能力根據自己的意願對算法的效果進行反饋,從而不斷矯正個性化推薦對其的負面影響。

  了解算法的基本原理和運行機制,是打破算法黑箱、建立算法信任的重要基礎。個性化推薦算法的底層邏輯可概括為以下幾個步驟:采集信息——根據信息建立标簽體系,形成對用戶、信息、渠道等維度的畫像——根據标簽之間的映射關系圈選人群,确定推送信息内容——根據推送效果反饋不斷調優算法。

  第一,個性化推薦以人群而非個人為對象。使用個性化推薦的目的是通過需求與供給的準确匹配促成價值轉化,如購買商品、提高視頻完播率和信息點擊率等,而隻有當此種轉化達到一定規模時,才能夠使信息供給方獲得有意義的受益。因此,在設置個性化推薦算法時,需要根據實際需求在信息“準确率”和“召回率”之間進行動态調節,既不能為了追求極緻準确而過度壓縮觸達人群,也不能單純為了擴大觸達人群而犧牲信息準确性。

  第二,标簽來源具有多維性。标簽體系是個性化推薦算法的“靈魂”,是指引信息分發的方向标。人們最為熟悉的用戶畫像,本質上即是基于用戶身份信息、社會屬性、行為習慣、品類偏好、地理位置等多維度信息,通過歸納和演繹産生的标簽系統,每個标簽都是理解和認識用戶的一個維度。為了在信息和用戶之間形成映射關系,個性化推薦的标簽不僅需要來自對于用戶的畫像,還需要圍繞信息本身進行畫像,最終形成多維度、立體化的标簽體系。以電商平台的個性化推薦算法為例,常用的标簽類型還包括:商品維度,如商品的葉子類目、品牌定位、價格區間、目标用戶人群特征等;店鋪維度,如店鋪定位、所處地域、店鋪類型等;渠道維度,如搜索、促銷活動、直播、推薦等。此外,外部環境的特征也可能成為影響個性化推薦結果的考量因素,如氣候變化、節假日、大型體育賽事等。

  第三,個性化推薦的結果來自标簽之間的映射關系,而映射規則是最終決定推薦信息内容的關鍵,其既可能來自算法服務提供者對于社會、市場、社交等規律的洞悉,如消費者在購買A類商品後,通常會對B類商品産生興趣。信息發布者根據具體需求也可能自主選擇,如廣告主可以通過使用營銷工具,根據商品或營銷活動的特點選擇對應的标簽來圈選目标人群,從而實現更為精準的投放效果。當然,實踐中的映射規則往往更為複雜,每一個推薦結果的背後,都可能涉及多個具有不同權重的标簽的排列組合。算法工程師需要綜合準确率、覆蓋率、多樣性、新穎度、精細度、實時性等多方面指标,結合實際效果對标簽的權重和其映射規則進行動态調整。

  根據《個人信息保護法》第24條之規定,對于信息内容的個性化推薦同樣屬于自動化決策範疇。然而與在征信、信貸等領域使用的算法不同,個性化推薦算法在絕大多數場景中的使用目的均是向用戶進行信息分發,并不會直接改變用戶與其他主體之間的權利義務關系,進而對其人身财産權益造成直接影響。因此,基于《互聯網信息服務算法推薦管理規定》提出的算法分級分類管理原則,對于個性化推薦算法解釋路徑的設置應綜合考慮算法的運行機制、使用場景,以及可能對用戶、算法服務提供者等相關主體造成的影響。畢竟算法解釋本身隻是手段,幫助用戶更好地理解算法運行機制,從而有能力通過自己的行為對算法效果進行有效反饋,最終實現多方共赢并建立信任關系,才是立法者設置算法解釋權、拒絕權的最終目标。具體來說,可主要關注以下三個維度。

  第一,數據維度。若将算法比作精密運轉的機器,那麼數據就是為機器提供動力的能源。因此,對于個性化推薦算法所依托的數據類型的披露,将有助于用戶從底層理解算法運作邏輯,特别是對個人信息使用情況的介紹,還可通過在推送結果與用戶授權使用的個人信息之間的因果(或相關)關系,化解用戶對于個人信息安全的擔憂情緒,并對算法提供者濫用個人信息形成約束。

  第二,決策維度。主要通過在合理範圍内向用戶披露标簽系統,并對個性化推薦結果與标簽之間的映射關系進行說明,讓用戶對推薦結果的來源獲得合理預期。但需說明的是,由于标簽系統是個性化推薦算法運轉的核心,涉及算法服務提供者的商業秘密,若被其他市場主體或公衆完全洞悉,不僅會對其商業利益造成直接損害,還可能導緻算法被惡意利用,破壞正常的經營秩序。因此,對于決策維度的信息披露,應允許算法服務提供者進行脫敏處理,并将重點集中在對算法基本運作邏輯的說明。

  第三,效果維度。為了讓用戶能夠從事前、事中和事後多個維度更為全面地了解個性化推薦算法的運作機制,算法服務提供者可通過簡單易懂的方式,對用戶的反饋效果進行說明。如在用戶對特定信息内容标識“不感興趣”後,告知算法将“不再推薦類似商品”,在不涉及洩露商業秘密的前提下,還可進一步細化效果的顆粒度,如“不再推薦類似價格/款式/品牌的商品”。

  (作者系阿裡巴巴集團政策法規研究室高級專家)

來源:中國社會科學網-中國社會科學報 作者:劉明

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved