這兩天豆瓣、貓眼的"評分事件"鬧得有點兒大,作為一家“科技媒體”的小編,自然是不摻和這些站隊之類的麻煩事兒。所以蹭熱點的方式非常淳樸——科普。因為電影評分這事兒當然不可能像體操評分那樣“去掉一個最高分、丢掉一個最低分,然後總分除人數”那麼簡單粗暴,還得談到“大數據”。
豆瓣的評分是把所有用戶給出的 1~5 星換算成 1~10 分,然後将總分除以打分人數,就得到了豆瓣評分。這個評分不經審核,由程序定時生成。不過豆瓣也對“非正常評分”做了處理,不管是刷高分還是刷低分,都會屏蔽掉、不算在評分内。如何判斷是否“非正常評論”,豆瓣目前并未公開(或許公開了規則就等于變相公開了刷分方法?),但根據豆瓣的說明,刷分已經是很難辦成了。這也使得一些想幹擾評分的電影制作方批評豆瓣的評分、質疑其公信力,制造豆瓣評分有問題的輿論。
時光網官方給出的算法說明
早些年時光網的 Slogan 是做“中國版的 IMDb”,但根據後來時光網在去社區化上做出的一系列改版,這個願望大抵跟廁紙一起沖到馬桶裡,現在好像沒誰再提了。時光網的評分最有意思的是最低可以打到 0.1 分,不過這需要特别的技巧:在分項裡隻給聲音和畫面各一顆星(最少要給兩項打分才能提交)。
而國外最知名的 IMDb 的則不同,它使用的加權平均值。對于 TOP 250 的評分,它采用了貝葉斯統計算法:
WR, 加權得分(weighted Rating)。
R,該電影的用戶投票的平均得分(Rating)。
v,該電影的投票人數(votes)。
m,排名前250名的電影的最低投票數。
C, 所有電影的平均得分
即先通過現有數據統計設定基準,設定平均評分、基礎人數,在這個基準之上加入真實的用戶評分,合起來得出 IMDb 的 TOP 250 最終得分。IMDb 的這種貝葉斯統計算法更多的像是平衡模型、而不是一個評分模型。這種平衡模型能為冷門影片提供一個補償值,即便評分數少也能得到一個相對可靠的評分,而每一次新的投票都會使評分不斷向該影片的真實投票結果靠近。
TOP 250 之外的排名算法 IMDb 目前并未公開,但我們可以通過現有的具體評分來了解一下:
《國家寶藏》、《肖申克的救贖》、《長城》的評分詳情
除了算法之外,對于電影評分來說,把握好宣傳的力度也很重要,過度宣傳可能會拉低評分。一般來說,不依靠宣傳吸引來看電影的人傾向于打高分,但人數較少;而被大規模的宣傳吸引的人傾向于打低分,這類人數較多。這也是獨立電影為什麼有時候評分很高(隻有少數粉絲來打分),而票房冠軍有時候評分很低(把不會喜歡的人也宣傳來了)的原因。所以高分和高票房的确會有一些沖突,隻有真正廣受歡迎的電影能化解這個沖突。
《盜夢空間》和《星際穿越》是近幾年高票房、高評分的典型
豆瓣 CEO 阿北之前對評分算法表示“豆瓣在盡力還原普通觀影大衆對一部電影的平均看法,這個主旨過去十年沒變過,将來也不想變”,他雖然也認為彙總專家意見也是件很有價值的服務,但這并不是豆瓣評分的宗旨(所以做賣票起家的貓眼做了基于電影業内人士的專業評分,雖然現在由于不可描述的原因已經取消了)。
也許就像阿北說的那樣,想讓片子評分高一點,隻有拍好電影這一個能确定的方法。
,更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!