tft每日頭條

 > 科技

 > 數據比較算法技巧

數據比較算法技巧

科技 更新时间:2024-12-01 08:43:32

數據比較算法技巧?近日,經濟學家、數據科學家塞思·斯蒂芬斯·達維多維茨所著的新書《不要相信你的直覺》正式出版,現在小編就來說說關于數據比較算法技巧?下面内容希望能幫助到你,我們來一起看看吧!

數據比較算法技巧(在做選擇這方面)1

數據比較算法技巧

近日,經濟學家、數據科學家塞思·斯蒂芬斯·達維多維茨所著的新書《不要相信你的直覺》正式出版。

作者在書中表示,過去10年間,學者們挖掘了史無前例的龐大數據。依靠這些數據,人類過去在生活、商業、學術等各方面的諸多難題被一一解決。

在此基礎上,作者更是進一步指出,相比于數據對人類社會的解釋和判斷,人類直覺已經顯得不再那麼“可靠”。數據和算法正在取代直覺,成為人類賴以生存的重要工具。

AI既能做“球探”也能當“紅娘”

達維多維茨在其新書中表示,雖然我們總是自認為知道如何使自己做出最優選擇,但近年來的事實證明,數據在這件事上能夠做得更好,甚至糾正了我們過去一些錯誤的直覺。

作者在書中引用了一部經典體育電影《點球成金》中的故事。電影主人公在組建棒球隊的過程中通過建立數學模型,采用量化分析的方法,發現球員的上壘率指标與比賽勝負之間存在某種關聯,即上壘率越高,比賽獲勝的可能性越大。該指标在過去一直不被專業球探所重視,但主人公選擇相信數據的判斷,于是他以此為根據,尋找他認為合适的球員。也正是因為這一指标在過去不為專業球探所重視,所以該指标表現優秀的球員往往身價低廉,主人公也因此以遠低于市場平均值的成本成功建隊,并且帶領這支球隊一舉奪得冠軍。

這個由真實事件改編的故事揭示了數據在挖掘運動員潛在價值方面的巨大作用,數據已變成選材的重要工具。2021年,英格蘭超級聯賽球隊伯恩利為了更好地輔助球探篩選并挖掘有天賦的年輕球員,決定與AI人才識别平台進行合作——運用AI技術在全球公開招募14歲以上的潛力球員。球員們隻需要把自己的足球訓練視頻或者比賽視頻上傳到平台,平台便會自動分析球員特征,生成360度的球員展示圖,詳細列出球員在技術、認知和心理能力等方面的數據,供球探參考。通過這種方式,球隊能夠以極低的成本在全世界挖掘優秀球員,并且更有可能發現那些被傳統挑選方法所埋沒的人才。

當然遠不止于體育,數據的作用早已滲透我們的日常生活。尤其是在那些過去曾被認為不可能被準确量化的領域。根據日本《讀賣新聞》報道,2021年初,為了應對少子化趨勢,提升結婚率。日本政府推進一項AI婚介項目,應用人工智能篩選婚配對象。參與者需要提供自身與婚戀有關的各項數據,包括年齡、學曆和收入條件等。随後人工智能系統會對數據進行深入分析,然後在所有報名者中為人們篩選匹配出“可能對你抱有好感的人”。即使有時不符合雙方提出的條件,系統也會給出相應推薦。

2019年該系統在日本埼玉縣試運行時,在所有通過政府婚介服務成功結婚的38對情侶中,有21對是通過AI推薦系統成功配對結婚的,超過了總數的一半。可見數據和算法有時或許比紅娘更懂人類姻緣。

數據、算法都給力決策才能更正确

如今,AI已經開始進入我們的生活,科學家也會利用AI從事科研活動。AI會利用大量的數據,再通過一定的算法,驗證過去學者們依靠觀察、訪談等傳統社會科學方法所得到的有關人類社會的認識理論,但有時卻也會給出一些令人“大跌眼鏡”的觀點,貌似違反了過去我們對于人類社會的認知常識。

在北京師範大學新聞傳播學院、計算傳播學研究中心教授吳晔看來,如果通過數據、算法得出的結果違反直覺或者常識,這不僅是常見的,而且是應該的。“直覺、常識本身就不一定是正确的,如果靠數據、算法得出的結論全都是符合直覺、常識的,那麼這個數據、算法還有什麼價值呢?大數據很大的一個優點就是幫助我們尋找出一些靠人類直覺無法得到的結論。”

但随着數據的種類、數量越來越多,人們不禁要問,是否所有數據都有價值?吳晔認為,如果想要依靠數據和算法對人類社會進行理解、解釋,乃至幫助人們進行抉擇,數據就必須要具備一定條件。首先是數據規模要足夠大,即使無法做到全樣本數據,也應盡量實現數據來源的随機性,選擇的數據要有代表性;其次則是數據質量應盡量可靠,數據的準确性和完整性要有所保證;此外,如果有統一的數據接口标準,算法的複雜性也能夠大大降低。

如果上述要求能夠得到滿足,那麼當我們利用AI進行決策時,将更有可能得到更加準确的結果。但吳晔也強調,人類社會高度複雜,并且時刻都在變化。相對固定的算法很難做到長久有效。“以互聯網上運行的推薦算法為例,可能幾小時就會叠代一次。”他認為,算法的不斷更新、修正,也是保證大數據應用能夠取得可靠結果的重要因素。

還需認清數據、算法的兩面性

信息獲取方式的變化毫無疑問是近年來數據和算法給大衆帶來的最大改變之一。因此,也不斷有批評者對信息推薦算法導緻“信息繭房”效應加劇的問題進行批判。吳晔認為,“信息繭房”的産生并不能全讓算法“背鍋”。有研究表明,“信息繭房”是算法和受衆認知偏好共同作用下的結果,兩者缺一不可。

吳晔進一步表示,算法歸根結底是受人控制的,算法的規則是人制定的。“人完全可以寫出一個‘走向另外一個極端’的算法,讓大家的選擇多樣化,遠離‘信息繭房’,但是這種算法不符合商業利益,所以沒有人去做。”他說。

所以,人與大數據、算法之間不存在固有矛盾。“大數據的應用是為了提高人類某些行為的效率,是為人類服務的,總體上是需要擁抱的。”吳晔說。但他同時也提醒道,如果大數據被别有用心的人利用,當然也會産生負面效果。“數據和算法就像菜刀,它既可以是工具,也可能會成為兇器。但我們不能因噎廢食,就因為它可能會成為兇器就再也不生産菜刀了。”

那麼,我們應如何合理、恰當地應用大數據,使其更好地為人類服務?吳晔認為,應努力推動數據共享,使數據成為儲存在個人設備裡的私有财産,而非互聯網平台的财産,并在有償的前提下實現數據共享;此外,則是要避免數據被别有用心的人用于不利于社會發展的用途,比如大數據殺熟、大數據售假等,而這則需要有關部門提高監管水平,營造一個良好的互聯網環境。

相關鍊接

數據、算法正在悄悄改變你我

當我們越來越多地依賴數據和算法為我們做出決定時,我們也很有可能在不知不覺中被數據和算法改變。

同樣是在婚戀領域,英國牛津大學的研究者曾就大數據在線匹配婚戀網站進行了跨度為10年的研究。他們發現,随着數據匹配婚戀方式的不斷流行,男性在線上婚戀行為中的主導作用也在不斷得到加強。

研究人員認為,在大數據匹配模式下,男性選擇婚戀對象的成本被進一步降低,因此更加傾向于主動示愛,而女性則變得更加傾向于被動等待。但研究人員也指出,這種改變僅限于線上婚戀行為,對于是否能夠影響線下婚戀行為,仍需進一步研究。

與此同時,該研究團隊也發現,針對這一情況,已經有部分應用開始反其道而行,即隻允許女性主動發起對話,并且限制對話時間,以此鼓勵女性掌握線上婚戀行為的主動權。(實習記者 都 芃)

來源: 科技日報

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关科技资讯推荐

热门科技资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved