tft每日頭條

 > 生活

 > Deepmind 編程

Deepmind 編程

生活 更新时间:2024-09-14 15:13:34

9月26日消息,Alphabet旗下的DeepMind推出了人工智能驅動的聊天機器人Sparrow,被稱為該行業努力開發更安全的機器學習系統的裡程碑。

Deepmind 編程(DeepMind推出新型聊天機器人Sparrow)1

據DeepMind稱,與早期的神經網絡相比,Sparrow可以更頻繁地對用戶的問題給出合理的答案。此外,這款聊天機器人還包括一些功能,可以顯著降低偏見和有毒答案的風險。DeepMind希望它用于構建Sparrow的方法将促進更安全的人工智能系統的開發。

DeepMind的研究人員使用一種被稱為強化學習的流行人工智能訓練方法開發了Sparrow。該方法包括讓一個神經網絡重複執行一個任務,直到它學會正确地執行任務。通過反複的試錯,網絡可以找到提高精确度的方法。

在開發Sparrow聊天機器人時,DeepMind将強化學習與用戶反饋結合起來。Alphabet部門讓一組用戶向Sparrow提問,以評估該聊天機器人的準确性。該聊天機器人為每個問題生成多個答案,用戶選擇他們認為最準确的答案。

據DeepMind稱,其研究人員利用用戶對Sparrow回答的反饋來改進聊天機器人。Alphabet部門表示,這種方法大大提高了聊天機器人的準确性。

當用戶要求Sparrow檢索某一主題的信息時,比如天文學,聊天機器人就會使用谷歌搜索找到所請求的信息。然後,Sparrow會提供給用戶答案,并附帶一個鍊接,鍊接到檢索答案的網站。據DeepMind稱,用戶認為Sparrow用這種方式生成的答案中有78%是合理的,這比使用傳統方法開發的AI系統有了顯著改進。

DeepMind為Sparrow配置了23條規則,旨在防止聊天機器人産生偏見的答案。在測試期間,DeepMind要求用戶試圖欺騙Sparrow打破規則。用戶成功騙過它的次數隻有8%,Alphabet部門表示,這明顯低于使用其他方法訓練的AI模型打破規則的頻率。

DeepMind的研究人員在一篇博客文章中詳細寫道:“在對抗性探測下,Sparrow更善于遵守我們的規則。”“例如,當參與者試圖欺騙我們的對話模型時,我們最初的對話模型違反規則的頻率大約是Sparrow的3倍。”

DeepMind利用用戶反饋改進Sparrow的方法是該Alphabet子公司多年來開發的一系列先進人工智能訓練方法中的最新一種。2021年,DeepMind詳細介紹了一種自動化人工智能訓練中涉及的一些手工任務的新方法。最近,DeepMind的研究人員訓練一個神經網絡執行600多種不同的任務。

,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2024 - www.tftnews.com All Rights Reserved