#頭條創作挑戰賽#
介紹 事件正在迅速展開,新的大型語言模型 (LLM) 正在以越來越快的速度開發。就在過去幾個月,我們有了颠覆性的ChatGPT和現在的GPT-4。明确定義,GPT代表(Generative Pre-trained Transformer),是底層語言模型,而ChatGPT是為會話設計的具體實現。比爾·蓋茨 (Bill Gates) 回顧 OpenAI 的工作時說,“人工智能時代已經開始”。如果您感到難以跟上快速變化的步伐,那麼您并不孤單。就在剛才,超過 1000 名研究人員簽署了一份請願書,要求在未來六個月内暫停訓練比 GPT-4 更強大的 AI 系統。
盡管技術成就顯著,但它們仍然是閉門造車。盡管它的名字,OpenAI 長期以來一直受到一些人的批評,因為它沒有發布他們的模型,甚至被一些人稱為ClosedAI。研究人員和愛好者都在努力尋找開源替代品。
如果您錯過了最近的發展,您應該查看 Meta 的LLaMA ( GitHub ),它應該優于 GPT-3。它是在 GNU 許可下獲得許可的,雖然它不是嚴格開源的,但您可以在注冊後獲得權重。這種開放顯然是為了 LLaMA 的利益,社區很快就繼續開發它。它很快以llama.cpp的形式移植到 C/C ,斯坦福大學的研究人員将其擴展到一個指令跟随模型,例如 ChatGPT,并将其命名為Alpaca。還有GPT4All,這篇博文是關于它的。我将很快介紹它,最後,您将了解如何在本地運行它以及會發生什麼。
但首先,讓我們反思一下社區在短時間内開發開放版本的速度有多快。為了了解這些技術的變革性,下面是各個 GitHub 存儲庫的 GitHub 星數(衡量受歡迎程度)。作為參考,流行的PyTorch 框架在六年内收集了大約 65,000 顆星。下面的圖表是大約。一個月。
GPT4全部 但是現在,讓我們更深入地介紹GPT4All。這是Nomic AI的助手式聊天機器人,剛剛公開發布。如何基于現有的語言模型(如 LLaMA)創建類似 ChatGPT 的助手式聊天機器人?答案可能會讓您大吃一驚:您與聊天機器人互動并嘗試了解它的行為。就 gpt4all 而言,這意味着從公開可用的數據源收集各種問題和提示樣本,然後将它們交給 ChatGPT(更具體地說是 GPT-3.5-Turbo)已生成 806,199 個高質量的提示生成對。接下來,整理數據并删除低多樣性響應,并确保數據涵蓋廣泛的主題。訓練數據後,他們發現他們的模型比同類産品表現更好。
對我來說,其中一個主要吸引力在于作者發布了模型的量化 4 位版本。這是什麼意思?實際上,您在模型中以較低的精度而不是全精度執行某些操作,因此可以擁有更緊湊的模型。雖然像 ChatGPT 這樣的模型在 Nvidia 的A100等專用硬件上運行,這是一款配備高達 80 GB RAM 的硬件怪獸,價格為 15,000 美元,但對于 GPT4All,這意味着您可以在消費級硬件上執行該模型。現在,讓我們開始運行您自己的:
設置東西 運行 GPT4All 的說明很簡單,隻要您安裝了正在運行的 Python。隻需按照GitHub 存儲庫上的設置說明進行操作即可。htt2lq49k0/7f1504a885e24e9ab5b960fe00f48810.jpg" alt="chatgpt電腦端怎麼使用(chatgpt本地安裝教程)(4)" />
我發現這确實非常有用——同樣,考慮到這是在 MacBook Pro 筆記本電腦上運行的。雖然它可能不在 GPT-3.5 甚至 GPT-4 級别,但它肯定有一些魔力。
使用注意事項 使用 GPT4All 時,請牢記作者的使用注意事項:
“GPT4All 模型重量和數據僅用于研究目的并僅獲得許可,禁止任何商業用途。GPT4All 基于 LLaMA,具有非商業許可。輔助數據是從 OpenAI 的 GPT-3.5-Turbo 收集的,其使用條款禁止開發與 OpenAI 進行商業競争的模型。”
此外,請注意 ChatGPT 具有多項安全功能。
結論 開源項目和社區努力在實施技術和加速創意方面非常強大。GPT4All 就是一個顯着的體現。從根本上說,我認為這為閉源模型的業務方面提供了一個有趣的視角。如果您提供 AI 作為服務,那麼需要多長時間才能讓愛好者對您的 AI 進行足夠長的探索以能夠模仿它?對于 GPT4All 的案例,他們的論文中有一個有趣的注釋:他們花了四天的時間,GPU 成本 800 美元,OpenAI API 調用 500 美元。這絕對是非凡的。
,
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!