GPT-4 基礎：它的工作原理以及如何使用它

已發表: 2024-04-10

GPT-4 是一種多功能的生成式人工智慧系統，可解釋和產生各種內容。了解它是什麼、它如何運作以及如何使用它來創建內容、分析數據等等。

GPT-4是什麼？
誰創建了 GPT-4？
GPT-4 的工作原理
GPT-4 是免費的嗎？
GPT-4 功能
GPT-4 API 用例
GPT-4的優點
GPT-4 的局限性
結論

GPT-4是什麼？

GPT-4是一種適應性強的生成式人工智慧工具，支援多模態輸入。這意味著它可以解釋和處理廣泛的內容，不僅是文本，還包括音訊和圖像。用戶可以向其提供各種類型的數據。作為回報，GPT-4 可以產生包括詳細書面段落、深入解釋、電腦程式碼和創意作品的輸出，所有這些都以密切模仿人類思維和語言模式的方式進行。

GPT-4 與 ChatGPT 有何不同

GPT-4 和 ChatGPT 密切相關，但並不相同。 ChatGPT 是一個聊天機器人，允許人們與底層大語言模型 (LLM) 進行對話。本質上，ChatGPT 是模型的對話介面。您可以用自然語言輸入文字提示，ChatGPT 將回覆您的提示答案。

ChatGPT 可以在各種版本的 GPT 模型上運行。預設情況下，ChatGPT 的免費版本可讓您存取 GPT 3.5。透過付費訂閱，您可以存取 GPT-4。

GPT-4 與 GPT-4 Turbo：有什麼不同？

GPT-4 Turbo 是 GPT-4 的更快且更具成本效益的版本，適用於大規模應用程式。事實上，最新版本的 GPT-4 Turbo 比 GPT-4 更實惠、更強大。 GPT-4 Turbo 還具有更長的上下文窗口，這意味著您可以在輸入提示中發送最多 300 頁的文字。

總體而言，GPT-4 和 GPT-4 Turbo 之間的選擇取決於應用程式的特定要求，特別是在回應複雜性、速度和營運成本方面。

誰創建了 GPT-4？

舊金山的人工智慧公司 OpenAI 創建了 GPT-4。 OpenAI 成立於 2015 年，致力於創造「安全且造福全人類」的人工智慧。該公司支援多個領先的人工智慧平台，包括 DALL-E 和 Codex。

OpenAI 於 2023 年 3 月 14 日發布了 GPT-4。

GPT-4 是如何運作的？

GPT-4 不會從知識資料庫中提取回應。它一次產生一個單詞，並在每個單字出現時進行預測。它的預測是基於透過分析大量數據確定的統計模式。

使這種高階分析成為可能的技術稱為生成式預訓練變壓器 (GPT)。 GPT 是 OpenAI 製作的法學碩士系列的名稱。讓我們看看研究人員如何訓練 GPT 模型，以便更好地了解它們的工作原理。

GPT 模型是如何訓練的

GPT模型訓練過程分為兩個階段：預訓練和微調。

在預訓練期間，該模型處理和分析來自互聯網的大量數據以及來自第三方來源的許可數據。它識別單字和圖像之間的模式和相關性，以理解含義和上下文。它還學習句子、段落和各種類型內容的結構，例如詩歌、學術論文和代碼。

GPT 模型使用稱為 Transformer 的高階神經網路架構。轉換器是模型解析大量資料和獨立學習能力的關鍵。轉換器允許模型處理和學習訓練資料中的模式，這使得 GPT-4 等 GPT 模型能夠對新資料輸入進行預測。

訓練的下一階段是微調。在此階段，模型被細化以執行特定任務，例如產生對話回應。該模型學習如何透過人類回饋的強化學習 (RLHF) 來提供人們想要的答案。人類對模型的回應進行評分，模型嘗試透過每個後續回應獲得更積極的回饋。微調階段也是一個盡量減少偏見、減少有害反應的機會。

以前的 GPT 型號

GPT-4 是 OpenAI GPT 模型的第四次迭代。以下概述了此車型系列的演變。

GPT-1 於 2018 年推出。該模型證明了GPT框架可以實現自然語言理解。
GPT-2於2019年2月推出。訓練目標是創建一個模型，在給出所有前面的單字後預測文本中的下一個單字。研究人員要求模型產生論據，從而使模型超出了其訓練範圍。結果就是一篇人類可以寫的文章。儘管 GPT-2 的表現不一致，但它可以回答問題、翻譯文本和總結長內容。
GPT-3 於 2020 年夏天發布。訓練 GPT-3 的資料集包含超過一兆個單字。與其前身不同，GPT-3 可以產生代碼。 GPT-3 是人工智慧聊天機器人 ChatGPT 的基礎。

GPT-4 訓練與關鍵能力

OpenAI 於 2021 年開始創建用於構建 GPT-4 的深度學習工具。

GPT-4 根據公開數據和第三方來源的數據進行了培訓。與先前的模型不同，OpenAI 沒有發布任何有關訓練模型的大小、所使用的硬體或訓練方法的詳細資訊。

我們所知道的是，GPT-4 在幾個方面比 GPT-3 更先進：

可以接受圖像和基於文字的提示
截至 2023 年 4 月接受過資料訓練； GPT-3 的資料集將於 2021 年 6 月停止
在創意任務上表現優於 GPT-3
能夠處理比其前身更複雜的任務，例如分析圖表
可以處理長達 25,000 字的較長提示
更有可能留在允許內容的護欄內
產生更準確的回應
更善於適應用戶請求，例如您的品牌個性或寫作風格

OpenAI 也使用了多項測試來驗證 GPT-4 的能力。它在 AP 考試、統一律師考試、奧林匹克考試、LSAT 和 GRE 定量考試中表現良好。

GPT-4 是免費的嗎？

您必須付費才能直接從 OpenAI 使用 GPT-4。有兩種方法可以存取它。

透過付費訂閱 ChatGPT Plus，您可以存取 GPT-4。然後，您可以在網路上與 ChatGPT 或與 Android 和 iOS 的應用程式進行對話。

開發者可以透過開發者API存取GPT-4。使用 API，您需要支付固定費率來購買代幣。提示令牌有一種費率，即您在向LLM 提出的「問題」中使用的令牌，而完成令牌有另一種費率，即您從LLM 收到的「答案」中使用的令牌。

令牌的工作原理如下：

每個輸入和輸出都被分解為令牌。提示令牌是指您在向 GPT-4 請求中提供的文字和檔案。完成標記是指 GPT-4 在其回應中產生的文字。
在 GPT-4 處理您的請求之前，輸入會被分解為令牌。這些標記與音節或邏輯詞片段不同，它們可以包含空格或子詞。
有一些經驗法則可以幫助您理解單字和標記之間的「匯率」。在英語中，四個字元大致翻譯為 1 個標記，75 個單字大致翻譯為 100 個標記。在其他語言中，這個比率並不成立，每個單字可能會翻譯為更多數量的標記。

存取 GPT-4 的另一種方法是透過 Microsoft 的 Copilot AI。 Copilot 是一個在 GPT-4 上運作的聊天機器人。 Copilot 可在線上或透過行動應用程式使用。

GPT-4 可以做什麼

GPT-4 能夠解釋細微差別、處理更複雜的提示以及接受影像，這意味著它具有廣泛的潛在應用。然而，與目前所有人工智慧系統一樣，GPT-4 也有局限性，需要謹慎使用。

讓我們從在 ChatGPT 平台中使用它的一些方法開始。

分析影像

您可以在 GPT-4 中上傳圖像並要求基於該圖像執行任務。以下是您可以請求 GPT-4 完成的一些影像分析任務：

解釋圖表或圖形中的數據
描述圖像，包括圖像中的主體正在做什麼以及有多少人
閱讀和分析文字照片，例如歷史文獻
將手寫筆記變成文字
辨識影像中有趣、悲傷或令人驚訝的地方

產生文字

GPT-4 可以產生用於正式通訊、商業活動或個人任務的原始文字內容。以下是一些範例：

編寫培訓教材
建立程序文件、手冊和政策
將內容翻譯成不同的語言
回答基本研究問題，例如肯亞有多少省或空氣清淨機的工作原理

生成式人工智慧廣泛用於文字創建，但如果您需要一個與當前工作流程無縫整合的寫作工具，Grammarly 可能是更好的選擇。個人和團隊都使用它直接在超過 500,000 個應用程式和網站中進行集思廣益、撰寫和修改內容。這消除了在平台之間複製和貼上您的工作的需要。透過 Grammarly 的AI 檢查器引導負責任的 AI 使用，該檢查器經過訓練可以識別 AI 產生的文字。

使用 Grammarly 更聰明地工作

任何有工作要做的人的人工智慧寫作夥伴

生成創意內容

GPT-4 比其前身 GPT-3.5 擁有更好的創意寫作能力。特別是，它更能保持敘事的銜接性和一致性。

以下是使用這些功能的一些方法：

創造虛構的生物，並描述它們的外觀、歷史和傳說
用特定風格的散文描述圖像
概述一個短篇故事
起草部落格、社群媒體標題和行銷傳播內容
以詩歌的形式解釋複雜的主題，例如軟體開發

編寫程式碼

GPT-4 可以用數十種程式語言編寫、翻譯和最佳化程式碼。您可以透過多種方式產生和分析程式碼：

上傳網站佈局圖並要求 GPT-4 產生與其相符的程式碼
用自然語言描述您希望程式碼執行的操作
貼上現有代碼並要求 GPT-4 識別錯誤
獲得一段代碼的作用的易於理解的描述

總結和分析內容

GPT-4 可以解析大量數據，以追蹤數據趨勢、總結文字並解釋內容。您可以直接在應用程式中輸入文字或上傳各種流行格式的檔案。

GPT-4 可以讀取和分析各種應用程式的內容：

確定 Excel 文件中的銷售趨勢
為一篇長而複雜的文本（例如學術文章）撰寫 250 字的摘要
找出兩篇文章之間的相似之處
解釋短篇小說的情節，詳細說明寫作風格和主題
審查文本並提供改進建議

GPT-4 API 用例

開發人員使用 GPT-4 API 來建立新應用程式並為現有應用程式添加功能。以下是這些應用程式所屬的一些更常見的類別。

內容生成

儘管 ChatGPT 可以使用 GPT-4 產生內容，但開發人員可以建立自訂內容產生工具，其中包含針對特定使用者自訂的介面和附加功能。例如，GPT-4 可以使用廣告、網站文案、直郵和電子郵件活動等資訊進行微調，以創建用於編寫行銷內容的應用程式。應用程式介面可能允許您輸入關鍵字、品牌聲音和語氣以及受眾群體，並自動將該資訊合併到您的提示中。

聊天機器人

GPT-4 可以作為對話式 AI 平台的基礎。開發人員可以為特定功能建立自訂聊天機器人，例如客戶服務、體現角色或歷史人物，或回答家庭作業問題。

客製化助理

GPT-4 可以為針對特定行業、職業或興趣的人工智慧助理提供支援。例如，您可以為法律專業人士或腦力激盪創意創建一個助手。

情緒分析

GPT-4 可以作為情緒分析應用程式的基礎，該應用程式掃描評論和社交媒體以找到客戶回饋和公眾輿論中的共同主題。

輔助技術

GPT-4 為讓世界變得更加無障礙開闢了新的可能性。例如，它可以為視障人士提供圖像的文字描述。

GPT-4的優點

GPT-4 提供了許多特性和功能。以下是 GPT-4 功能的一些範例。

這是多式聯運

GPT-4 接受圖像、文件和文字的能力使其能夠執行複雜的任務。這些多模式功能擴展了幾乎所有基於 GPT-4 的應用程式的潛力。

以下是您如何從 GPT-4 的多模態中受益：

使用多個來源為提示新增更多上下文和深度。例如，連鎖餐廳可以使用 GPT-4 掃描社群媒體上的照片和標題，以評估客戶情緒。這使他們能夠做的不僅僅是捕捉社交貼文中的正面和負面詞彙。他們還可以看到哪些食品照片往往有正面標題，哪些照片往往有負面標題。
節省時間。由於您可以直接將附件新增至平台，因此您不必編寫自己的與提示相關的檔案或圖像的摘要。 GPT-4 還可以自動執行產品描述和報告等任務。只需上傳圖像或原始數據，然後提示 GPT-4 產生符合您指南的回應即可。
建立多步驟提示。 GPT-4 可以從影像中獲取資訊並用它執行複雜的任務。例如，您可以上傳戲劇排練時間表的照片，並詢問 GPT-4 主角排練的日期和時間。

更好地理解細微差別

GPT-4 特別擅長偵測書面文本中的情感、方言和口語等細微差別。它還可以推斷出含義，而無需您直接說出事情。

理解細微差別的能力使 GPT-4 的輸出更像人類：

在來自不同地方的角色之間產生聽起來真實的對話
評估圖像中人物的情緒並撰寫針對這些情緒的內容
允許人們編寫聽起來自然的提示並以上下文準確的內容進行回應

它很靈活

儘管聊天機器人是使用 GPT-4 創建的一些最受歡迎的應用程序，但該模型可以為許多生成式 AI 應用程式提供支援。這是因為您可以在自己的資料集上微調 GPT-4。然後，您可以將其與現有應用程式整合或創建外觀和感覺像您的品牌的新應用程式。由於這種靈活性，從醫藥到消費品等各個領域的開發人員都可以使用 GPT-4 進行創新。

以下是利用 GPT-4 靈活性的一些方法：

為客戶提供自助服務工具
使非技術人員能夠完成技術任務，例如編碼
為音樂、書籍、播客等創建自訂推薦。
自動執行手動任務，例如醫療文檔

GPT-4 的缺點

GPT-4是一個先進的生成式人工智慧平台，但它也有缺點。以下是使用它時需要注意的事項。

它可能會產生不準確的答案

所有生成式人工智慧平台都容易產生不準確的資訊。人工智慧研究人員將這些不準確的現象稱為幻覺。儘管 GPT-4 比其前身更準確，但它不驗證訊息，也不知道何時出錯。它的創建者提到，它可能是錯誤的。由於這些不準確之處，開發人員在考慮是否將 GPT-4 整合到他們的應用程式中時應該深思熟慮。如果應用程式的容錯能力有限，那麼可能值得驗證或交叉檢查 GPT-4 產生的資訊。

它的資訊庫有限

GPT-4 的訓練資料集僅截至 2023 年 4 月，這意味著它的回應中不包含最新新聞和趨勢。如果您使用 GPT-4 進行研究，它不會提供最新的見解。對於資訊快速變化的技術等主題，它可能已經過時了。

開發人員可以透過使用更多最新資料微調模型或建立向模型添加線上搜尋功能的應用程式來解決此限制。

訪問成本可能很高

免費存取 GPT-4 的唯一方法是透過 Microsoft 的 Copilot AI。如果您喜歡透過 ChatGPT 使用它，每月至少花費 20 美元。根據您的需求和預算，這可能會讓人望而卻步。

此外，開發人員可能會發現 GPT-4 的 API 存取成本很高，尤其是當他們運行使用大量令牌的流行應用程式時。

GPT-4 與生成式 AI 格局

GPT-4 因其先進的處理能力、多模式功能和靈活性而成為領先的生成式 AI 平台之一。日常用戶可以透過 ChatGPT 的高級訂閱使用 GPT-4 創建原創內容。開發人員可以使用 API 建立新應用程式並改進現有應用程式。

儘管 GPT-4 有許多應用，但它的不準確性和成本可能會讓某些用戶望而卻步。然而，它只是眾多生成式人工智慧平台之一。請密切注意最新的人工智慧工具以及您可以使用它們做什麼。