GPT-4 基础知识：它的工作原理以及如何使用它

已发表: 2024-04-10

GPT-4 是一种多功能的生成式人工智能系统，可以解释和生成各种内容。了解它是什么、它如何工作以及如何使用它来创建内容、分析数据等等。

GPT-4是什么？
谁创建了 GPT-4？
GPT-4 的工作原理
GPT-4 是免费的吗？
GPT-4 功能
GPT-4 API 用例
GPT-4的优点
GPT-4 的局限性
结论

GPT-4是什么？

GPT-4是一种适应性强的生成式人工智能工具，支持多模态输入。这意味着它可以解释和处理广泛的内容，不仅是文本，还包括音频和图像。用户可以向其提供各种类型的数据。作为回报，GPT-4 可以产生包括详细书面段落、深入解释、计算机代码和创意作品的输出，所有这些都以密切模仿人类思维和语言模式的方式进行。

GPT-4 与 ChatGPT 有何不同

GPT-4 和 ChatGPT 密切相关，但并不相同。 ChatGPT 是一个聊天机器人，允许人们与底层大语言模型 (LLM) 进行对话。本质上，ChatGPT 是模型的对话接口。您可以用自然语言输入文本提示，ChatGPT 将回复您的提示答案。

ChatGPT 可以在各种版本的 GPT 模型上运行。默认情况下，ChatGPT 的免费版本允许您访问 GPT 3.5。通过付费订阅，您可以访问 GPT-4。

GPT-4 与 GPT-4 Turbo：有什么区别？

GPT-4 Turbo 是 GPT-4 的更快且更具成本效益的版本，适用于大规模应用程序。事实上，最新版本的 GPT-4 Turbo 比 GPT-4 更实惠、功能更强大。 GPT-4 Turbo 还具有更长的上下文窗口，这意味着您可以在输入提示中发送最多 300 页的文本。

总体而言，GPT-4 和 GPT-4 Turbo 之间的选择取决于应用程序的具体要求，特别是在响应复杂性、速度和运营成本方面。

谁创建了 GPT-4？

旧金山的人工智能公司 OpenAI 创建了 GPT-4。 OpenAI 成立于 2015 年，致力于创造“安全且造福全人类”的人工智能。该公司支持多个领先的人工智能平台，包括 DALL-E 和 Codex。

OpenAI 于 2023 年 3 月 14 日发布了 GPT-4。

GPT-4 是如何工作的？

GPT-4 不会从知识数据库中提取响应。它一次生成一个单词，并在每个单词出现时进行预测。它的预测基于通过分析大量数据确定的统计模式。

使这种高级分析成为可能的技术称为生成式预训练变压器 (GPT)。 GPT 是 OpenAI 制作的法学硕士系列的名称。让我们看看研究人员如何训练 GPT 模型，以更好地了解它们的工作原理。

GPT 模型是如何训练的

GPT模型训练过程分为两个阶段：预训练和微调。

在预训练期间，该模型处理和分析来自互联网的大量数据以及来自第三方来源的许可数据。它识别单词和图像之间的模式和相关性，以理解含义和上下文。它还学习句子、段落和各种类型内容的结构，例如诗歌、学术论文和代码。

GPT 模型使用称为 Transformer 的高级神经网络架构。转换器是模型解析大量数据和独立学习能力的关键。转换器允许模型处理和学习训练数据中的模式，这使得 GPT-4 等 GPT 模型能够对新数据输入进行预测。

训练的下一阶段是微调。在此阶段，模型被细化以执行特定任务，例如生成对话响应。该模型学习如何通过人类反馈的强化学习 (RLHF) 来提供人们想要的答案。人类对模型的响应进行评分，模型尝试通过每个后续响应获得更积极的反馈。微调阶段也是一个尽量减少偏见和减少有害反应的机会。

以前的 GPT 型号

GPT-4 是 OpenAI GPT 模型的第四次迭代。以下概述了该车型系列的演变过程。

GPT-1 于 2018 年推出。它在 BookCorpus 上进行训练，BookCorpus 包含 7,000 本未出版的小说书籍。该模型证明了GPT框架可以实现自然语言理解。
GPT-2于2019年2月推出。它在800万个网页上进行了训练。训练目标是创建一个模型，在给出所有前面的单词后预测文本中的下一个单词。研究人员要求模型生成论据，从而使该模型超出了其训练范围。结果是一篇人类可以写的文章。尽管 GPT-2 的表现不一致，但它可以回答问题、翻译文本和总结长内容。
GPT-3 于 2020 年夏天发布。OpenAI 将其称为通用文本生成平台。训练 GPT-3 的数据集包含超过一万亿个单词。与其前身不同，GPT-3 可以生成代码。 GPT-3 是人工智能聊天机器人 ChatGPT 的基础。

GPT-4 培训和关键能力

OpenAI 于 2021 年开始创建用于构建 GPT-4 的深度学习工具。它与 Microsoft Azure 合作开发了一台超级计算机，能够处理高级法学硕士所需的计算能力和数据量。

GPT-4 根据公开数据和第三方来源的数据进行了培训。与之前的模型不同，OpenAI 没有发布任何有关训练模型的大小、所使用的硬件或训练方法的详细信息。

我们所知道的是，GPT-4 在几个方面比 GPT-3 更先进：

可以接受图像和基于文本的提示
截至 2023 年 4 月接受过数据培训； GPT-3 的数据集将于 2021 年 6 月停止
在创造性任务上表现优于 GPT-3
能够处理比其前身更复杂的任务，例如分析图表
可以处理长达 25,000 字的较长提示
更有可能留在允许内容的护栏内
生成更准确的响应
更善于适应用户请求，例如您的品牌个性或写作风格

OpenAI 还使用了多项测试来验证 GPT-4 的能力。它在 AP 考试、统一律师考试、奥林匹克考试、LSAT 和 GRE 定量考试中表现良好。

GPT-4 是免费的吗？

您必须付费才能直接从 OpenAI 使用 GPT-4。有两种方法可以访问它。

通过付费订阅 ChatGPT Plus，您可以访问 GPT-4。然后，您可以在网络上与 ChatGPT 或与 Android 和 iOS 的应用程序进行对话。

开发者可以通过开发者API访问GPT-4。使用 API，您需要支付固定费率来购买代币。提示令牌有一种费率，即您在向 LLM 提出的“问题”中使用的令牌，而完成令牌有另一种费率，即您从 LLM 收到的“答案”中使用的令牌。

令牌的工作原理如下：

每个输入和输出都被分解为令牌。提示令牌是指您在向 GPT-4 请求中提供的文本和文件。完成标记是指 GPT-4 在其响应中生成的文本。
在 GPT-4 处理您的请求之前，输入会被分解为令牌。这些标记与音节或逻辑词片段不同，它们可以包含空格或子词。
有一些经验法则可以帮助您理解单词和标记之间的“汇率”。在英语中，四个字符大致翻译为 1 个标记，75 个单词大致翻译为 100 个标记。在其他语言中，这个比率并不成立，并且每个单词可能会翻译为更多数量的标记。

访问 GPT-4 的另一种方法是通过 Microsoft 的 Copilot AI。 Copilot 是一个在 GPT-4 上运行的聊天机器人。 Copilot 可在线或通过移动应用程序使用。

GPT-4 可以做什么

GPT-4 能够解释细微差别、处理更复杂的提示以及接受图像，这意味着它具有广泛的潜在应用。然而，与当前所有人工智能系统一样，GPT-4 也有局限性，需要谨慎使用。

让我们从在 ChatGPT 平台中使用它的一些方法开始。

分析图像

您可以在 GPT-4 中上传图像并要求基于该图像执行任务。以下是您可以请求 GPT-4 完成的一些图像分析任务：

解释图表或图形中的数据
描述图像，包括图像中的主体正在做什么以及有多少人
阅读和分析文本照片，例如历史文献
将手写笔记变成文字
识别图像中有趣、悲伤或令人惊讶的地方

生成文本

GPT-4 可以生成用于正式通信、商业活动或个人任务的原始文本内容。以下是一些示例：

编写培训材料
创建程序文件、手册和政策
将内容翻译成不同的语言
回答基本研究问题，例如肯尼亚有多少个省或空气净化器的工作原理

生成式人工智能广泛用于文本创建，但如果您需要一个与当前工作流程无缝集成的写作工具，Grammarly 可能是更好的选择。个人和团队都使用它直接在超过 500,000 个应用程序和网站中进行集思广益、撰写和修改内容。这消除了在平台之间复制和粘贴您的工作的需要。通过 Grammarly 的AI 检查器引导负责任的 AI 使用，该检查器经过训练可以识别 AI 生成的文本。

使用 Grammarly 更智能地工作

任何有工作要做的人的人工智能写作伙伴

生成创意内容

GPT-4 比其前身 GPT-3.5 拥有更好的创意写作能力。特别是，它更能保持叙述的衔接性和一致性。

以下是使用这些功能的一些方法：

创建虚构的生物，并描述它们的外观、历史和传说
用特定风格的散文描述图像
概述一个短篇故事
起草博客、社交媒体标题和营销传播内容
以诗歌的形式解释复杂的主题，例如软件开发

编写代码

GPT-4 可以用数十种编程语言编写、翻译和优化代码。您可以通过多种方式生成和分析代码：

上传网站布局图并要求 GPT-4 生成与其匹配的代码
用自然语言描述您希望代码执行的操作
粘贴现有代码并要求 GPT-4 识别错误
获得一段代码的作用的易于理解的描述

总结和分析内容

GPT-4 可以解析大量数据，以跟踪数据趋势、总结文本并解释内容。您可以直接在应用程序中输入文本或上传各种流行格式的文件。

GPT-4 可以读取和分析各种应用程序的内容：

确定 Excel 文档中的销售趋势
为一篇长而复杂的文本（例如学术文章）撰写 250 字的摘要
查找两篇文章之间的相似之处
解释短篇小说的情节，详细说明写作风格和主题
审查文本并提供改进建议

GPT-4 API 用例

开发人员使用 GPT-4 API 来创建新应用程序并向现有应用程序添加功能。以下是这些应用程序所属的一些更常见的类别。

内容生成

尽管 ChatGPT 可以使用 GPT-4 生成内容，但开发人员可以创建自定义内容生成工具，其中包含针对特定用户定制的界面和附加功能。例如，GPT-4 可以使用广告、网站文案、直邮和电子邮件活动等信息进行微调，以创建用于编写营销内容的应用程序。应用程序界面可能允许您输入关键字、品牌声音和语气以及受众群体，并自动将该信息合并到您的提示中。

聊天机器人

GPT-4 可以作为对话式 AI 平台的基础。开发人员可以为特定功能创建自定义聊天机器人，例如客户服务、体现角色或历史人物，或者回答家庭作业问题。

定制助理

GPT-4 可以为针对特定行业、职业或兴趣的人工智能助手提供支持。例如，您可以为法律专业人士或头脑风暴创意创建一个助手。

情感分析

GPT-4 可以作为情绪分析应用程序的基础，该应用程序扫描评论和社交媒体以找到客户反馈和公众舆论中的共同主题。

辅助技术

GPT-4 为让世界变得更加无障碍开辟了新的可能性。例如，它可以为视障人士提供图像的文字描述。

GPT-4的优点

GPT-4 提供了许多特性和功能。以下是 GPT-4 功能的一些示例。

这是多式联运

GPT-4 接受图像、文件和文本的能力使其能够执行复杂的任务。这些多模式功能扩展了几乎所有基于 GPT-4 的应用程序的潜力。

以下是您如何从 GPT-4 的多模态中受益：

使用多个来源为提示添加更多上下文和深度。例如，连锁餐厅可以使用 GPT-4 扫描社交媒体上的照片和标题，以评估客户情绪。这使他们能够做的不仅仅是捕捉社交帖子中的积极和消极词语。他们还可以看到哪些食品照片往往有正面标题，哪些照片往往有负面标题。
节省时间。由于您可以直接将附件添加到平台，因此您不必编写自己的与提示相关的文件或图像的摘要。 GPT-4 还可以自动执行产品描述和报告等任务。只需上传图像或原始数据，然后提示 GPT-4 生成符合您指南的响应即可。
创建多步骤提示。 GPT-4 可以从图像中获取信息并用它执行复杂的任务。例如，您可以上传戏剧排练时间表的照片，并询问 GPT-4 主角排练的日期和时间。

更好地理解细微差别

GPT-4 特别擅长检测书面文本中的情感、方言和口语等细微差别。它还可以推断出含义，而无需您直接说出事情。

理解细微差别的能力使 GPT-4 的输出更加像人类：

在来自不同地方的角色之间生成听起来真实的对话
评估图像中人物的情绪并编写针对这些情绪的内容
允许人们编写听起来自然的提示并以上下文准确的内容进行响应

它很灵活

尽管聊天机器人是使用 GPT-4 创建的一些最流行的应用程序，但该模型可以为许多生成式 AI 应用程序提供支持。这是因为您可以在自己的数据集上微调 GPT-4。然后，您可以将其与现有应用程序集成或创建外观和感觉像您的品牌的新应用程序。由于这种灵活性，从医药到消费品等各个领域的开发人员都可以使用 GPT-4 进行创新。

以下是利用 GPT-4 灵活性的一些方法：

为客户提供自助服务工具
使非技术人员能够完成技术任务，例如编码
为音乐、书籍、播客等创建自定义推荐。
自动执行手动任务，例如医疗文档

GPT-4 的缺点

GPT-4是一个先进的生成式人工智能平台，但它也有缺点。以下是使用它时需要注意的事项。

它可能会产生不准确的答案

所有生成式人工智能平台都容易产生不准确的信息。人工智能研究人员将这些不准确的现象称为幻觉。尽管 GPT-4 比其前身更准确，但它不验证信息，也不知道何时出错。它的创建者提到，它可能是错误的。由于这些不准确之处，开发人员在考虑是否将 GPT-4 集成到他们的应用程序中时应该深思熟虑。如果应用程序的容错能力有限，那么可能值得验证或交叉检查 GPT-4 生成的信息。

它的信息库有限

GPT-4 的训练数据集仅截至 2023 年 4 月，这意味着它的响应中不包含最新新闻和趋势。如果您使用 GPT-4 进行研究，它不会提供最新的见解。对于信息快速变化的技术等主题，它可能已经过时了。

开发人员可以通过使用更多最新数据微调模型或创建向模型添加在线搜索功能的应用程序来解决此限制。

访问成本可能很高

免费访问 GPT-4 的唯一方法是通过 Microsoft 的 Copilot AI。如果您更喜欢通过 ChatGPT 使用它，每月至少花费 20 美元。根据您的需求和预算，这可能会令人望而却步。

此外，开发人员可能会发现 GPT-4 的 API 访问成本很高，尤其是当他们运行使用大量令牌的流行应用程序时。

GPT-4 和生成式 AI 格局

GPT-4 因其先进的处理能力、多模式功能和灵活性而成为领先的生成式 AI 平台之一。日常用户可以通过 ChatGPT 的高级订阅使用 GPT-4 创建原创内容。开发人员可以使用 API 构建新应用程序并改进现有应用程序。

尽管 GPT-4 有许多应用，但它的不准确性和成本可能会让某些用户望而却步。然而，它只是众多生成式人工智能平台之一。请密切关注最新的人工智能工具以及您可以使用它们做什么。