ChatGPT 101：它是什么及其工作原理

已发表: 2024-03-19

自 2022 年底推出以来，ChatGPT 已成为家喻户晓的名字。这份综合指南将教您有关 ChatGPT 所需了解的一切：它是什么、它如何工作、您可以用它完成什么以及需要注意的陷阱。

什么是 ChatGPT？
ChatGPT 的工作原理
谁创建了 ChatGPT？
ChatGPT 是免费的吗？
如何使用ChatGPT
ChatGPT 的优点
ChatGPT 的局限性
结论

什么是 ChatGPT？

ChatGPT 是一个人工智能聊天机器人。它使用自然语言处理 (NLP) 生成各种格式的文本内容，例如代码或散文。它旨在与您进行对话。您可以向其提出问题或提出请求，ChatGPT 将生成类似人类的响应。

ChatGPT 代表什么？

GPT 代表生成式预训练变压器。它指的是 ChatGPT 的创建者 OpenAI 开发的大型语言模型 (LLM) 系列。

我们来解释一下GPT的含义：

生成：模型的目的是生成原始内容。
预训练：它经过训练可以识别大型数据集中的模式，然后再进行微调以执行特定任务。
Transformer：该模型依赖于一种称为 Transformer 的高度先进的机器学习架构。 Transformer 的独特之处在于它们能够理解上下文并处理比其他类型的机器学习框架大得多的数据集。

ChatGPT 是一款基于 GPT 的应用程序，面向对话，这就是它以“chat”一词开头的原因。

ChatGPT 与 GPT-4

ChatGPT 经常与 GPT-4 混淆。两者均由同一家公司 OpenAI 开发，并且都是各种应用程序运行的基础。

GPT-4是OpenAI的LLM的最新版本。 ChatGPT 是基于 GPT-3（GPT-4 的前身）构建的聊天机器人应用程序。它现在在 GPT-3.5 上运行。但是，您可以通过 ChatGPT 的付费版本访问 GPT-4。

ChatGPT 的工作原理

ChatGPT 使用算法来预测对您的对话输入的正确响应。这些算法得到高度复杂的数学概念和强大计算能力的支持。要了解 ChatGPT 预测背后的机制，您需要了解其所基于的模型 GPT-3 的工作原理。

了解 GPT-3，ChatGPT 模型基于

GPT-3 在大量公开在线信息数据集上进行了预训练。它没有被提供提示和响应（这会限制其能力），而是被训练来独立解释它所消耗的数据，只需一些基本规则来指导它。这种方法称为无监督预训练。在此阶段，模型学会识别模式并理解其所使用的文本的关系和规则。

这就是GPT中T的用武之地。要了解 Transformer 的工作原理，您可以将它们与我们如何使用上下文线索来帮助我们理解新单词的含义或区分同音异义词进行比较。我们专注于某些单词来解释我们正在阅读的内容。

假设您正在阅读一篇文章，其中有一行内容是“杂货店里的所有婴儿车都有吱吱作响的轮子。”如果您不知道什么是“buggy”，您可以使用上下文线索来弄清楚。我们的大脑能够识别杂货店和车轮这两个词，这表明越野车很可能是购物车。

此外，我们可以以非线性方式做到这一点。我们可以识别这些重要的单词，无论它们是前后出现的。我们还可以理解，句子中的单词顺序可能会影响其含义。

使用 GPT 模型，变压器执行这些过程。它以计算机可以理解的方式将值应用于单词及其相互关系。随着模型的学习，这些计算机可读值（称为参数）的数量会增加。参数数量越多，通常与功能越多相关。

凭借可供提取的大型信息数据集和能够将这些信息置于上下文中的转换器，GPT-3 可以根据概率进行预测。每次您输入提示时，它都会使用算法来预测适当的响应，一次一个单词。

ChatGPT 如何针对对话进行微调

ChatGPT 基于 GPT-3，但单独进行了微调。微调过程的重点是优化 ChatGPT 的对话。 OpenAI 使用一种称为人类反馈强化学习 (RLHF) 的技术来微调模型，并确保它能够生成人们真正想要的响应。

在此过程中，许多人阅读提示并对 ChatGPT 的回复进行评分。然后对模型进行训练，以寻求对每个响应更积极的评价。这一微调过程帮助 ChatGPT 学会提供更高质量的答案，并帮助根除有偏见和有害的反应。

OpenAI 还使用目标数据集来微调 ChatGPT。该数据集包含 160,000 条专门用于训练对话式 AI 的人类对话。 OpenAI 还使用了几个现有的数据集，例如康奈尔电影对话语料库，这是电影剧本中对话的广泛集合。

谁创建了 ChatGPT？

ChatGPT 由位于旧金山的人工智能研究公司 OpenAI 创建。 OpenAI 于 2015 年由一群多元化的技术领导者、科学家和研究人员创立，其中包括 Sam Altman（现任 OpenAI 首席执行官）、Elon Musk（特斯拉和 SpaceX 的创始人兼首席执行官）和 Reid Hoffman（LinkedIn 联合创始人）。

OpenAI 于 2018 年开始开发其第一个生成式 AI 模型，并于 2022 年 11 月向公众发布了 ChatGPT。它的病毒式成功让 OpenAI 团队感到惊讶。该公司已经为开发者发布了 GPT 模型的版本。 2022 年初，它还发布了一个名为 InstructGPT 的平台，该平台与 ChatGPT 类似，但适用于更具体的应用。

ChatGPT 是免费的吗？

ChatGPT 可免费使用。您还可以购买按等级提供的付费订阅。

付费订阅的其他功能包括：

在高峰时段访问 ChatGPT，此时免费用户可能无法使用
抢先体验新功能
除了文本之外，还能够使用图像和语音与 ChatGPT 进行交互
访问最新型号 GPT-4
访问其他 OpenAI 工具，例如 DALL-E（图像生成器）和高级数据分析功能

如何访问 ChatGPT

ChatGPT 可通过网络以及适用于 Android 和 iOS 的应用程序进行访问。

如何使用ChatGPT

尽管它被称为聊天机器人，但 ChatGPT 具有深远的应用。教师、程序员、作家、数据分析师、艺术家和任何使用文本的人都可以将其合并到他们的任务中。

文本生成

ChatGPT 可以编写广泛的内容，从电子邮件到电影脚本。您可以使用 ChatGPT 进行写作过程的各个方面，包括概述、创建初稿以及获取修订反馈。

流行的个人写作活动包括：

随笔
求职信
社交媒体资料
个人传记
致政府官员、银行和公用事业公司的信
食谱

在专业环境中，ChatGPT 通常用于以下用途：

营销内容和传播
备忘录
产品说明
流程文档
教学大纲和教学内容
职位描述

它还能够生成创意内容，例如：

小说
诗
脚本
笑话

ChatGPT 的写作能力令人印象深刻。然而，还有很多替代方案。例如，Grammarly 会适应您的写作风格，并在您已使用的应用程序（例如电子邮件和 Google 文档）中运行。

使用 Grammarly 更智能地工作

任何有工作要做的人的人工智能写作伙伴

编码

ChatGPT 可以用大多数编程语言编写代码。它不一定会创建整个程序，但您可以使用它以多种方式提高编码效率：

为特定任务生成代码片段
从一种编程语言翻译成另一种编程语言
识别错误并提供修复
生成高级文档
优化现有代码

由于 ChatGPT 将自然语言转换为代码，因此它已成为初学者开始编码的流行方式。

定制聊天机器人

您可以使用 ChatGPT 创建自定义聊天机器人。任何拥有高级订阅的人都可以通过告诉 ChatGPT 他们希望聊天机器人 (GPT) 做什么来创建一个聊天机器人。您还可以向 GPT 提供额外知识的访问权限。

这些自定义 GPT 具有广泛的用途。例如，您可以创建一个聊天机器人来教您如何下棋，或者企业可以使用定制的 GPT 来实现客户服务功能。 OpenAI 提供了一个市场，您可以在其中发现 GPT 或将您的 GPT 提供给其他用户。

总结文本

如果您将文本复制到 ChatGPT 中，您可以提示它生成要点摘要。您还可以指定 ChatGPT 如何提供摘要。例如，为了总结一份很长的技术文档，您可能会要求 ChatGPT 创建一个外行人可以理解的概述。

研究

ChatGPT 庞大的知识库使其成为研究各种主题的流行工具。您可以向 ChatGPT 询问您通常会输入搜索引擎的各种问题的答案，例如“有哪些流行的排舞？”或“帝王蝶迁徙到哪里？”

ChatGPT 还可以帮助您出于各种目的更深入地研究主题：

探索新行业或职业道路
学习流程的步骤
了解新文化、著名人物和重大事件

创意产生

ChatGPT 可以通过为您生成想法来帮助启动头脑风暴过程。它可以列出内容、产品或活动等想法。您还可以将想法列表输入 ChatGPT 并要求其改进或调整。例如，您可以提供一份雨天活动列表，并要求 ChatGPT 将该列表细化为适合十岁以下儿童的活动。

规划

ChatGPT 可以帮助您计划下一次会议、假期或每月待办事项列表。写一个提示来描述您想要计划的内容，ChatGPT 可以提供帮助：

计划家庭出游并推荐景点和活动
创建旅行装箱单
创建会议议程并提供问题列表以提前发送给与会者
创建每周清洁清单

高级数据分析

通过付费 ChatGPT 帐户，您可以访问高级数据分析功能。您可以上传各种格式的文件，包括 CSV 文件和 MP3，并要求 ChatGPT 使用数据执行任务。

假设您想要分析原始销售数据。您可以上传文件并要求 ChatGPT 告诉您一周中哪几天销售额最高。 ChatGPT 还可以创建数据的可视化，例如按一周显示销量的图表。您甚至可以获取具体信息并请求折线图或条形图。

ChatGPT 的优点

ChatGPT 因其自然语言处理能力、训练所依据的庞大知识库以及生成几乎任何类型的基于文本的内容的能力而具有许多优势。

效率

ChatGPT 可以执行耗时、重复的任务，尤其是那些您不想做的任务。编码员、小企业主甚至法律专业人士都使用 ChatGPT 来执行手动任务。这使他们能够腾出时间从事更复杂的活动，例如规划业务战略或与同事合作。

定制化

您可以自定义 ChatGPT，以便它始终生成适合您偏好的响应。例如，如果您要求旅行建议，您可以告诉 ChatGPT 诸如您通常同行的人数或您需要为残障人士提供住宿等信息。 ChatGPT 将记住这些偏好并将其纳入后续的响应中。

多种语言

ChatGPT 可以理解并生成多种语言的内容。您可以用一种语言输入提示，并要求 ChatGPT 用另一种语言进行响应。多语言功能也使 ChatGPT 成为强大的翻译工具。

插件

ChatGPT 提供了越来越多的插件，允许您与应用程序内的其他网站和第三方服务进行交互。例如，您可以询问购物建议并获取一个列表，其中包含与您的提示相匹配的商品的直接链接。

ChatGPT 的局限性

尽管有其优点，但 ChatGPT 也有一些每个人都应该意识到的局限性。了解这些限制可以让您充分利用此工具的潜力，同时避免错误和令人沮丧、无益的响应等陷阱。

幻觉

ChatGPT 可能会生成错误或不正确的响应，这称为幻觉。幻觉以事实的形式呈现，因此很难捕捉到。这是人工智能编程的副产品。请记住，ChatGPT 不知道任何事情。它预测句子中的下一个单词。有时，这些预测是不正确的。

对于想要将人工智能用于医疗保健等关键服务的开发人员来说，幻觉是一个主要问题。目前，普通人需要意识到幻觉的发生，而不是毫无疑问地相信 ChatGPT 生成的内容。

需要深思熟虑的提示

ChatGPT 旨在为各种人群生成广泛主题的内容，因此它的响应有时可能是通用的。在大多数情况下，您需要非常规范地提示才能获得您想要的答复。

例如，如果您提示 ChatGPT 在没有其他说明的情况下为电子邮件编写主题行，则回复可能看起来像是由计算机而不是您创建的。如果您希望以特定的语气或语气编写主题行，或者关注特定问题，则需要编写高度描述性的提示。找出正确的提示可能非常耗时。此外，一旦您选择了正确的提示，就不能保证您每次使用它都会得到相同的结果。

知识有限

ChatGPT 接受了截至 2021 年的信息训练，因此无法提供有关当前事件或实时信息的响应。如果你要求它描述从詹姆斯·韦伯太空望远镜发送的图像（这些图像于 2022 年首次传输），它会告诉你它无法访问该信息。如果您使用它来计划度假等活动，您需要验证它建议的景点是否仍然开放。

缺乏引用

ChatGPT 对于研究很有用，但它不提供对其产生的信息的引用。如果您要求它提供引文，它可能会创建虚假或不正确的引文。因此，在使用 ChatGPT 进行研究时务必小心。如果您将其用于引用和准确性至关重要的任务（例如学术或法律写作），则需要做额外的跑腿工作。

探索 ChatGPT 及其他内容

凭借其高度复杂的算法，ChatGPT 几乎可以在所有环境中生成类似人类的内容，无论是软件开发还是学术。它可以节省您的时间，帮助您更好地沟通，并向您介绍新的想法，同时玩起来很有趣。通过了解 ChatGPT 的缺点并解决它们，您可以充分利用这些功能。通过 Grammarly 的AI 检查器引导负责任的 AI 使用，该检查器经过训练可以识别 AI 生成的文本。

虽然 ChatGPT 是最著名的生成式人工智能工具，但它肯定不是唯一的。如果您有兴趣将人工智能用于工作、学校或个人任务，请探索许多可用的选项。随着模型的发展和更多用例的开发，保持最新状态将使您能够识别正确的人工智能工具并让它们为您服务。