什么是生成式人工智能? 综合指南

已发表: 2024-04-02

人工智能似乎无处不在。 对人工智能未来的兴奋、恐惧和猜测占据了头条新闻,我们中的许多人已经将人工智能用于个人和工作活动。

当然,当人们提到最新的人工智能工具时,他们谈论的是生成式人工智能。 生成式人工智能的创新使机器能够根据人类的简单查询快速创作一篇文章、一首歌曲或一件原创艺术作品。

那么什么是生成式人工智能? 它是如何工作的? 最重要的是,它如何帮助您的个人和职业生涯?

本指南深入探讨生成人工智能的世界。 我们涵盖不同的生成式人工智能模型、常见且有用的人工智能工具、用例以及当前人工智能工具的优点和局限性。 最后,我们考虑了生成式人工智能的未来、技术的发展方向,以及负责任的人工智能创新的重要性。

目录

  • 什么是生成式人工智能?
  • 生成式人工智能的工作原理
  • 生成式人工智能模型
  • 生成式人工智能工具
  • 生成式人工智能用例
  • 优点和好处
  • 缺点和限制
  • 生成式人工智能的未来
  • 结论

什么是生成式人工智能?

生成式人工智能是指机器学习的一个特定分支,其中模型根据大量原始数据进行训练以创建原始输出,无论是文本、图像还是其他类型的内容。

人工智能或机器学习就是根据历史数据做出统计上可能的预测。 例如,传统的机器学习技术可用于从可能的语气列表中预测一篇文章的语气,例如“正式”或“有趣”。 这些技术根据许多示例构建文本语气属性的模型,然后使用该模型来评估新的输入。

打个比方:如果有人向您展示一百万个正式电子邮件的示例,然后向您展示一封新电子邮件,您也许能够确定它是否具有正式语气。 在处理一个想法的过程中,你的大脑会识别出该电子邮件中的某些特征——主题行、长度,也许还有礼貌用语——并意识到它们符合你的“正式”模型。 在非常高的层面上,传统机器学习的工作方式大致相同。

但是,如果您想给国会议员写一封新的正式电子邮件怎么办? 这是生成人工智能的领域。 与其他形式的机器学习一样,生成式人工智能仍然接受示例训练,以构建世界模型,从而能够对新输入进行预测。 然而,生成式人工智能模型通常需要在更大量的数据上进行训练才能成功,而且模型本身也需要更加复杂。 数据科学家使用一种称为神经网络的机器学习技术来构建生成人工智能模型。

要给国会议员写一封正式的电子邮件,生成式人工智能模型需要了解“正式”写作是什么样子、电子邮件的通常结构以及什么是“国会议员”。 令人惊讶的是,没有人对这些概念进行硬编码或解释如何将它们组合在一起——模型通过接受大量令人难以置信的原始文本(例如公共互联网上的所有内容)的训练来自行学习这一点。 这使得它基本上可以逐字预测一封新电子邮件,该电子邮件最有可能代表“给国会议员的正式电子邮件”。

生成式人工智能的工作原理

为了更好地理解生成式人工智能的工作原理,让我们将其操作分解为简单的步骤。

1用户输入提示

生成式人工智能会响应人类输入的提示。 例如,某人可能会输入诸如“为项目经理的聘用机会写一封专业的接受函”之类的提示。 提示越具体、写得越好,模型就越有可能产生令人满意的输出。 您可能听说过“提示工程”这个术语,它指的是调整提示措辞或包含附加指令以从生成人工智能工具获得更高质量、更准确结果的过程。

提示并不总是以文本形式提供。 根据生成式 AI 系统的类型(本指南后面将详细介绍),提示可能会以图像、视频或其他类型的媒体形式提供。

2生成AI工具分析提示

接下来,生成人工智能分析提示,将其从人类可读的格式转变为机器可读的格式。 出于本示例的目的,坚持使用文本,该模型将使用自然语言处理 (NLP) 对提示中的指令进行编码。

首先将较长的文本块分割成称为标记的较小单元,这些单元代表单词或单词的一部分。 该模型在语法、句子结构以及从训练数据中学到的许多其他类型的复杂模式和关联的背景下分析这些标记。 这甚至可能包括您之前给模型的提示,因为许多生成式人工智能工具可以在较长的对话中保留上下文。

3该工具生成预测输出

使用模型对提示进行编码的所有内容,它尝试生成最合理、统计上可能的响应。 本质上,该模型会问自己:“根据我迄今为止对世界的了解,并考虑到这个新的输入,接下来会发生什么?”

例如,假设您正在阅读一个故事,当您读到页面末尾时,它会显示“我妈妈回答了”,下一个单词位于下一页。 当你翻过这一页时,你认为下一个词会是什么? 根据您对世界的总体了解,您可能会有一些猜测。 它可以是电话,也可以是短信电话门禁问题。 了解故事中在此之前发生的事情也可能有助于您做出更明智的猜测。

从本质上讲,这就是像 ChatGPT 这样的生成式 AI 工具对提示所做的事情,这就是为什么更具体、更详细的提示有助于它做出更好的输出。 它有一个场景的开头,比如“写一首关于狗的有趣诗”。 然后,它尝试使用其复杂的世界模型和其中的关系逐字地完成故事。 至关重要的是,生成式人工智能工具还通过人类反馈进行所谓的强化学习,以学习更喜欢人类会认可的反应。

如果您使用过生成式人工智能工具,您会发现每次都会得到不同的输出 - 即使您问同一问题两次,该工具也会以略有不同的方式做出响应。 在非常高的层面上,其原因是一定程度的随机性是使生成式人工智能的响应更加真实的关键。 如果工具每次都选择最有可能的预测,那么它通常会得到没有意义的输出。

生成式人工智能模型

有许多技术可用于生成人工智能。 它们的核心都使用神经网络,这是一种类似于人脑工作方式的架构。 您可能还听说过“深度学习”这个术语,它只是指具有三层以上的神经网络(这是除了最基本的神经网络之外的所有神经网络)。

神经网络由互连节点层组成。 每个节点都有自己的统计模型,专门根据从训练数据中学到的知识来处理输入的单个方面。 类似于大脑的各个部分致力于不同的任务(当你看到熟悉的面孔时,某些神经元可能会放电),神经网络的不同部分会识别不同的模式和关系。

虽然每个单独的决策都很简单(例如,一个节点可能专门识别一个单词是否是名词),但最终的预测是所有这些决策共同产生的多米诺骨牌效应,从而产生非常复杂的输出。

数据科学家实际上可以通过多种方式使用神经网络来构建生成人工智能模型。 一些最常见的架构类型是:

生成对抗网络 (GAN) 和变分自动编码器 (VAE) :这两类用于图像生成的模型在 2010 年代中期开始引起轰动,预示着当前生成人工智能的热潮。使用 GAN,一个神经网络生成输出,另一个网络尝试确定它是真还是假——这种来回使模型在训练时变得更加智能。 VAE 生成图像各部分的编码,然后对编码的各部分进行采样并解码以创建全新的图像。

扩散模型:在生成人工智能的扩散模型中,训练数据通过添加高斯噪声而被破坏,然后通过反转该噪声的添加来恢复。您可以将添加高斯噪声视为扰乱图像中的像素。 噪声是“高斯”的,因为它是根据钟形曲线上的概率添加的。 当模型反转噪声时,它会通过解码这些概率来进行预测,即使有相同的提示,每次都会生成原始图像。

大型语言模型 (LLM):此类模型使用称为 Transformer 的神经网络架构。Transformer 本质上可以同时考虑输入序列中的所有单词,并找出它们之间的相关性,这使它们成为理解和生成文本的特别有用的技术。 虽然 Transformer 的概念自 2017 年就已出现,但应用大量训练数据并通过人工强化提高模型性能,使得我们今天在生成式 AI 自然语言工具方面取得了突破。

混合模型:混合模型将基于规则的计算与机器学习和神经网络相结合,将人类监督引入到人工智能系统的操作中。基本上,您可以采用上述任何生成式人工智能模型,并在运行后或运行期间将它们置于基于规则或逻辑的系统中。

生成式人工智能工具

您可能已经在工作、研究或个人活动中使用过一些更著名的生成式人工智能工具。 例如,OpenAI 的 ChatGPT 通常用于从撰写聚会邀请到寻找深奥和专业问题的答案等各种用途。

ChatGPT 使用大型语言模型 (LLM) 来处理用户的自然语言提示并提供简单的对话式响应。 该工具类似于聊天机器人或与真人交换消息,因此得名。 谷歌的 Gemini 是另一种生成人工智能工具,它使用法学硕士对用户提示提供独特的响应。 它的工作原理很像 ChatGPT。

法学硕士并不是消费者可以获得的唯一类型的生成人工智能。 DALL-E 是 OpenAI 的另一项生成式 AI 创新,它使用扩散模型来生成原始图像。 例如,用户可能会提示 DALL-E 以亨利·马蒂斯 (Henri Matisse) 的野兽派风格创建一个青蛙在篮球场上骑马的图像。 依靠其神经网络和庞大的数据集,该工具将创建一个原始图像,其中包含用户所需的风格元素和对图像内容的特定要求。

这些是一些更广为人知的生成式人工智能工具的例子,但还有其他各种可用的工具。 例如,Grammarly 是一款人工智能写作工具,它使用生成式人工智能来帮助人们提高写作的清晰度和正确性,无论他们已经在哪里写作。

使用 Grammarly 更智能地工作
任何有工作要做的人的人工智能写作伙伴

借助 Grammarly 的生成式 AI,您可以轻松快速地为电子邮件、文章、报告和其他项目生成有效、高质量的内容。 例如,向您的部门发送群组电子邮件,邀请他们参加公司活动或业务文档的执行摘要。

了解有关生成式 AI 工具的更多信息

生成式人工智能用例和应用

生成式人工智能的潜在用途涵盖多个行业和应用,无论是专业的还是个人的。 以下是一些需要考虑的生成式人工智能用例。

卫生保健

  • 根据诊断标准和临床医生笔记生成患者处方
  • 根据预约期间所做的笔记生成摘要
  • 急诊室或远程医疗分诊任务——生成式人工智能工具可以记录患者的症状并生成摘要,供临床医生在与患者会面之前查看
  • 在大量患者财务数据中发现保险欺诈实例

银行和金融

  • 自动检测潜在的欺诈活动
  • 生成财务预测
  • 提供专业和细致的客户支持
  • 根据有关不同产品和服务过去表现的财务数据制定营销计划

营销

  • 生成不同版本的登陆页面,用于标题和营销文案的 A/B 测试
  • 为不同地点创建相同销售页面的独特版本
  • 根据现有内容的性能数据获取新的内容创意
  • 为营销活动快速创建新图像或信息图表
  • 生成用于营销视频的独特乐谱

娱乐和表演

  • 为宣传材料创建独特的图像
  • 为虚拟现实构建新的沉浸式景观和场景
  • 电影、电视或戏剧中新剧本或创意的快速故事板
  • 通过在难以或不可能拍摄的场景中描绘角色来改善计算机生成的图像

了解有关生成式 AI 用例的更多信息

生成式人工智能的优点和好处

从上述用例可以看出,生成式人工智能在效率和自动化方面带来了非凡的优势。 简而言之,它使我们能够通过自动化工作中较繁琐的部分来更快地完成更多工作。

这种好处在医疗保健示例中可能最为明显,其中包括分类相关任务和临床医生管理。 通过将这些活动外包给生成人工智能,临床医生可以看到更多的患者,花更多的时间在每个患者身上,并提供更好的护理。

对于营销人员来说,生成式人工智能节省的时间也很可观。 创建多个版本的营销活动、根据不同的人群定制信息以及委托独特的视觉创意资产占用了营销人员的大量时间。 将此类任务转移给生成式人工智能可以为营销人员提供额外的专业和创意带宽。 简而言之,它使他们能够将更多的注意力集中在需要他们专业知识的活动上。

生成式人工智能允许人们将具有中度至重度认知负担的耗时任务外包给自动化工具。 结果是这些人有更多时间专注于高价值活动。 生成式人工智能的另一个好处是:它可以成为创造性的合作伙伴。 它可以帮助人们集思广益新的想法和策略,或者创建一篇文章或艺术作品的许多草稿,然后可以作为灵感或提供方向感。

生成式人工智能的缺点和局限性

生成式人工智能是一项令人兴奋的技术,但这并不意味着它是完美的。

您可能听说过一些律师使用 ChatGPT 进行法律研究,并在代表其客户提交的摘要中引用了虚构的案例。 除了必须支付巨额罚款之外,这一失误还可能损害了这些律师的职业生涯。 生成式人工智能并非没有缺点,了解这些缺点非常重要。

幻觉

有时,生成式人工智能会出错。 当这种情况发生时,我们称之为幻觉。

虽然最新一代的生成式人工智能工具通常会根据提示提供准确的信息,但检查其准确性至关重要,特别是当风险很高且错误会造成严重后果时。 由于生成式人工智能工具是根据历史数据进行训练的,因此它们可能也不知道最近发生的事件或无法告诉您今天的天气。

偏见

一些著名的生成人工智能工具输出的信息包含种族和/或性别偏见。 在某些情况下,工具本身也承认它们的偏见。

发生这种情况是因为工具的训练数据是由人类创建的:一般人群中现有的偏见存在于生成人工智能学习的数据中。

隐私和安全问题

从一开始,生成式人工智能工具就引发了隐私和安全问题。 一方面,发送给模型的提示可能包含敏感的个人数据或有关公司运营的机密信息。 这些工具将如何保护这些数据并确保用户对其信息拥有控制权?

与任何软件一样,生成式人工智能工具也有可能被黑客攻击。 这可能会导致内容不准确,从而损害公司的声誉或使用户受到伤害。 当您考虑到生成式人工智能工具现在被用来执行自动化任务等独立操作时,很明显,必须保护这些系统。

使用生成式人工智能工具时,请确保您了解数据的去向,并尽力与致力于安全和负责任的人工智能创新的工具合作。

使用 Grammarly 更智能地工作
任何有工作要做的人的人工智能写作伙伴

生成式人工智能的未来

对于组织来说,生成式人工智能不仅仅是软件。 他是你团队中的初级成员。 几乎每个行业都是如此,因此必须为人工智能将如何改变您的工作方式做好准备。

根据 Gartner 的说法,企业应该制定人工智能计划,考虑到:

  • 机会雄心:您或您的组织希望在部署人工智能工具后享受的具体优势。
  • 部署:决定是使用现成的工具、内部构建还是使用您自己的专有数据训练模型。
  • 风险:组织需要考虑人工智能固有的所有潜在风险,例如可靠性、安全性、数据隐私。

IBM 表示,我们还应该期待世界各国政府将人工智能管理作为优先事项。 例如,欧盟目前正在努力将人工智能分为不同的风险类别,并就其使用和部署制定某些规则。

考虑到这些活动,有必要考虑生成式人工智能的伦理影响以及追求负责任的发展意味着什么。 世界经济论坛发布了人工智能创新者在开发和部署新人工智能系统时必须考虑的一系列因素。 他们包括:

  • 人工智能系统的功效
  • 抵御安全威胁的能力
  • 减少偏见,避免边缘群体受到不公正待遇
  • 可解释性,这意味着人工智能系统的输出应该是用户可以理解的
  • 隐私保护,包括数据最小化原则

最重要的是,人工智能将继续存在。 在未来的几个月和几年里,预计机构和政府将越来越关注生成人工智能领域负责任创新的挑战。

结论:充分利用生成式人工智能

生成式人工智能在许多行业都是一股不可忽视的力量,更不用说日常的个人活动了。 随着个人和企业继续在工作流程中采用生成式人工智能,他们将找到新的方法来减轻繁重的任务,并利用这项技术进行创造性的协作。

与此同时,重要的是要意识到生成人工智能固有的技术限制和道德问题。 负责任的开发是一回事,而且很重要,但负责任的使用也很重要。 始终仔细检查生成式人工智能工具创建的内容是否是您真正想要的。 如果您没有得到预期的结果,请花时间了解如何优化提示以充分利用该工具。

通过跟上生成人工智能的最新创新,您可以改善您的工作方式并增强您的个人项目。 虽然令人兴奋,但当前一代的人工智能工具仅提供了对地平线之外的事物的一瞥。