什么是人工智能?人工智能综合指南

已发表: 2024-05-07

尽管最近有很多炒作,但人工智能 (AI) 并不是什么新鲜事。事实上,它比万维网早了几十年。虽然生成式人工智能的突然而迅速的出现引起了所有人的关注(这可能就是您阅读本文的原因),但您肯定已经直接或间接接触过人工智能很多年了。

对人工智能的高度概述将揭示它的各种工作方式、它能做什么和不能做什么,以及它对商业和社会的现在和未来的影响。我们还将指出这与 Grammarly 的关系——十多年来,它一直是我们帮助人们写作的一部分。

目录

  • 人工智能解释
  • 人工智能如何运作
  • 人工智能的历史
  • 人工智能的应用
  • 人工智能的好处
  • 人工智能的局限性
  • 结论

人工智能解释

人工智能是一种模拟人类思维学习和工作方式的技术。

人工智能与标准计算机程序的不同之处在于它可以使用算法或逻辑推理来解决问题。此外,在当今的大多数应用中,它可以在无需人工干预的情况下学习和适应。人工智能领域的主要方面包括机器学习(ML)、自然语言处理(NLP)和神经网络。

人工智能如何运作

模型是人工智能的一个具体实例。例如,ChatGPT 3.5 和 ChatGPT 4 就是两个 AI 模型。为了了解人工智能的主要构建模块,我们将重点关注创建模型的不同概念方法。

基于规则的人工智能或专家系统

更直接的框架是所谓的基于规则或专家系统:人们以算法可以理解的逻辑形式写出特定指令。典型的客户支持电话树是这样工作的:它被告知对匹配某些参数的输入给出特定的响应。 Google 的基本 PageRank 算法是另一个例子,但要复杂得多。

机器学习

如今大多数人工智能都使用一种称为机器学习的方法。该模型不是接受一组硬编码指令,而是从大量(或大量)内容(模式、关系和其他动态)中学习自身规则。这个过程通常称为训练模型。也可以将规则和机器学习结合起来,稍后我们将讨论两者的相对优势。

机器学习有四个主要类别:监督学习、无监督学习、半监督学习和自监督学习。

1监督学习使用带注释或结构化数据来告诉机器需要学习什么。这种方法依赖于标记的数据集,其中所需的输出是已知的,允许模型学习输入和输出之间的关系。

2无监督学习没有明确的指令,因此机器只能自行理解所看到的内容,然后做出预测。这种类型的学习用于查找输入数据中的隐藏模式或内在结构。

3半监督学习是一种混合方法,其中模型根据少量标记数据进行训练,并辅以大量未标记数据。该方法利用了监督学习和无监督学习的优点,在标记数据稀缺时提高了学习效率和准确性。

4自监督学习是一种模型根据输入数据生成自己的标签的方法。它在标记数据有限或不可用的场景中特别有用。该模型使用部分输入数据来预测其他部分,从而有效地创建自己的监督信号。

学习不必随着初始训练而停止。通过强化学习,模型可以根据输出质量的反馈不断改进。这种评估可以由人类来完成,但也有许多用于自动化强化学习的技术和算法。

模型经过训练后就可以使用了。输入通过模型运行并给出输出,无论是问题的答案、图像分类、绘制图形等等。一些人工智能(尤其是基于规则的模型)是确定性的,这意味着给定的输入总是会导致特定的输出。然而,大多数现代模型都是概率性的,引入了一定程度的随机性,这解释了为什么如果您将完全相同的问题输入 ChatGPT 两次,您不太可能得到相同的答案。

了解有关机器学习的更多信息

神经网络和深度学习

好的,但是人工智能实际上是如何工作的呢?这就是事情很快变得非常技术性的地方。我们将重点关注当今许多引人注目的人工智能创新背后的方法,即神经网络。

这些大脑神经元的简化表示首先进行随机猜测,将这些猜测与正确答案进行比较,并一遍又一遍地进行小调整,以不断提高其准确性。

神经网络由层组成。 “底部”是输入,顶部是输出,中间是所谓的隐藏层。从下到上,能力变得越来越抽象。例如,在图像识别系统中,较低层可能识别颜色或边缘,而较高层则感知特定对象。

当神经网络具有多个隐藏层时,称为深度学习。今天的深度神经网络通常有很多层,并且通常有具有特定功能的子层。处理能力的提高引发了创新的爆炸式增长。

了解有关深度学习的更多信息

自然语言处理

当计算机试图理解人类书写和说话的方式时,这就是自然语言处理。基本的拼写检查只是突出显示与词典不匹配的单词,而 Grammarly 使用 NLP 来理解您的写作并提出适合上下文的建议。

在过去十年左右的时间里,NLP 经历了一场革命,您在机器翻译、文本生成和自动转录等工作中肯定经历过这场革命。诸如增加注意力(模型在给定时间可以“记住”多少,而不是仅仅逐字处理)和预训练模型(这样他们就不必重新学习人类语言是如何工作的)等技术scrap)使机器能够在许多情况下像人类一样理解并发出声音。

了解有关自然语言处理的更多信息

生成式人工智能

生成式人工智能是人工智能的一个子集,它可以根据训练数据生成新内容,例如文本、图像、音乐甚至代码。

与针对特定任务或数据分析而定制的传统人工智能系统不同,生成式人工智能模型能够生成通常模仿人类创造的工作的原始输出。这些模型基于深度神经网络,从广泛的数据集中直觉模式、风格或逻辑。然后,他们利用这些知识来创建以前不存在的新的、独特的内容。

生成式人工智能的使用跨越各个领域,包括娱乐、艺术、文学和软件开发。这证明了人工智能的多功能性及其不断增长的能力。

回顾一下:人工智能可以基于规则或机器学习。机器学习可以是有监督的,也可以是无监督的,并且随着时间的推移,强化学习会变得更好。当今的许多人工智能模型都是使用多层深度学习的神经网络。自然语言处理是深度神经网络的辉煌成功故事,创建文本、图像、代码等的模型被称为生成人工智能。

了解有关生成式 AI 的更多信息

人工智能的历史

在这里,我们将简要概述人工智能的历史。为了简洁起见并仅关注开发时间表,我们不会提及这些创新背后的个人。

1950 年代至 80 年代:GOFAI 春天,然后是冬天

人工智能一词于 1956 年被创造。同年,第一个运行的人工智能软件程序成功证明了各种数学定理,其中一个比原作者提供的证明“更优雅”。

第一个神经网络建于 1967 年,但当时的大多数人工智能研究都是使用符号表示和逻辑来模拟理性思维。 (你可能会遇到半开玩笑的缩写词 GOFAI,意思是好的老式人工智能。)然而,未实现的期望和有限的计算能力的结合导致了所谓的人工智能冬天,资金和研究在20 世纪 70 年代及以后。

在 80 年代,专家系统(我们之前了解的基于规则的人工智能模型)开始流行,并对许多公司产生了实际影响。与此同时,研究人员回归神经网络并开发了让它们自我训练的技术。

1990 年代至 2000 年代:普遍存在但未被充分重视

凭借更强的处理能力和更大的数据集,20 世纪 90 年代,机器学习在应用规模上变得实用,人工智能实现了许多里程碑。在电影之外,人工智能第一次广为人知的成功可能是 1997 年深蓝在国际象棋比赛中击败加里·卡斯帕罗夫。不久之后,第一个消费者语音识别程序 Dragon 就出现在 Windows 上。

尽管取得了这些进展,但就在本世纪第一个十年,许多研究人员和公司仍在用其他术语来掩盖他们的人工智能产品和项目,因为它们仍然带有过度炒作的含义。讽刺的是,正是这些系统为从垃圾邮件过滤器到 Roombas 等各种设备提供动力,实际上将应用人工智能的实用价值带入了日常生活。

2010 年代至今:人工智能成为主流

2010 年代,人工智能开始兴起并持续至今。一系列因素汇聚在一起,而不是单一的突破:

  • GPU:尽管它们的名称是图形处理单元,但这些芯片对于训练深度神经网络非常有效。转向使用 GPU 加快了新模型的速度和实用范围。
  • 研究进展:神经网络的新形式和应用导致计算机理解和渲染文本和图像的能力取得了巨大飞跃。
  • 大数据:到目前为止,互联网已经存在了足够长的时间,其数十亿用户可以生成海量的内容供模型学习。
  • 云计算:亚马逊、谷歌、微软等公司的按需平台使得获取开发人工智能模型所需的计算能力变得更加简单。

在此期间新创建或彻底改革的创新包括谷歌翻译、Siri 等虚拟助手以及 Netflix 和 Spotify 等服务上的推荐引擎,更不用说对医疗保健、制造甚至国防等行业产生的许多重要但不太明显的影响。

那么,为什么生成式人工智能出现后,人们对人工智能的狂热会猛增几个档次呢?最大的区别在于 ChatGPT 和 DALL-E 等模型可以解释和响应几乎任何输入,而不是仅限于某个域。这意味着任何具有互联网连接的人都可以直接与人工智能模型交互,无需任何特殊培训,并且人工智能可以比从头开始构建新模型更快地投入特定用途。

未来:AGI 和 ASI

就其所有功能而言,我们今天看到的人工智能被称为狭义人工智能或弱人工智能。这意味着技术涵盖了人类智能的一部分,但不是全部。与我们大脑能力相当的机器将被称为强人工智能,或通用人工智能(AGI)。一旦人工智能超越人类智能,这就是所谓的超级人工智能(ASI)。

我们离AGI还有多远?这是任何人的猜测。即使是那些深入参与该领域的人也一次又一次地严重低估了创新的步伐。

人工智能的应用和例子

这些只是人工智能在当今现实世界应用中的众多表现形式中的一小部分。

帮助人类把事情做得更好。我们认为 Grammarly 是一个很好的例子:你有想法,有你想说的话的感觉,并且了解观众。我们建议一些方法,让您的信息更清晰,并提高其受欢迎的机会。详细了解 Grammarly 如何使用生成式 AI 来改善沟通。

使用 Grammarly 更智能地工作
任何有工作要做的人的人工智能写作伙伴

帮助残疾人。对于有感官障碍(例如听力或视力)的人来说,语音转文本和文本转语音等技术改变了游戏规则。它们使他们能够接收以前无法访问的现场和录制内容,因此他们可以更多地接触世界的丰富性,而无需依赖某人充当他们的眼睛或耳朵。

自治系统。人工智能可以将感知与预测相结合,从而更高效、更安全地完成许多事情,从自动驾驶汽车到下雨时不运行的喷水灭火系统。由谷歌创办的自动驾驶汽车公司 Waymo 报告称,与人类行驶相同距离相比,受伤事故减少了约 85%。

建议。人工智能模型会分析用户行为和人口统计数据,从而对下一个电视节目或您可能想尝试的苏打水类型等事物做出有根据的猜测。

视听处理。示例包括虚拟助理的语音识别、基于处理车牌图片的自动收费,以及过滤录音或流中的视觉和音频噪声。

边缘人工智能。这将人工智能的力量直接运用到现实世界的设备中,而不是数据中心。这些往往专注于快速、低能耗处理的特定任务。示例包括 iPhone 上的 Face ID 和智能恒温器。

人工智能的优势和好处

大规模加工。想象一下,如果一个真人必须评估每笔信用卡交易是否存在欺诈行为,或者输入邮寄给国税局的每张税表中的每一个数字。人工智能的判断或分类速度比人类更快,而且往往更好。

模式检测和预测。人工智能在检测癌症的能力上开始超越人类;在一种情况下,它比专业人士高出 13%。它也非常擅长感知事物何时偏离了公认的模式,例如检测数据库中的错误。这种模式发现能力使得人工智能对于预测(从天气预报到股市走势)特别有用。

新颖的见解。从第一个模型开始,人工智能就为人类从未做过的各种问题提供了答案和方法。现代的例子涵盖从鞋子设计到新的物理定律。

加速医学。从 COVID-19 疫苗到阿尔茨海默氏症检测,人工智能正在帮助研究人员更快地开发诊断和治疗方法。

警觉。人工智能永远不会疲倦。只要设计得当,并提供足够的电力和处理能力,它就可以持续监控大量数据。这是自动驾驶汽车碰撞率较低的一个主要原因。

人工智能的缺点和局限性

幻觉。生成式人工智能可以编造一些东西。因为这些模型所说的大部分内容都是合理的,所以许多人不会考虑仔细检查它。这个问题最近的一个例子是,前律师迈克尔·科恩(Michael Cohen)向他自己的律师发送了一些法律案件的引文,这些案件完全是由谷歌的生成式人工智能(当时称为巴德(现在称为双子座))捏造的。

深度赝品。虽然幻觉是偶然的,但深度伪造是故意的。恶意行为者(或者更无辜的是恶作剧者)可以使用生成式人工智能来制作图像、视频、音频或文本,这些图像、视频、音频或文本看起来非常接近现实,以至于许多人无法区分。

与人类工作的竞争。许多从事写作和客户服务等职位的人将生成式人工智能视为真正的威胁。 《财富》杂志报道称,人工智能导致数千个工作岗位流失,并明确表示“肯定低估了这一数字”。

很难知道为什么会得出特定的结论。对于神经网络,您无法确切地知道它们为什么或如何给出特定的输出,例如,它无法直接追溯到训练语料库的特定部分。在医疗保健或金融等受到严格监管的行业中,一些人工智能是部分或完全采用人类可以评估的基于规则的算法构建的。

能源消耗。直接测量很困难,但一项研究估计,生成单个图像(例如使用 DALL-E)所消耗的能量与智能手机充电周期接近相同的能量,并且随着时间的推移,能量会显着增加。

结论

人工智能既古老又最近。尽管这个领域已经存在了近70年,但只是在过去的十年,尤其是过去的几年里,我们很多人才敏锐地意识到它的力量和潜力。得益于神经网络、深度学习、自然语言处理和生成人工智能等创新,不久前听起来像科幻小说的工具现在已经唾手可得,并为世界带来了巨大的改变。想立即尝试一些实际操作吗?注册 Grammarly,了解 AI 如何为您服务。