AIとは何ですか?人工知能の包括的なガイド
公開: 2024-05-07最近の誇大宣伝にもかかわらず、人工知能 (AI) は新しいものではありません。実際、それは World Wide Web よりも数十年前から存在しています。生成型 AI の突然の急速な出現が大きな注目を集めています (そしておそらくあなたがこの記事を読んでいる理由もそこにあります) が、あなたは何年にもわたって直接的または間接的に AI に遭遇しているはずです。
このハイレベルな AI の概要では、AI が機能するさまざまな方法、できることとできないこと、そしてビジネスと社会の現在と将来に対する AI の影響を明らかにします。また、これが Grammarly とどのように関連しているかについても説明します。これは、私たちが 10 年以上にわたって人々の執筆を支援してきた方法の一部でした。
目次
- AIが解説
- AI の仕組み
- AIの歴史
- AIの応用
- AIのメリット
- AIの限界
- 結論
人工知能の説明
人工知能は、人間の心が学習し機能する方法をシミュレートするテクノロジーです。
AI は、アルゴリズムや論理的推論を使用して問題を解決できるという点で、標準的なコンピューター プログラムとは異なります。また、今日のほとんどのアプリケーションでは、人間の介入なしで学習して適応できます。 AI 分野の主な側面には、機械学習 (ML)、自然言語処理 (NLP)、ニューラル ネットワークが含まれます。
人工知能の仕組み
モデルは AI の特定のインスタンスです。たとえば、ChatGPT 3.5 と ChatGPT 4 は 2 つの AI モデルです。 AI の主要な構成要素を理解するために、モデルを作成するためのさまざまな概念的なアプローチに焦点を当てます。
ルールベースの AI、またはエキスパート システム
より単純なフレームワークは、ルールベースまたはエキスパート システムと呼ばれるものです。ユーザーは、アルゴリズムが理解できるロジックの形式で特定の命令を書き出します。典型的なカスタマー サポートの電話ツリーは次のように機能します。特定のパラメータに一致する入力に対して特定の応答を返すように指示されます。 Google の基本的な PageRank アルゴリズムももう 1 つの例ですが、より高度です。
機械学習
現在のほとんどの AI は、機械学習と呼ばれるアプローチを使用しています。モデルは、ハードコーディングされた一連の命令を与えられるのではなく、パターン、関係、その他のダイナミクスなど、大規模 (または膨大な) コンテンツの組み合わせから独自のルールを学習します。このプロセスは、多くの場合、モデルのトレーニングと呼ばれます。ルールと ML を組み合わせることも可能で、それぞれの相対的な利点については後ほど説明します。
ML には、教師あり学習、教師なし学習、半教師あり学習、自己教師あり学習の 4 つの主要なカテゴリがあります。
1教師あり学習では、注釈付きデータまたは構造化データを使用して、学習する必要があるものをマシンに伝えます。このアプローチはラベル付きデータセットに依存しており、目的の出力がすでにわかっているため、モデルは入力と出力の関係を学習できます。
2教師なし学習には明示的な指示がないため、マシンは自分自身で見ているものを理解し、予測を行います。このタイプの学習は、入力データ内の隠れたパターンや固有の構造を見つけるために使用されます。
3半教師あり学習は、大量のラベルなしデータで補完された少量のラベル付きデータでモデルがトレーニングされるハイブリッド アプローチです。この方法では、教師あり学習と教師なし学習の両方の利点が活用され、ラベル付きデータが不足している場合の学習の効率と精度が向上します。
4自己教師あり学習は、モデルが入力データから独自のラベルを生成するアプローチです。これは、ラベル付きデータが制限されているか、使用できないシナリオで特に役立ちます。このモデルは入力データの一部を使用して他の部分を予測し、独自の教師あり信号を効果的に作成します。
学習は最初のトレーニングで終わる必要はありません。強化学習を使用すると、モデルは出力の品質に関するフィードバックに基づいて継続的に改善されます。この評価は人間が行うこともできますが、自動強化学習のための技術やアルゴリズムも数多くあります。
モデルのトレーニングが完了すると、すぐに使用できるようになります。入力はモデルを介して実行され、質問への回答、画像の分類、グラフィックの描画などの出力を与えます。一部の AI (特にルールベースのモデル) は決定論的です。これは、特定の入力が常に特定の出力につながることを意味します。ただし、最新のモデルのほとんどは確率的であり、ある程度のランダム性を導入しています。これが、まったく同じ質問を ChatGPT に 2 回入力した場合に同じ答えが得られる可能性が低い理由を説明しています。
ニューラルネットワークとディープラーニング
では、AI は実際にどのように機能するのでしょうか?ここで、物事は急速に非常に技術的なものになります。今日の派手な AI イノベーションの背後にあるアプローチであるニューラル ネットワークに焦点を当てます。
これらの脳のニューロンの簡略化された表現は、ランダムな推測を行うことから始まり、その推測を正しい答えと比較し、小さな調整を繰り返して精度を継続的に向上させます。
ニューラル ネットワークは複数の層で構成されています。 「下部」が入力、上部が出力、そしてその間にいわゆる隠れ層があります。下から上に向かって、機能はますます抽象的になります。たとえば、画像認識システムでは、下位層が色やエッジを認識し、上位層が特定のオブジェクトを認識します。
ニューラル ネットワークに複数の隠れ層がある場合、それは深層学習と呼ばれます。今日のディープ ニューラル ネットワークには通常、多数の層があり、多くの場合、特定の機能を備えたサブ層が存在します。処理能力の向上により、イノベーションが爆発的に起こりました。
自然言語処理
コンピューターが人間の書き方や話し方を理解しようとするとき、それが自然言語処理です。基本的なスペルチェックは単に辞書に一致しない単語を強調表示するだけですが、Grammarly は NLP を使用して文章を理解し、コンテキストに合った提案を行います。
過去 10 年ほどで、NLP は革命を経験しました。これは、機械翻訳、テキスト生成、自動文字起こしの仕事できっと経験したことがあるでしょう。注意力を高める (単に単語ごとに処理するのではなく、モデルが特定の時点でどれだけ「記憶」できるか) や事前トレーニングされたモデル (人間の言語がどのように機能するかを再学習する必要がないようにするため) などのテクニックスクラッチ) により、機械はさまざまな状況において人間のように理解し、人間のように聞こえることが可能になりました。
生成AI
生成 AI は、トレーニング データに基づいて、テキスト、画像、音楽、さらにはコードなどの新しいコンテンツを生成できる人工知能のサブセットです。
特定のタスクやデータ分析に合わせて調整された従来の AI システムとは異なり、生成 AI モデルは、多くの場合人間が作成した作業を模倣するオリジナルの出力を生成できます。これらのモデルはディープ ニューラル ネットワークに基づいており、広範なデータ セットからパターン、スタイル、ロジックを直感的に導き出します。次に、この知識を活用して、以前は存在しなかった新しい独自のコンテンツを作成します。
生成 AI の使用は、エンターテインメント、芸術、文学、ソフトウェア開発など、さまざまな分野に及びます。これは、AI の多用途性とその機能の成長を示しています。
確認するには: AI はルールまたは ML に基づくことができます。機械学習は教師ありまたは教師なしで行うことができ、強化学習により時間の経過とともに改善されます。今日の AI モデルの多くは、多くの層を介して深層学習を使用するニューラル ネットワークです。自然言語処理はディープ ニューラル ネットワークの輝かしい成功例であり、テキスト、画像、コードなどを作成するモデルは生成 AI と呼ばれます。
AIの歴史
ここではAIの歴史を簡単に紹介します。簡潔にするため、また開発スケジュールのみに焦点を当てるため、これらのイノベーションの背後にある個人については言及しません。
1950 年代~1980 年代: GOFAI 春、そして冬
人工知能という用語は 1956 年に作られました。同年、最初に実行された AI ソフトウェア プログラムがさまざまな数学的定理の証明に成功しました。その中の 1 つは、元の著者が提供した証明よりも「より洗練された」ものでした。
最初のニューラル ネットワークは 1967 年に構築されましたが、この頃の AI 研究のほとんどは、合理的な心をシミュレートするために記号表現と論理を使用して行われていました。 (古き良き時代の AI を意味する、冗談のような頭字語 GOFAI に遭遇するかもしれません。)しかし、達成されなかった期待と限られた計算能力の組み合わせにより、いわゆるAI の冬が到来し、資金調達と研究が停滞しました。 1970 年代以降。
80 年代には、エキスパート システム (以前に学習したルールベースの AI モデル) が普及し、多くの企業に実用的な影響を与えました。並行して、研究者らはニューラル ネットワークに戻り、ニューラル ネットワークを自ら訓練させる技術を開発しました。
1990 年代~2000 年代: 広く普及しているが過小評価されている
1990 年代には、処理能力の向上とデータセットの増大により、機械学習が応用規模で実用化され、AI は多くのマイルストーンを達成しました。映画以外では、人工知能の最初の広く知られた成功は、おそらく 1997 年にディープ ブルーがチェスでガルリ カスパロフを破ったときでしょう。その後すぐに、最初の消費者向け音声認識プログラムである Dragon が Windows で利用できるようになりました。
このような進歩にもかかわらず、今世紀に入ってから 10 年ほどの間、多くの研究者や企業は、自社の AI 製品やプロジェクトを別の言葉で覆い隠していました。なぜなら、それらには依然として過剰誇大宣伝の意味合いが含まれていたからです。皮肉なことに、スパム フィルターからルンバに至るあらゆるものに動力を供給するまさにこれらのシステムが、実際に応用 AI の実用的な価値を日常生活にもたらしたということです。
2010 年代から現在: AI が主流になる
2010 年代に AI の上昇傾向が始まり、それは今日まで続いています。単一の画期的な進歩ではなく、いくつかの要因が集まりました。
- GPU:グラフィックス プロセッシング ユニットという名前にもかかわらず、これらのチップはディープ ニューラル ネットワークのトレーニングに非常に効率的であることが判明しています。 GPU の使用への移行により、新しいモデルを立ち上げる速度と実用範囲の両方が加速されました。
- 研究の進歩:ニューラル ネットワークの新しい形式と応用により、テキストや画像を理解してレンダリングするコンピューターの能力が大幅に向上しました。
- ビッグ データ:この時点までに、インターネットは何十億ものユーザーがモデルの学習用に計り知れない量のコンテンツを生成できるほど長く存在していました。
- クラウド コンピューティング: Amazon、Google、Microsoft などのオンデマンド プラットフォームにより、AI モデルの開発に必要なコンピューティング能力の入手がはるかに簡単になりました。
この間に新たに生み出された、あるいは根本的に見直されたイノベーションには、Google 翻訳、Siri などの仮想アシスタント、Netflix や Spotify などのサービスのレコメンデーション エンジンが含まれ、言うまでもなく、ヘルスケア、製造、さらには防衛などの分野への重要ではあるが目に見えにくい多くの影響もあります。 。
では、生成 AI が登場すると、なぜ AI に対する熱狂がさらに大きくなったのでしょうか?大きな違いは、ChatGPT や DALL-E のようなモデルは、特定のドメインに制限されるのではなく、ほぼすべての入力を解釈して応答できることです。これは、インターネットに接続できれば誰でも特別なトレーニングなしで AI モデルを直接操作でき、新しいモデルをゼロから構築するよりもずっと早く AI を特定の用途に活用できることを意味します。
未来: AGI と ASI
そのあらゆる機能にもかかわらず、今日私たちが目にするものは、狭いAI または弱い AI として知られています。これは、人間の知能の全範囲ではなく、一部をカバーするテクノロジーを意味します。私たちの脳の能力と同等の機械は、強力な AI または人工汎用知能 (AGI) と呼ばれます。 AI が人間の知能を超えると、それは人工超知能 (ASI) として知られます。
AGIからどれくらい離れていますか?それは誰の推測でもあります。この分野に深く関わっている人々でさえ、何度もイノベーションのペースを大きく誤って見積もっています。
AIの応用例と事例
これらは、今日の現実世界のアプリケーションで AI が現れるさまざまな方法のうちのほんの一部にすぎません。
人間が物事をより良く行えるよう支援する。 Grammarly はここでの優れた例であると考えています。アイデア、言おうとしている内容の感覚、そして聴衆の知識を持っています。メッセージをより明確にし、好意的に受け取られる可能性を高める方法を提案します。 Grammarly が生成 AI を使用してコミュニケーションを改善する方法について詳しく学びましょう。
障害のある方の支援を行っています。音声合成やテキスト読み上げなどのテクノロジーは、聴覚や視覚などの感覚障害を持つ人々にとって大きな変革をもたらします。これにより、以前はアクセスできなかったライブや録画されたコンテンツを取り入れることができるため、目や耳になってくれる人に頼ることなく、世界の豊かさにもっと触れることができるようになります。
自律システム。 AI は知覚と予測を融合して、自動運転車から雨が降りそうなときに作動しないスプリンクラー システムに至るまで、非常に多くのことをより効率的かつ安全に行うことができます。 Google が設立した自動運転車会社 Waymo は、人間が同じ距離を運転した場合に比べて、負傷事故が約 85% 減少したと報告しています。
推奨事項。 AI モデルはユーザーの行動と人口統計を分析し、次のテレビ番組や試してみたい炭酸水の種類などについて高度な知識に基づいた推測を行います。
オーディオビジュアル処理。例としては、仮想アシスタントからの音声認識、ナンバープレートの写真処理に基づく自動料金徴収、録画やストリームからの視覚的および音声的ノイズの除去などが挙げられます。
エッジAI。これにより、AI のパワーがデータセンターではなく現実世界のデバイスに直接導入されます。これらは、高速かつ低エネルギーの処理を実現するために、特定のタスクにレーザーを集中させる傾向があります。例には、iPhone の Face ID やスマート サーモスタットが含まれます。
AIのメリットと利点
大規模な処理。現実の人間が、すべてのクレジット カード取引に不正がないかどうかを評価したり、IRS に郵送されたすべての納税フォームのすべての番号を入力したりしなければならない場合を想像してみてください。 AI は人間よりもはるかに速く、より優れた判断や分類を行うことができます。
パターンの検出と予測。 AI はがんを検出する能力において人間を上回り始めています。あるケースでは、プロを13%上回りました。また、データベースの障害の検出など、認識されたパターンから逸脱したことを感知することにも優れています。このパターン発見能力により、AI は天気予報から株式市場の動きに至るまで、予測に特に役立ちます。
斬新な洞察。最初のモデルから、AI は人間がやったことのないあらゆる種類の問題に対する答えとアプローチを見つけ出しました。現代の例は、靴のデザインから新しい物理法則まで多岐にわたります。
加速する薬。新型コロナウイルス感染症 (COVID-19) のワクチンからアルツハイマー病の検出に至るまで、AI は研究者が診断や治療法をより迅速に開発するのに役立っています。
警戒。 AIは決して疲れません。適切に設計され、十分な電力と処理能力が与えられている限り、大量のデータを継続的に監視できます。これは自動運転車の衝突率の低下に大きく貢献しています。
AIの欠点と限界
幻覚。生成 AI は何かを作り出すことができます。これらのモデルの言うことの多くはもっともらしいため、多くの人はそれを再確認しようとは考えません。この問題の最近の例の 1 つは、元弁護士のマイケル・コーエン氏が、当時 Bard (現在は Gemini) として知られていた Google の生成 AI によって完全に捏造された訴訟の引用文を自身の弁護士に送ったときに起こりました。
ディープフェイク。幻覚は偶然ですが、ディープフェイクは意図的に行われます。悪意のある行為者 (より悪意のないいたずら者) は、生成 AI を使用して、多くの人が違いを見分けることができないほど現実に近い画像、ビデオ、音声、またはテキストを作成する可能性があります。
人間の仕事との競争。執筆や顧客サービスなどの役割に就いている多くの人々は、生成 AI を本当の脅威と見ています。フォーチュン誌は、AIによって数千の雇用が失われたと報告しているが、AIは「明らかに過小評価されている」と明言している。
なぜ特定の結論に至ったのかわかりません。ニューラル ネットワークでは、特定の出力がなぜ、どのように与えられるのかを正確に知ることはできません。たとえば、トレーニング コーパスの特定の部分まで直接追跡することはできません。ヘルスケアや金融などの高度に規制された業界では、一部の AI は部分的または全体的に人間が評価できるルールベースのアルゴリズムで構築されています。
エネルギー消費。直接測定することは困難ですが、ある研究によると、DALL-E などを使用して 1 つの画像を生成すると、スマートフォンの充電サイクルとほぼ同じ量のエネルギーが消費され、時間の経過とともに大幅に増加する可能性があると推定されています。
結論
AI は古くもあり、ごく最近のものでもあります。この分野は 70 年近く前から存在していますが、私たちの多くがその力と可能性を痛感するようになったのはここ 10 年、特にここ数年のことです。ニューラル ネットワーク、ディープ ラーニング、自然言語処理、生成 AI などのイノベーションのおかげで、少し前までは SF のように聞こえたツールも今では簡単に利用できるようになり、世界に大きな変化をもたらしています。今すぐ何かを実践的に試してみませんか? Grammarly にサインアップして、AI がどのように機能するかを確認してください。