Машинное обучение против глубокого обучения: объяснение ключевых различий

Опубликовано: 2024-11-20

Хотя машинное обучение и глубокое обучение часто используются как синонимы, они относятся к двум подобластям искусственного интеллекта. Они представляют собой разные (но связанные) подходы к анализу данных; глубокое обучение — это разновидность машинного обучения. Различия между ними важны и становятся особенно актуальными при общении на технические темы, например, при оценке инструментов и услуг анализа данных, принятии решения о том, какие подходы следует использовать для решения проблемы с данными, или при глубоких беседах с инженерами и экспертами в предметной области.

Оглавление:

Что такое машинное обучение?
Что такое глубокое обучение?
Машинное обучение против глубокого обучения
Приложения машинного обучения и глубокого обучения
Преимущества машинного обучения и глубокого обучения
Проблемы машинного обучения и глубокого обучения
Заключение

Что такое машинное обучение?

Машинное обучение (МО) — это разновидность искусственного интеллекта (ИИ). Название относится ко всем системам, в которых машина (обычно компьютер или комбинация компьютеров) применяет автоматические математические и статистические методы для обнаружения или изучения закономерностей на основе данных.

ML стремится создавать интеллектуальные и независимые системы. Это означает, что он будет изучать шаблоны и улучшать их на основе данных, стремясь иметь меньше жестко запрограммированных компонентов и сократить взаимодействие с человеком. Область машинного обучения существует с 1960-х годов, и с тех пор было разработано и изучено большое количество алгоритмов и методов.

Типы машинного обучения

Многие различные типы систем квалифицируются как ОД. Это наиболее распространенные:

Модели обучения без учителя используют неструктурированные данные практически без участия человека.
Модели контролируемого обучения требуют руководства и зависят от человеческого вклада, включая, например, информацию о формате и структуре данных.
Модели с полуконтролем получают рекомендации из небольшого объема структурированных данных, а затем используют информацию из этих данных для повышения точности на более крупном пуле неструктурированных данных.
Модели подкрепления учатся принимать решения, взаимодействуя с окружающей средой. Эти модели предпринимают действия, получают положительную или отрицательную обратную связь, а затем корректируют поведение для достижения желаемой цели.
Модели с самоконтролем создают свои собственные метки, используя необработанные неструктурированные данные.

Работайте умнее с Grammarly

Партнер по написанию ИИ для всех, у кого есть работа

Что такое глубокое обучение?

Последние достижения в области машинного обучения произошли в основном благодаря специализированному подмножеству машинного обучения, известному как глубокое обучение. Глубокое обучение относится к подмножеству систем машинного обучения, которые реализованы поверх подмножества нейронных сетей, называемых глубокими нейронными сетями. Глубокие нейронные сети — это большие нейронные сети, тесно взаимосвязанные и имеющие множество слоев нейронов, доступных для обработки.

Типы сетей глубокого обучения

Как и другие передовые методы машинного обучения, системы глубокого обучения могут обучаться контролируемым или неконтролируемым образом. Они могут быть построены с использованием одной или комбинации двух или более продвинутых архитектур нейронных сетей. Некоторые сети, такие как нейронные сети с прямой связью (FNN), перемещают данные между слоями нейронов только в одном направлении. Напротив, другие, такие как рекуррентные нейронные сети (RNN), могут образовывать внутренние циклы и, как побочный эффект, вести себя так, как будто у них есть память.

Передовые архитектуры, такие как сверточные нейронные сети (CNN), структурируют то, как и когда части данных повторяются во входных данных NN. Это подсказывает, где в данных сеть должна искать связи.

Несколько нейронных сетей могут быть разработаны в тандеме, при этом каждая подсеть специализируется на подмножестве проблемного пространства. Например, генеративно-состязательные сети (GAN) обычно обучают модели, которые пытаются конкурировать друг с другом (одна подделывает новые данные, которые должны принадлежать набору данных, а другая обучает обнаружению мошенничества), а архитектуры с двумя башнями сотрудничают, чтобы учиться. о двух глубоко взаимосвязанных, но различных частях набора данных.

Более сложные комбинации архитектур также часто используются вместе при построении систем глубокого обучения. Эти архитектуры можно расширить с помощью специализированных нейронных структур, таких как трансформаторы и выпрямители, или использовать для эмуляции, реализации и улучшения других систем машинного обучения, таких как деревья решений.

Машинное обучение и глубокое обучение: ключевые различия

Глубокое обучение — это разновидность машинного обучения, имеющая некоторые специфические ограничения и преимущества. Машинное обучение — это общий термин, охватывающий более широкий спектр вариантов и компромиссов для анализа данных и обнаружения закономерностей в них. Эта таблица подчеркивает различия. Более подробную информацию вы найдете ниже.

	Машинное обучение (МО)	Глубокое обучение (DL)
Гибкость	Общий; Подмножество ИИ, которое включает в себя различные методы обучения на основе данных и имеет множество вариантов реализации.	Реализовано исключительно с помощью нейронных сетей; специализированное подмножество машинного обучения, ориентированное на глубокие многоуровневые нейронные сети и методы, которые хорошо для них подходят.
Участие человека	Охватывает весь спектр алгоритмов: от тех, которые работают со структурированными данными и требуют значительной предварительной обработки человеком, до тех, которые могут работать полностью независимо.	Обычно применяется к чрезвычайно большим наборам данных. Модели работают в основном с неструктурированными данными и меньше зависят от обработки и курирования человеком.
Объем	Более широкая область применения, включая традиционные алгоритмы, такие как линейная регрессия, деревья решений и кластеризация.	Более узкая специализация в области машинного обучения, специализирующаяся на обработке крупномасштабных данных и сложных задачах.
Основы технологии	Использует различные алгоритмы, такие как деревья решений, машины опорных векторов и ансамблевые методы.	Использует глубокие нейронные сети с множеством слоев и методы, специально предназначенные для работы с нейронными сетями, такие как обучение с подкреплением и обратное распространение ошибки.
Области применения	Любые и все области приложений, в которых алгоритмы и компьютеры могут использоваться для автоматического обнаружения закономерностей в данных.	Специализируется на задачах, которые зависят от сложного распознавания образов в больших объемах неструктурированных данных, таких как анализ текста и изображений общего назначения, решение реальных проблем и генеративные задачи.
Интерпретируемость	Могут быть построены способами, которые людям легко понять и интерпретировать. Изучены гораздо дольше и обладают хорошо известными свойствами.	Обычно очень точны, но при этом предпринимают действия, за которыми людям гораздо труднее следовать и объяснить.
Примеры	Обнаружение спама, системы рекомендаций, сегментация клиентов.	Беспилотные автомобили, виртуальные помощники (например, Siri), системы распознавания лиц.

Глубокое обучение зависит от больших наборов данных

Методы глубокого обучения часто зависят от доступа к чрезвычайно большим наборам данных, в то время как системы машинного обучения могут быть полезны, когда данных мало или вообще нет. Кроме того, если доступен квалифицированный и специализированный человеческий вклад, ML может использовать его более явно, чем любая система глубокого обучения.

В целом системы машинного обучения охватывают более широкий спектр методов и имеют более гибкий диапазон реализации. Глубокое обучение фокусируется исключительно на методах, подходящих для работы с большими наборами данных, таких как глубокие нейронные сети и поддерживающие их алгоритмы.

ML может быть проще оптимизировать и понимать

Обладая гораздо более широким охватом, машинное обучение охватывает многие традиционные и хорошо изученные подходы к обработке данных, такие как деревья решений, кластеризация и многие разновидности регрессии. Их изучению посвящены десятилетия, и многие из этих подходов имеют хорошо известную встроенную производительность и другие компромиссы.

Они предлагают более гибкие реализации, чем системы глубокого обучения, зависящие от нейронных сетей, и могут быть более эффективными с точки зрения ресурсов и затрат. Глубокое обучение обычно требует больших ресурсов и находится на верхнем уровне шкалы затрат.

Глубокое обучение более мощное и не такое общее

Системы глубокого обучения лучше всего подходят для приложений с более узкой областью и направленностью, например, для проблем с большими объемами доступных связанных данных, достаточного времени для длительного обучения нейронной сети, а также когда точность выполнения имеет приоритет над способностью отслеживать что именно делает система и почему.

Системы МО могут применяться для решения всего спектра задач, когда машины могут автоматически находить и применять закономерности в данных, в том числе тех, где доступно меньше данных, где системы легко понять людям и где высокая точность менее важна.

Приложения машинного обучения и глубокого обучения

Системы и приложения на основе машинного обучения и глубокого обучения постоянно внедряются во все больше и больше аспектов нашей жизни. Ниже приведены некоторые известные примеры.

Обнаружение спама

Одним из первых крупномасштабных приложений машинного обучения было обнаружение и фильтрация спам-сообщений электронной почты. Эта задача идеальна для прикладного машинного обучения.

Электронных писем очень много, и они имеют четко определенную структуру. Нежелательные электронные письма легко пометить как спам, поэтому нетрудно создать большие наборы данных электронных писем, помеченных как «спам» или «спам» (ветчина – это противоположность спама). На основе этих данных можно легко построить системы классификации, а затем использовать их для быстрой фильтрации спам-сообщений в масштабах Интернета.

Обнаружение спама — один из примеров, когда системы глубокого обучения (пока) не так хорошо подходят для решения проблем, как более традиционные методы машинного обучения. Несмотря на значительные улучшения, время и затраты, необходимые для поддержания систем глубокого обучения в курсе последних достижений в области спама, пока не оправдывают их более высокую точность. Системы глубокого обучения могут использоваться для оптимизации конвейеров ML в целом, а крупномасштабные системы обучения ML по обнаружению спама могут интегрировать их с этой целью.

Автомобили для поиска пути и беспилотные автомобили

Традиционные алгоритмы машинного обучения без учителя, основанные на хорошо известных методах поиска маршрутов, таких как алгоритм Дейкстры и алгоритм A*, лучше всего подходят для поиска наилучшего пути между двумя точками на дорожной карте. Эти алгоритмы могут заранее изучать карты, трафик и другие данные, выявлять закономерности, корректироваться в режиме реального времени в зависимости от реальных условий и работать достаточно хорошо.

Однако когда дело доходит до фактической навигации автомобиля между двумя точками, объем и сложность обрабатываемой информации слишком высоки, чтобы с ней могла работать любая традиционная техника МО. Системы беспилотного вождения почти исключительно создаются с использованием методов глубокого обучения.

Преимущества машинного обучения и глубокого обучения

При правильном использовании машинное обучение и специализированные системы глубокого обучения способны к трансформации. Они могут расширять возможности экспертов-людей, делая их результаты быстрее, эффективнее, дешевле, качественнее или комбинируя все вышеперечисленное.

Повышение скорости, масштаба и стоимости с помощью машинного обучения.

Системы машинного обучения могут заменить часть или всю работу и процессы эксперта, сокращая время и внимание, необходимые для выполнения задачи. В результате их работа может применяться в гораздо более широком масштабе, чем раньше.

Например, каждая группа технических специалистов, проверяющих МРТ на наличие отклонений, может оценить шесть сканирований в час или около 200 в неделю. Если бы та же команда вместо этого сосредоточилась на обучении набора алгоритмов машинного обучения для выполнения самых рутинных частей анализа, алгоритмы могли бы оценивать тысячи МРТ-сканирований в неделю за небольшую часть затрат.

Более высокая эффективность и качество благодаря глубокому обучению

Применительно к задачам, для решения которых хорошо подходят системы глубокого обучения, они могут дополнить системы, включающие МО, и повысить их общее качество и эффективность.

Продолжая приведенный выше пример, системы глубокого обучения могут быть применены к условиям с достаточно большим объемом МРТ-сканирований. Если объем сканирований достаточен и после того, как на создание систем глубокого обучения будет выделено достаточно времени и ресурсов, они, скорее всего, справятся с задачей лучше, чем эксперты, при выявлении узкого набора отклонений, которые они были обучены выявлять.

Затем эти системы можно будет развернуть в любом масштабе для достижения максимального эффекта, обрабатывая отдельные снимки МРТ с незначительными затратами. Анализ специалистов МРТ и других экспертов может улучшить результаты работы систем глубокого обучения в необычных или исключительных случаях, достигая еще более высокого совокупного качества.

Проблемы машинного обучения и глубокого обучения

Хотя многие виды работ могут получить огромную пользу от прикладного машинного обучения или глубокого обучения, включение такого ИИ в систему может оказаться затруднительным. Вот некоторые из наиболее распространенных проблем и препятствий, которые возникают.

Компромисс между стоимостью и точностью

Более крупные и дорогие компьютерные системы могут запускать более совершенные алгоритмы машинного обучения и глубокого обучения быстрее и в большем масштабе. В результате возникает компромисс между тем, сколько денег тратится на систему, и насколько она эффективна с точки зрения аппаратного обеспечения и найма более талантливых экспертов для ее сборки. Эффективное использование ограниченных ресурсов в системах машинного обучения и глубокого обучения требует значительной осторожности.

Зависимость от больших наборов данных

Машинное обучение в целом и глубокое обучение в частности зависят от наличия доступа к постоянно обновляемым большим наборам данных на этапе обучения. Алгоритмы хороши настолько, насколько качество и объем данных, на которых они обучаются. Эффективно управлять большими наборами данных сложно, и для наиболее эффективного применения машинного обучения к заданному набору данных требуются время и изобретательность.

Компромисс между точностью и ясностью

Системы глубокого обучения можно научить быть чрезвычайно точными, гораздо более точными, чем другие системы машинного обучения, созданные с аналогичными параметрами. За точность приходится платить; системы манипулируют данными в больших масштабах и используют передовые алгоритмы, которые людям невозможно понять в практические сроки.

Более традиционные алгоритмы МО изучаются гораздо дольше, имеют более четко определенные характеристики и их можно заставить работать так, чтобы людям было легко их понять. Любая реализация машинного обучения и глубокого обучения должна найти идеальный компромисс между точностью и ясностью.

Компромисс между технической предвзятостью и дисперсией

По мере того, как системы МО усложняют алгоритмы, ресурсы, выделяемые на обучение, и объем данных, используемых для обучения, они могут узнавать все больше и больше о свойствах своих обучающих данных. Это явление называется (технической) предвзятостью; чрезвычайно предвзятые системы будут очень точны, когда увидят данные, аналогичные тем, на которых они обучались.

Высокая погрешность часто возникает за счет слишком низкой дисперсии — система не будет особо реагировать на новые данные, которые сильно отличаются от тех, что она видела при обучении. Идеальные системы, которые обладают как низкой предвзятостью, так и низкой дисперсией, построить сложно. Найти правильный баланс между предвзятостью и дисперсией для конкретного приложения легче с помощью более изученных и более устоявшихся традиционных алгоритмов машинного обучения. Этого может быть трудно достичь с помощью более сложных алгоритмов глубокого обучения.

Заключение

Системы глубокого обучения — это специализированное подмножество машинного обучения, которое использует глубокие многоуровневые нейронные сети для решения сложных проблем с большими наборами данных. Хотя они предлагают превосходную точность и возможности обработки, они имеют свои недостатки, такие как ограниченная интерпретируемость, зависимость от обширных данных и ограниченная гибкость оптимизации.

Напротив, традиционные методы МО зачастую более экономичны, их легче развернуть и обеспечить более прозрачные и предсказуемые результаты. Их также проще настроить под конкретные задачи. Оба подхода имеют определенные сильные и слабые стороны, и понимание их применения и ограничений имеет решающее значение для эффективной реализации в реальных сценариях.