Машинное обучение против глубокого обучения: объяснение ключевых различий
Опубликовано: 2024-11-20Хотя машинное обучение и глубокое обучение часто используются как синонимы, они относятся к двум подобластям искусственного интеллекта. Они представляют собой разные (но связанные) подходы к анализу данных; глубокое обучение — это разновидность машинного обучения. Различия между ними важны и становятся особенно актуальными при общении на технические темы, например, при оценке инструментов и услуг анализа данных, принятии решения о том, какие подходы следует использовать для решения проблемы с данными, или при глубоких беседах с инженерами и экспертами в предметной области.
Оглавление:
- Что такое машинное обучение?
- Что такое глубокое обучение?
- Машинное обучение против глубокого обучения
- Приложения машинного обучения и глубокого обучения
- Преимущества машинного обучения и глубокого обучения
- Проблемы машинного обучения и глубокого обучения
- Заключение
Что такое машинное обучение?
Машинное обучение (МО) — это разновидность искусственного интеллекта (ИИ). Название относится ко всем системам, в которых машина (обычно компьютер или комбинация компьютеров) применяет автоматические математические и статистические методы для обнаружения или изучения закономерностей на основе данных.
ML стремится создавать интеллектуальные и независимые системы. Это означает, что он будет изучать шаблоны и улучшать их на основе данных, стремясь иметь меньше жестко запрограммированных компонентов и сократить взаимодействие с человеком. Область машинного обучения существует с 1960-х годов, и с тех пор было разработано и изучено большое количество алгоритмов и методов.
Типы машинного обучения
Многие различные типы систем квалифицируются как ОД. Это наиболее распространенные:
- Модели обучения без учителя используют неструктурированные данные практически без участия человека.
- Модели контролируемого обучения требуют руководства и зависят от человеческого вклада, включая, например, информацию о формате и структуре данных.
- Модели с полуконтролем получают рекомендации из небольшого объема структурированных данных, а затем используют информацию из этих данных для повышения точности на более крупном пуле неструктурированных данных.
- Модели подкрепления учатся принимать решения, взаимодействуя с окружающей средой. Эти модели предпринимают действия, получают положительную или отрицательную обратную связь, а затем корректируют поведение для достижения желаемой цели.
- Модели с самоконтролем создают свои собственные метки, используя необработанные неструктурированные данные.
Что такое глубокое обучение?
Последние достижения в области машинного обучения произошли в основном благодаря специализированному подмножеству машинного обучения, известному как глубокое обучение. Глубокое обучение относится к подмножеству систем машинного обучения, которые реализованы поверх подмножества нейронных сетей, называемых глубокими нейронными сетями. Глубокие нейронные сети — это большие нейронные сети, тесно взаимосвязанные и имеющие множество слоев нейронов, доступных для обработки.
Типы сетей глубокого обучения
Как и другие передовые методы машинного обучения, системы глубокого обучения могут обучаться контролируемым или неконтролируемым образом. Они могут быть построены с использованием одной или комбинации двух или более продвинутых архитектур нейронных сетей. Некоторые сети, такие как нейронные сети с прямой связью (FNN), перемещают данные между слоями нейронов только в одном направлении. Напротив, другие, такие как рекуррентные нейронные сети (RNN), могут образовывать внутренние циклы и, как побочный эффект, вести себя так, как будто у них есть память.
Передовые архитектуры, такие как сверточные нейронные сети (CNN), структурируют то, как и когда части данных повторяются во входных данных NN. Это подсказывает, где в данных сеть должна искать связи.
Несколько нейронных сетей могут быть разработаны в тандеме, при этом каждая подсеть специализируется на подмножестве проблемного пространства. Например, генеративно-состязательные сети (GAN) обычно обучают модели, которые пытаются конкурировать друг с другом (одна подделывает новые данные, которые должны принадлежать набору данных, а другая обучает обнаружению мошенничества), а архитектуры с двумя башнями сотрудничают, чтобы учиться. о двух глубоко взаимосвязанных, но различных частях набора данных.
Более сложные комбинации архитектур также часто используются вместе при построении систем глубокого обучения. Эти архитектуры можно расширить с помощью специализированных нейронных структур, таких как трансформаторы и выпрямители, или использовать для эмуляции, реализации и улучшения других систем машинного обучения, таких как деревья решений.
Машинное обучение и глубокое обучение: ключевые различия
Глубокое обучение — это разновидность машинного обучения, имеющая некоторые специфические ограничения и преимущества. Машинное обучение — это общий термин, охватывающий более широкий спектр вариантов и компромиссов для анализа данных и обнаружения закономерностей в них. Эта таблица подчеркивает различия. Более подробную информацию вы найдете ниже.
Машинное обучение (МО) | Глубокое обучение (DL) | |
Гибкость | Общий; Подмножество ИИ, которое включает в себя различные методы обучения на основе данных и имеет множество вариантов реализации. | Реализовано исключительно с помощью нейронных сетей; специализированное подмножество машинного обучения, ориентированное на глубокие многоуровневые нейронные сети и методы, которые хорошо для них подходят. |
Участие человека | Охватывает весь спектр алгоритмов: от тех, которые работают со структурированными данными и требуют значительной предварительной обработки человеком, до тех, которые могут работать полностью независимо. | Обычно применяется к чрезвычайно большим наборам данных. Модели работают в основном с неструктурированными данными и меньше зависят от обработки и курирования человеком. |
Объем | Более широкая область применения, включая традиционные алгоритмы, такие как линейная регрессия, деревья решений и кластеризация. | Более узкая специализация в области машинного обучения, специализирующаяся на обработке крупномасштабных данных и сложных задачах. |
Основы технологии | Использует различные алгоритмы, такие как деревья решений, машины опорных векторов и ансамблевые методы. | Использует глубокие нейронные сети с множеством слоев и методы, специально предназначенные для работы с нейронными сетями, такие как обучение с подкреплением и обратное распространение ошибки. |
Области применения | Любые и все области приложений, в которых алгоритмы и компьютеры могут использоваться для автоматического обнаружения закономерностей в данных. | Специализируется на задачах, которые зависят от сложного распознавания образов в больших объемах неструктурированных данных, таких как анализ текста и изображений общего назначения, решение реальных проблем и генеративные задачи. |
Интерпретируемость | Могут быть построены способами, которые людям легко понять и интерпретировать. Изучены гораздо дольше и обладают хорошо известными свойствами. | Обычно очень точны, но при этом предпринимают действия, за которыми людям гораздо труднее следовать и объяснить. |
Примеры | Обнаружение спама, системы рекомендаций, сегментация клиентов. | Беспилотные автомобили, виртуальные помощники (например, Siri), системы распознавания лиц. |
Глубокое обучение зависит от больших наборов данных
Методы глубокого обучения часто зависят от доступа к чрезвычайно большим наборам данных, в то время как системы машинного обучения могут быть полезны, когда данных мало или вообще нет. Кроме того, если доступен квалифицированный и специализированный человеческий вклад, ML может использовать его более явно, чем любая система глубокого обучения.
В целом системы машинного обучения охватывают более широкий спектр методов и имеют более гибкий диапазон реализации. Глубокое обучение фокусируется исключительно на методах, подходящих для работы с большими наборами данных, таких как глубокие нейронные сети и поддерживающие их алгоритмы.
ML может быть проще оптимизировать и понимать
Обладая гораздо более широким охватом, машинное обучение охватывает многие традиционные и хорошо изученные подходы к обработке данных, такие как деревья решений, кластеризация и многие разновидности регрессии. Их изучению посвящены десятилетия, и многие из этих подходов имеют хорошо известную встроенную производительность и другие компромиссы.
Они предлагают более гибкие реализации, чем системы глубокого обучения, зависящие от нейронных сетей, и могут быть более эффективными с точки зрения ресурсов и затрат. Глубокое обучение обычно требует больших ресурсов и находится на верхнем уровне шкалы затрат.
Глубокое обучение более мощное и не такое общее
Системы глубокого обучения лучше всего подходят для приложений с более узкой областью и направленностью, например, для проблем с большими объемами доступных связанных данных, достаточного времени для длительного обучения нейронной сети, а также когда точность выполнения имеет приоритет над способностью отслеживать что именно делает система и почему.
Системы МО могут применяться для решения всего спектра задач, когда машины могут автоматически находить и применять закономерности в данных, в том числе тех, где доступно меньше данных, где системы легко понять людям и где высокая точность менее важна.
Приложения машинного обучения и глубокого обучения
Системы и приложения на основе машинного обучения и глубокого обучения постоянно внедряются во все больше и больше аспектов нашей жизни. Ниже приведены некоторые известные примеры.
Обнаружение спама
Одним из первых крупномасштабных приложений машинного обучения было обнаружение и фильтрация спам-сообщений электронной почты. Эта задача идеальна для прикладного машинного обучения.
Электронных писем очень много, и они имеют четко определенную структуру. Нежелательные электронные письма легко пометить как спам, поэтому нетрудно создать большие наборы данных электронных писем, помеченных как «спам» или «спам» (ветчина – это противоположность спама). На основе этих данных можно легко построить системы классификации, а затем использовать их для быстрой фильтрации спам-сообщений в масштабах Интернета.
Обнаружение спама — один из примеров, когда системы глубокого обучения (пока) не так хорошо подходят для решения проблем, как более традиционные методы машинного обучения. Несмотря на значительные улучшения, время и затраты, необходимые для поддержания систем глубокого обучения в курсе последних достижений в области спама, пока не оправдывают их более высокую точность. Системы глубокого обучения могут использоваться для оптимизации конвейеров ML в целом, а крупномасштабные системы обучения ML по обнаружению спама могут интегрировать их с этой целью.
Рекомендательные системы
Магазины электронной коммерции, службы потокового мультимедиа и онлайн-торговые площадки — это лишь некоторые примеры услуг, которые зависят от возможности давать рекомендации о том, где пользователям следует тратить свои деньги. Рекомендательные системы — еще один типичный пример проблемы, хорошо подходящей для машинного обучения.
Когда пользователи потребляют медиа и покупают онлайн, базовые системы могут создавать большие наборы данных с четкими сигналами (пользователь потреблял или пользователь не потреблял). Для решения этой проблемы можно применить как глубокое обучение, так и более традиционные методы машинного обучения; крупномасштабные рекомендательные системы используют умные комбинации обоих типов алгоритмов.
Автомобили для поиска пути и беспилотные автомобили
Традиционные алгоритмы машинного обучения без учителя, основанные на хорошо известных методах поиска маршрутов, таких как алгоритм Дейкстры и алгоритм A*, лучше всего подходят для поиска наилучшего пути между двумя точками на дорожной карте. Эти алгоритмы могут заранее изучать карты, трафик и другие данные, выявлять закономерности, корректироваться в режиме реального времени в зависимости от реальных условий и работать достаточно хорошо.
Однако когда дело доходит до фактической навигации автомобиля между двумя точками, объем и сложность обрабатываемой информации слишком высоки, чтобы с ней могла работать любая традиционная техника МО. Системы беспилотного вождения почти исключительно создаются с использованием методов глубокого обучения.
Преимущества машинного обучения и глубокого обучения
При правильном использовании машинное обучение и специализированные системы глубокого обучения способны к трансформации. Они могут расширять возможности экспертов-людей, делая их результаты быстрее, эффективнее, дешевле, качественнее или комбинируя все вышеперечисленное.
Повышение скорости, масштаба и стоимости с помощью машинного обучения.
Системы машинного обучения могут заменить часть или всю работу и процессы эксперта, сокращая время и внимание, необходимые для выполнения задачи. В результате их работа может применяться в гораздо более широком масштабе, чем раньше.
Например, каждая группа технических специалистов, проверяющих МРТ на наличие отклонений, может оценить шесть сканирований в час или около 200 в неделю. Если бы та же команда вместо этого сосредоточилась на обучении набора алгоритмов машинного обучения для выполнения самых рутинных частей анализа, алгоритмы могли бы оценивать тысячи МРТ-сканирований в неделю за небольшую часть затрат.
Более высокая эффективность и качество благодаря глубокому обучению
Применительно к задачам, для решения которых хорошо подходят системы глубокого обучения, они могут дополнить системы, включающие МО, и повысить их общее качество и эффективность.
Продолжая приведенный выше пример, системы глубокого обучения могут быть применены к условиям с достаточно большим объемом МРТ-сканирований. Если объем сканирований достаточен и после того, как на создание систем глубокого обучения будет выделено достаточно времени и ресурсов, они, скорее всего, справятся с задачей лучше, чем эксперты, при выявлении узкого набора отклонений, которые они были обучены выявлять.
Затем эти системы можно будет развернуть в любом масштабе для достижения максимального эффекта, обрабатывая отдельные снимки МРТ с незначительными затратами. Анализ специалистов МРТ и других экспертов может улучшить результаты работы систем глубокого обучения в необычных или исключительных случаях, достигая еще более высокого совокупного качества.
Проблемы машинного обучения и глубокого обучения
Хотя многие виды работ могут получить огромную пользу от прикладного машинного обучения или глубокого обучения, включение такого ИИ в систему может оказаться затруднительным. Вот некоторые из наиболее распространенных проблем и препятствий, которые возникают.
Компромисс между стоимостью и точностью
Более крупные и дорогие компьютерные системы могут запускать более совершенные алгоритмы машинного обучения и глубокого обучения быстрее и в большем масштабе. В результате возникает компромисс между тем, сколько денег тратится на систему, и насколько она эффективна с точки зрения аппаратного обеспечения и найма более талантливых экспертов для ее сборки. Эффективное использование ограниченных ресурсов в системах машинного обучения и глубокого обучения требует значительной осторожности.
Зависимость от больших наборов данных
Машинное обучение в целом и глубокое обучение в частности зависят от наличия доступа к постоянно обновляемым большим наборам данных на этапе обучения. Алгоритмы хороши настолько, насколько качество и объем данных, на которых они обучаются. Эффективно управлять большими наборами данных сложно, и для наиболее эффективного применения машинного обучения к заданному набору данных требуются время и изобретательность.
Компромисс между точностью и ясностью
Системы глубокого обучения можно научить быть чрезвычайно точными, гораздо более точными, чем другие системы машинного обучения, созданные с аналогичными параметрами. За точность приходится платить; системы манипулируют данными в больших масштабах и используют передовые алгоритмы, которые людям невозможно понять в практические сроки.
Более традиционные алгоритмы МО изучаются гораздо дольше, имеют более четко определенные характеристики и их можно заставить работать так, чтобы людям было легко их понять. Любая реализация машинного обучения и глубокого обучения должна найти идеальный компромисс между точностью и ясностью.
Компромисс между технической предвзятостью и дисперсией
По мере того, как системы МО усложняют алгоритмы, ресурсы, выделяемые на обучение, и объем данных, используемых для обучения, они могут узнавать все больше и больше о свойствах своих обучающих данных. Это явление называется (технической) предвзятостью; чрезвычайно предвзятые системы будут очень точны, когда увидят данные, аналогичные тем, на которых они обучались.
Высокая погрешность часто возникает за счет слишком низкой дисперсии — система не будет особо реагировать на новые данные, которые сильно отличаются от тех, что она видела при обучении. Идеальные системы, которые обладают как низкой предвзятостью, так и низкой дисперсией, построить сложно. Найти правильный баланс между предвзятостью и дисперсией для конкретного приложения легче с помощью более изученных и более устоявшихся традиционных алгоритмов машинного обучения. Этого может быть трудно достичь с помощью более сложных алгоритмов глубокого обучения.
Заключение
Системы глубокого обучения — это специализированное подмножество машинного обучения, которое использует глубокие многоуровневые нейронные сети для решения сложных проблем с большими наборами данных. Хотя они предлагают превосходную точность и возможности обработки, они имеют свои недостатки, такие как ограниченная интерпретируемость, зависимость от обширных данных и ограниченная гибкость оптимизации.
Напротив, традиционные методы МО зачастую более экономичны, их легче развернуть и обеспечить более прозрачные и предсказуемые результаты. Их также проще настроить под конкретные задачи. Оба подхода имеют определенные сильные и слабые стороны, и понимание их применения и ограничений имеет решающее значение для эффективной реализации в реальных сценариях.