Обучение под наблюдением и без учителя: различия, преимущества и варианты использования

Опубликовано: 2025-01-17

Машинное обучение (МО) лежит в основе многих технологий, на которые мы полагаемся ежедневно, таких как распознавание изображений и автономные транспортные средства. Два основополагающих подхода — обучение с учителем и без учителя — составляют основу этих систем. Хотя оба они являются ключевыми для обучения моделей ML, они различаются по своей методологии, целям и приложениям.

В этом руководстве мы сравним эти два подхода, выделим их различия и рассмотрим их преимущества и проблемы. Мы также рассмотрим практические применения, которые помогут вам понять, какое из них лучше всего подходит для различных задач.

Оглавление

  • Что такое контролируемое обучение?
  • Что такое обучение без учителя?
  • Контролируемый и неконтролируемый: ключевые различия
  • Преимущества контролируемого и неконтролируемого обучения
  • Проблемы контролируемого и неконтролируемого обучения
  • Применение контролируемого и неконтролируемого обучения
  • Заключение

Что такое контролируемое обучение?

Контролируемое обучение обучает системы машинного обучения с использованием размеченных данных. В этом контексте «маркированный» означает, что каждый обучающий пример связан с известными выходными данными. Эти метки, часто создаваемые экспертами, помогают системе изучить взаимосвязи между входными и выходными данными. После обучения контролируемые системы могут применять эти изученные взаимосвязи к новым, невидимым данным для прогнозирования или классификации.

Например, в контексте беспилотных автомобилей система контролируемого обучения может анализировать помеченные видеоданные. Эти аннотации идентифицируют уличные знаки, пешеходов и препятствия, позволяя системе распознавать аналогичные особенности и реагировать на них в реальных сценариях вождения.

Алгоритмы контролируемого обучения делятся на две основные категории:

  • Классификация. Эти алгоритмы присваивают метки новым данным, например, идентифицируя электронные письма как спам или не спам.
  • Регрессия: эти алгоритмы прогнозируют непрерывные значения, например, прогнозируют будущие продажи на основе прошлых показателей.

По мере роста наборов данных и улучшения вычислительных ресурсов контролируемые системы становятся более точными и эффективными, поддерживая такие приложения, как обнаружение мошенничества и медицинская диагностика.

Узнайте больше о контролируемом обучении →

Что такое обучение без учителя?

Обучение без учителя, напротив, анализирует данные без размеченных примеров, полагаясь на статистические алгоритмы для выявления скрытых закономерностей или взаимосвязей. В отличие от контролируемых систем, эти модели определяют структуру и динамически обновляют свои результаты по мере поступления новой информации. Хотя обучение без учителя превосходно подходит для обнаружения закономерностей, оно обычно менее эффективно для задач прогнозирования.

Практический пример — сервисы агрегирования новостей. Эти системы группируют статьи и публикации в социальных сетях о последних новостях без внешней маркировки. Выявляя общие черты в режиме реального времени, они самостоятельно обучаются, чтобы выделить ключевые истории.

Вот несколько специализированных алгоритмов обучения без учителя:

  • Кластеризация:они используются для сегментации потребителей и корректировки сегментов по мере изменения поведения.
  • Ассоциация:они обнаруживают закономерности в данных, например выявляют аномалии, которые могут указывать на нарушения безопасности.
  • Уменьшение размерности: они упрощают структуры данных, сохраняя при этом важную информацию, и часто используются для сжатия и визуализации сложных наборов данных.

Обучение без учителя является неотъемлемой частью исследовательского анализа данных и выявления идей в сценариях, где помеченные данные недоступны.

Узнайте больше об обучении без учителя →

Контролируемый и неконтролируемый: ключевые различия

Обучение с учителем и без учителя играют разные роли в машинном обучении. Эти подходы различаются требованиями к данным, участием человека, задачами и приложениями. В таблице ниже показаны эти различия, которые мы рассмотрим далее.

Обучение под присмотром Обучение без присмотра
Входные данные Требуются помеченные данные Требуются непомеченные данные
Цель Прогнозируйте или классифицируйте выходные метки на основе входных функций. Обнаруживайте и обновляйте скрытые закономерности, структуры или представления в данных.
Участие человека Значительные ручные усилия для маркировки больших наборов данных и экспертные рекомендации по выбору функций. Минимальное, но очень специализированное вмешательство человека. В первую очередь для настройки параметров алгоритма, оптимизации использования ресурсов в масштабе и исследования алгоритмов.
Основные задачи Регрессия, классификация Кластеризация, ассоциация, уменьшение размерности
Общие алгоритмы Линейная и логистическая регрессия, деревья решений, нейронные сети Кластеризация K-средних, анализ главных компонент (PCA), автоэнкодеры
Выход Прогнозные модели, которые могут классифицировать или регрессировать новые точки данных. Группировки или представления данных (например, кластеры, компоненты)
Приложения Обнаружение спама, обнаружение мошенничества, классификация изображений, прогнозирование цен и т. д. Сегментация клиентов, анализ потребительской корзины, выявление аномалий и т. д.

Различия на этапе обучения

Основное различие между этими двумя типами алгоритмов заключается в типе наборов данных, от которых они зависят. Обучение с учителем выигрывает от больших наборов размеченных данных. Следовательно, самые продвинутые контролируемые системы зависят от крупномасштабного, неспециализированного человеческого труда для просеивания данных и создания меток. Помеченные данные также обычно требуют больше ресурсов для обработки, поэтому контролируемые системы не могут обрабатывать столько данных в верхнем конце шкалы.

Системы обучения без учителя могут начать быть эффективными с меньшими наборами данных и могут обрабатывать гораздо большие объемы данных с теми же ресурсами. Их данные легче получить и обработать, поскольку они не зависят от масштабного неспециализированного человеческого труда. В качестве компромисса системы обычно не достигают такой высокой степени точности при выполнении задач прогнозирования, и их эффективность часто зависит от специализированной работы. Вместо того, чтобы использоваться там, где точность имеет решающее значение, они чаще используются для вывода и обновления закономерностей в данных, в масштабе и по мере изменения данных.

Различия при развертывании

Приложения для контролируемого обучения обычно имеют встроенный механизм для получения большего количества размеченных данных в большом масштабе. Например, пользователям электронной почты легко отметить, являются ли входящие сообщения спамом или нет. Поставщик электронной почты может накапливать отмеченные сообщения в обучающем наборе, а затем обучать системы логистической регрессии обнаружению спама. Они обменивают более длительное и ресурсоемкое обучение на более быстрое принятие решений при развертывании. Помимо систем логистической регрессии, другие распространенные алгоритмы контролируемого обучения включают деревья решений и нейронные сети, которые повсеместно используются для прогнозирования и принятия решений, а также для распознавания сложных образов.

Неконтролируемые системы отличаются друг от друга при решении задач, связанных с большими объемами неструктурированных данных. Они могут обнаруживать закономерности в данных, даже если они временные, и их необходимо обнаружить до завершения обучения контролируемому обучению. Например, алгоритмы кластеризации — разновидность системы обучения без присмотра — могут выявлять и обновлять потребительские сегменты по мере изменения тенденций. Если тенденции смещаются к новым и невиданным закономерностям, они остаются актуальными, не требуя простоев для переобучения.

Примером обучения без учителя является использование анализа главных компонентов (PCA) в финансах. PCA — это алгоритм, который можно применять к группам инвестиций в любом масштабе и помогает делать выводы и обновлять возникающие свойства группы. К ним относятся важные финансовые показатели, такие как наиболее важные источники инвестиционного риска и факторы, которые могут повлиять на доходность. Другими распространенными типами систем обучения без учителя являются автокодировщики, которые сжимают и упрощают данные, часто в качестве подготовительного шага перед применением других алгоритмов машинного обучения.

Работайте умнее с Grammarly
Партнер по написанию ИИ для всех, у кого есть работа

Преимущества контролируемого и неконтролируемого обучения

Как контролируемые, так и неконтролируемые системы полезны для обработки данных в масштабе и скорости, которые превосходят возможности человека без посторонней помощи. Однако они лучше всего подходят для различных применений. Ниже мы сопоставляем некоторые из их основных преимуществ.

Контролируемые системы

  • Excel, когда доступны важные исторические данные
  • Гораздо лучше, чем неконтролируемые системы, для обучения данных с известной структурой, характеристиками и шаблонами.
  • Идеально подходят для обнаружения и применения известных характеристик данных в большом масштабе.
  • Может давать результаты, которые понятны и имеют интуитивный смысл для людей
  • Может иметь более высокую точность при работе с новыми и ранее неизвестными данными.
  • Могут делать прогнозы быстрее и в более высоком масштабе, чем неконтролируемые системы.

Неконтролируемые системы

  • Особенно хороши в выявлении ранее невидимых или неизвестных структур и взаимосвязей в данных.
  • Преуспевайте, когда данные менее структурированы и их свойства менее известны.
  • Работать в некоторых условиях, когда контролируемые системы не работают должным образом (например, в ситуациях, когда данные недоступны или когда они доступны, но не обрабатывались людьми).
  • Требуют меньше ресурсов и меньше времени во время обучения, чем контролируемые системы для эквивалентных объемов данных.
  • Можно обучить и использовать, когда данных слишком много для правильной обработки с помощью контролируемых систем.

Проблемы контролируемого и неконтролируемого обучения

Каждая из контролируемых и неконтролируемых систем идет на разные компромиссы, и проблемы, с которыми они сталкиваются, иногда совершенно разные. Ниже мы выделим некоторые основные различия.

Контролируемые системы

  • Требовать доступа к большим объемам данных, обработанных человеком, которые лишь иногда доступны или их легко получить.
  • Часто имеют более длительные и ресурсоемкие этапы обучения.
  • Могут возникнуть трудности с быстрой адаптацией, если основные характеристики данных изменятся.
  • Сталкивайтесь с проблемами при обработке неструктурированных данных, таких как видео или аудио.

Неконтролируемые системы

  • Будет чаще обнаруживать закономерности, которые плохо обобщаются на новые примеры данных.
  • Может быть сложно сделать такие же точные, как контролируемые системы
  • Они дают результаты, которые людям трудно интерпретировать, и интерпретация этих результатов может быть более субъективной.
  • На каждый прогноз, сделанный в реальном мире, может потребоваться больше времени и ресурсов.

Применение контролируемого и неконтролируемого обучения

Некоторые приложения и проблемы лучше всего решать с помощью контролируемых систем обучения, некоторые — с помощью неконтролируемых систем, а некоторые — с использованием смешанного подхода. Вот три хорошо известных примера.

Смешанные системы обучения и полуконтролируемое обучение

Важно отметить, что большинство реальных приложений используют сочетание контролируемых и неконтролируемых моделей. Системы обучения часто комбинируются на основе таких факторов, как бюджет, доступность данных, требования к производительности и инженерная сложность. Иногда также может использоваться специализированное подмножество алгоритмов обучения, которое пытается объединить преимущества обоих подходов — полуконтролируемое обучение. В приведенных ниже примерах мы указываем наиболее вероятную или основную систему, которая, скорее всего, будет использоваться.

Прогнозирование трафика (контролируемое)

Прогнозирование трафика – сложная задача. К счастью, доступно много размеченных данных, поскольку города регулярно проверяют и записывают объемы дорожного движения. Алгоритмы регрессии, тип контролируемого обучения, легко применять к этим данным и могут давать довольно точные прогнозы транспортных потоков. Их прогнозы могут помочь в принятии решений относительно строительства дорог, дорожных знаков и размещения светофоров. Неконтролируемые алгоритмы менее эффективны на этом этапе. Однако их можно использовать на основе данных о дорожном движении по мере их накопления после внесения изменений в структуру дорог. На этом этапе они помогают автоматически идентифицировать и сделать вывод о том, могут ли возникнуть какие-либо новые и ранее невидимые проблемы.

Генетическая кластеризация (без присмотра)

Анализ генетических данных может быть медленным и обременительным, поскольку объемы данных велики и большая часть данных не анализируется должным образом. Мы часто не знаем многого о том, что содержат генетические данные — где гены и другие генетические компоненты могут храниться в геноме, как они декодируются и интерпретируются и т. д. Неконтролируемые алгоритмы особенно актуальны для этой проблемы, поскольку они могут обрабатывать большие объемы данных. данных и автоматически определить, какие шаблоны они содержат. Они также могут помочь собрать похожую генетическую информацию в отдельные кластеры. Как только генетические данные сгруппированы на основе сходства, кластеры можно легко обработать и протестировать, чтобы определить, какой биологической функции (если таковая имеется) они служат.

LLM и обучение с подкреплением (смешанное)

Большие языковые модели (LLM) являются примером приложения, сочетающего в себе системы обучения без учителя и с учителем. Исходная система, LLM, обычно является примером неконтролируемой системы. Для создания LLM неконтролируемой системой анализируются крупномасштабные данные (скажем, весь текст на английском языке, доступный в Интернете). Система выводит множество закономерностей из данных и разрабатывает базовые правила общения на английском языке.

Однако выводы, которые делает LLM, не помогают ему звучать как типичный человек в разговоре. Они также не помогают ему учитывать индивидуальные предпочтения в общении. Контролируемая система — в частности, система подкрепления, которая использует аннотированную обратную связь от пользователей (так называемое обучение с подкреплением на основе обратной связи от человека, или сокращенно RLHF) — является одним из способов решения этой проблемы. RLHF можно применить к уже обученному LLM, чтобы помочь ему хорошо общаться с людьми в целом. Он также может изучать индивидуальные предпочтения и говорить так, как предпочитает конкретный человек.

Заключение

Подводя итог, можно сказать, что обучение с учителем и без учителя — это две фундаментальные разновидности машинного обучения, каждая из которых обладает уникальными преимуществами. Обучение с учителем превосходно работает в сценариях с большим количеством размеченных данных, достаточными ресурсами для предварительного обучения и необходимостью быстрого и масштабируемого принятия решений. С другой стороны, обучение без учителя полезно при раскрытии скрытых структур и взаимосвязей в данных, особенно когда помеченные данные или ресурсы обучения ограничены, а принятие решений требует больше времени и сложности. Понимая преимущества, проблемы и варианты использования обоих подходов, вы сможете принимать обоснованные решения о том, когда и как их эффективно применять.