Обучение под наблюдением и без учителя: различия, преимущества и варианты использования
Опубликовано: 2025-01-17Машинное обучение (МО) лежит в основе многих технологий, на которые мы полагаемся ежедневно, таких как распознавание изображений и автономные транспортные средства. Два основополагающих подхода — обучение с учителем и без учителя — составляют основу этих систем. Хотя оба они являются ключевыми для обучения моделей ML, они различаются по своей методологии, целям и приложениям.
В этом руководстве мы сравним эти два подхода, выделим их различия и рассмотрим их преимущества и проблемы. Мы также рассмотрим практические применения, которые помогут вам понять, какое из них лучше всего подходит для различных задач.
Оглавление
- Что такое контролируемое обучение?
- Что такое обучение без учителя?
- Контролируемый и неконтролируемый: ключевые различия
- Преимущества контролируемого и неконтролируемого обучения
- Проблемы контролируемого и неконтролируемого обучения
- Применение контролируемого и неконтролируемого обучения
- Заключение
Что такое контролируемое обучение?
Контролируемое обучение обучает системы машинного обучения с использованием размеченных данных. В этом контексте «маркированный» означает, что каждый обучающий пример связан с известными выходными данными. Эти метки, часто создаваемые экспертами, помогают системе изучить взаимосвязи между входными и выходными данными. После обучения контролируемые системы могут применять эти изученные взаимосвязи к новым, невидимым данным для прогнозирования или классификации.
Например, в контексте беспилотных автомобилей система контролируемого обучения может анализировать помеченные видеоданные. Эти аннотации идентифицируют уличные знаки, пешеходов и препятствия, позволяя системе распознавать аналогичные особенности и реагировать на них в реальных сценариях вождения.
Алгоритмы контролируемого обучения делятся на две основные категории:
- Классификация. Эти алгоритмы присваивают метки новым данным, например, идентифицируя электронные письма как спам или не спам.
- Регрессия: эти алгоритмы прогнозируют непрерывные значения, например, прогнозируют будущие продажи на основе прошлых показателей.
По мере роста наборов данных и улучшения вычислительных ресурсов контролируемые системы становятся более точными и эффективными, поддерживая такие приложения, как обнаружение мошенничества и медицинская диагностика.
Что такое обучение без учителя?
Обучение без учителя, напротив, анализирует данные без размеченных примеров, полагаясь на статистические алгоритмы для выявления скрытых закономерностей или взаимосвязей. В отличие от контролируемых систем, эти модели определяют структуру и динамически обновляют свои результаты по мере поступления новой информации. Хотя обучение без учителя превосходно подходит для обнаружения закономерностей, оно обычно менее эффективно для задач прогнозирования.
Практический пример — сервисы агрегирования новостей. Эти системы группируют статьи и публикации в социальных сетях о последних новостях без внешней маркировки. Выявляя общие черты в режиме реального времени, они самостоятельно обучаются, чтобы выделить ключевые истории.
Вот несколько специализированных алгоритмов обучения без учителя:
- Кластеризация:они используются для сегментации потребителей и корректировки сегментов по мере изменения поведения.
- Ассоциация:они обнаруживают закономерности в данных, например выявляют аномалии, которые могут указывать на нарушения безопасности.
- Уменьшение размерности: они упрощают структуры данных, сохраняя при этом важную информацию, и часто используются для сжатия и визуализации сложных наборов данных.
Обучение без учителя является неотъемлемой частью исследовательского анализа данных и выявления идей в сценариях, где помеченные данные недоступны.
Контролируемый и неконтролируемый: ключевые различия
Обучение с учителем и без учителя играют разные роли в машинном обучении. Эти подходы различаются требованиями к данным, участием человека, задачами и приложениями. В таблице ниже показаны эти различия, которые мы рассмотрим далее.
Обучение под присмотром | Обучение без присмотра | |
Входные данные | Требуются помеченные данные | Требуются непомеченные данные |
Цель | Прогнозируйте или классифицируйте выходные метки на основе входных функций. | Обнаруживайте и обновляйте скрытые закономерности, структуры или представления в данных. |
Участие человека | Значительные ручные усилия для маркировки больших наборов данных и экспертные рекомендации по выбору функций. | Минимальное, но очень специализированное вмешательство человека. В первую очередь для настройки параметров алгоритма, оптимизации использования ресурсов в масштабе и исследования алгоритмов. |
Основные задачи | Регрессия, классификация | Кластеризация, ассоциация, уменьшение размерности |
Общие алгоритмы | Линейная и логистическая регрессия, деревья решений, нейронные сети | Кластеризация K-средних, анализ главных компонент (PCA), автоэнкодеры |
Выход | Прогнозные модели, которые могут классифицировать или регрессировать новые точки данных. | Группировки или представления данных (например, кластеры, компоненты) |
Приложения | Обнаружение спама, обнаружение мошенничества, классификация изображений, прогнозирование цен и т. д. | Сегментация клиентов, анализ потребительской корзины, выявление аномалий и т. д. |
Различия на этапе обучения
Основное различие между этими двумя типами алгоритмов заключается в типе наборов данных, от которых они зависят. Обучение с учителем выигрывает от больших наборов размеченных данных. Следовательно, самые продвинутые контролируемые системы зависят от крупномасштабного, неспециализированного человеческого труда для просеивания данных и создания меток. Помеченные данные также обычно требуют больше ресурсов для обработки, поэтому контролируемые системы не могут обрабатывать столько данных в верхнем конце шкалы.
Системы обучения без учителя могут начать быть эффективными с меньшими наборами данных и могут обрабатывать гораздо большие объемы данных с теми же ресурсами. Их данные легче получить и обработать, поскольку они не зависят от масштабного неспециализированного человеческого труда. В качестве компромисса системы обычно не достигают такой высокой степени точности при выполнении задач прогнозирования, и их эффективность часто зависит от специализированной работы. Вместо того, чтобы использоваться там, где точность имеет решающее значение, они чаще используются для вывода и обновления закономерностей в данных, в масштабе и по мере изменения данных.
Различия при развертывании
Приложения для контролируемого обучения обычно имеют встроенный механизм для получения большего количества размеченных данных в большом масштабе. Например, пользователям электронной почты легко отметить, являются ли входящие сообщения спамом или нет. Поставщик электронной почты может накапливать отмеченные сообщения в обучающем наборе, а затем обучать системы логистической регрессии обнаружению спама. Они обменивают более длительное и ресурсоемкое обучение на более быстрое принятие решений при развертывании. Помимо систем логистической регрессии, другие распространенные алгоритмы контролируемого обучения включают деревья решений и нейронные сети, которые повсеместно используются для прогнозирования и принятия решений, а также для распознавания сложных образов.
Неконтролируемые системы отличаются друг от друга при решении задач, связанных с большими объемами неструктурированных данных. Они могут обнаруживать закономерности в данных, даже если они временные, и их необходимо обнаружить до завершения обучения контролируемому обучению. Например, алгоритмы кластеризации — разновидность системы обучения без присмотра — могут выявлять и обновлять потребительские сегменты по мере изменения тенденций. Если тенденции смещаются к новым и невиданным закономерностям, они остаются актуальными, не требуя простоев для переобучения.
Примером обучения без учителя является использование анализа главных компонентов (PCA) в финансах. PCA — это алгоритм, который можно применять к группам инвестиций в любом масштабе и помогает делать выводы и обновлять возникающие свойства группы. К ним относятся важные финансовые показатели, такие как наиболее важные источники инвестиционного риска и факторы, которые могут повлиять на доходность. Другими распространенными типами систем обучения без учителя являются автокодировщики, которые сжимают и упрощают данные, часто в качестве подготовительного шага перед применением других алгоритмов машинного обучения.
Преимущества контролируемого и неконтролируемого обучения
Как контролируемые, так и неконтролируемые системы полезны для обработки данных в масштабе и скорости, которые превосходят возможности человека без посторонней помощи. Однако они лучше всего подходят для различных применений. Ниже мы сопоставляем некоторые из их основных преимуществ.
Контролируемые системы
- Excel, когда доступны важные исторические данные
- Гораздо лучше, чем неконтролируемые системы, для обучения данных с известной структурой, характеристиками и шаблонами.
- Идеально подходят для обнаружения и применения известных характеристик данных в большом масштабе.
- Может давать результаты, которые понятны и имеют интуитивный смысл для людей
- Может иметь более высокую точность при работе с новыми и ранее неизвестными данными.
- Могут делать прогнозы быстрее и в более высоком масштабе, чем неконтролируемые системы.
Неконтролируемые системы
- Особенно хороши в выявлении ранее невидимых или неизвестных структур и взаимосвязей в данных.
- Преуспевайте, когда данные менее структурированы и их свойства менее известны.
- Работать в некоторых условиях, когда контролируемые системы не работают должным образом (например, в ситуациях, когда данные недоступны или когда они доступны, но не обрабатывались людьми).
- Требуют меньше ресурсов и меньше времени во время обучения, чем контролируемые системы для эквивалентных объемов данных.
- Можно обучить и использовать, когда данных слишком много для правильной обработки с помощью контролируемых систем.
Проблемы контролируемого и неконтролируемого обучения
Каждая из контролируемых и неконтролируемых систем идет на разные компромиссы, и проблемы, с которыми они сталкиваются, иногда совершенно разные. Ниже мы выделим некоторые основные различия.
Контролируемые системы
- Требовать доступа к большим объемам данных, обработанных человеком, которые лишь иногда доступны или их легко получить.
- Часто имеют более длительные и ресурсоемкие этапы обучения.
- Могут возникнуть трудности с быстрой адаптацией, если основные характеристики данных изменятся.
- Сталкивайтесь с проблемами при обработке неструктурированных данных, таких как видео или аудио.
Неконтролируемые системы
- Будет чаще обнаруживать закономерности, которые плохо обобщаются на новые примеры данных.
- Может быть сложно сделать такие же точные, как контролируемые системы
- Они дают результаты, которые людям трудно интерпретировать, и интерпретация этих результатов может быть более субъективной.
- На каждый прогноз, сделанный в реальном мире, может потребоваться больше времени и ресурсов.
Применение контролируемого и неконтролируемого обучения
Некоторые приложения и проблемы лучше всего решать с помощью контролируемых систем обучения, некоторые — с помощью неконтролируемых систем, а некоторые — с использованием смешанного подхода. Вот три хорошо известных примера.
Смешанные системы обучения и полуконтролируемое обучение
Важно отметить, что большинство реальных приложений используют сочетание контролируемых и неконтролируемых моделей. Системы обучения часто комбинируются на основе таких факторов, как бюджет, доступность данных, требования к производительности и инженерная сложность. Иногда также может использоваться специализированное подмножество алгоритмов обучения, которое пытается объединить преимущества обоих подходов — полуконтролируемое обучение. В приведенных ниже примерах мы указываем наиболее вероятную или основную систему, которая, скорее всего, будет использоваться.
Прогнозирование трафика (контролируемое)
Прогнозирование трафика – сложная задача. К счастью, доступно много размеченных данных, поскольку города регулярно проверяют и записывают объемы дорожного движения. Алгоритмы регрессии, тип контролируемого обучения, легко применять к этим данным и могут давать довольно точные прогнозы транспортных потоков. Их прогнозы могут помочь в принятии решений относительно строительства дорог, дорожных знаков и размещения светофоров. Неконтролируемые алгоритмы менее эффективны на этом этапе. Однако их можно использовать на основе данных о дорожном движении по мере их накопления после внесения изменений в структуру дорог. На этом этапе они помогают автоматически идентифицировать и сделать вывод о том, могут ли возникнуть какие-либо новые и ранее невидимые проблемы.
Генетическая кластеризация (без присмотра)
Анализ генетических данных может быть медленным и обременительным, поскольку объемы данных велики и большая часть данных не анализируется должным образом. Мы часто не знаем многого о том, что содержат генетические данные — где гены и другие генетические компоненты могут храниться в геноме, как они декодируются и интерпретируются и т. д. Неконтролируемые алгоритмы особенно актуальны для этой проблемы, поскольку они могут обрабатывать большие объемы данных. данных и автоматически определить, какие шаблоны они содержат. Они также могут помочь собрать похожую генетическую информацию в отдельные кластеры. Как только генетические данные сгруппированы на основе сходства, кластеры можно легко обработать и протестировать, чтобы определить, какой биологической функции (если таковая имеется) они служат.
LLM и обучение с подкреплением (смешанное)
Большие языковые модели (LLM) являются примером приложения, сочетающего в себе системы обучения без учителя и с учителем. Исходная система, LLM, обычно является примером неконтролируемой системы. Для создания LLM неконтролируемой системой анализируются крупномасштабные данные (скажем, весь текст на английском языке, доступный в Интернете). Система выводит множество закономерностей из данных и разрабатывает базовые правила общения на английском языке.
Однако выводы, которые делает LLM, не помогают ему звучать как типичный человек в разговоре. Они также не помогают ему учитывать индивидуальные предпочтения в общении. Контролируемая система — в частности, система подкрепления, которая использует аннотированную обратную связь от пользователей (так называемое обучение с подкреплением на основе обратной связи от человека, или сокращенно RLHF) — является одним из способов решения этой проблемы. RLHF можно применить к уже обученному LLM, чтобы помочь ему хорошо общаться с людьми в целом. Он также может изучать индивидуальные предпочтения и говорить так, как предпочитает конкретный человек.
Заключение
Подводя итог, можно сказать, что обучение с учителем и без учителя — это две фундаментальные разновидности машинного обучения, каждая из которых обладает уникальными преимуществами. Обучение с учителем превосходно работает в сценариях с большим количеством размеченных данных, достаточными ресурсами для предварительного обучения и необходимостью быстрого и масштабируемого принятия решений. С другой стороны, обучение без учителя полезно при раскрытии скрытых структур и взаимосвязей в данных, особенно когда помеченные данные или ресурсы обучения ограничены, а принятие решений требует больше времени и сложности. Понимая преимущества, проблемы и варианты использования обоих подходов, вы сможете принимать обоснованные решения о том, когда и как их эффективно применять.