Машинное обучение 101: что это такое и как оно работает
Опубликовано: 2024-05-23Машинное обучение (МО) быстро стало одной из важнейших технологий нашего времени. Он лежит в основе таких продуктов, как ChatGPT, рекомендации Netflix, беспилотные автомобили и спам-фильтры электронной почты. Чтобы помочь вам понять эту широко распространенную технологию, в этом руководстве рассказывается, что такое машинное обучение (а чем оно не является), как оно работает и его влияние.
Оглавление
- Что такое машинное обучение?
- Как работает машинное обучение
- Тип машинного обучения
- Приложения
- Преимущества
- Недостатки
- Будущее машинного обучения
- Заключение
Что такое машинное обучение?
Чтобы понять машинное обучение, мы должны сначала понять искусственный интеллект (ИИ). Хотя эти два понятия используются взаимозаменяемо, это не одно и то же. Искусственный интеллект — это одновременно цель и область исследования. Цель состоит в том, чтобы создать компьютерные системы, способные мыслить и рассуждать на человеческом (или даже сверхчеловеческом) уровне. ИИ также включает в себя множество различных методов достижения этой цели. Машинное обучение является одним из таких методов, что делает его разновидностью искусственного интеллекта.
Машинное обучение фокусируется конкретно на использовании данных и статистики в целях создания искусственного интеллекта. Цель состоит в том, чтобы создать интеллектуальные системы, которые могут обучаться, получая многочисленные примеры (данные), и которые не требуют явного программирования. Имея достаточно данных и хороший алгоритм обучения, компьютер улавливает закономерности в данных и повышает свою производительность.
Напротив, подходы к ИИ, не связанные с машинным обучением, не зависят от данных и имеют жестко запрограммированную логику. Например, вы можете создать бота с искусственным интеллектом, играющего в крестики-нолики, со сверхчеловеческой производительностью, просто запрограммировав все оптимальные ходы (есть 255 168 возможных игр в крестики-нолики, так что это займет некоторое время, но все же возможно). Однако было бы невозможно жестко запрограммировать шахматного ИИ-бота — возможных шахматных игр больше, чем атомов во Вселенной. В таких случаях машинное обучение будет работать лучше.
Здесь возникает резонный вопрос: как именно компьютер улучшается, когда вы приводите ему примеры?
Как работает машинное обучение
В любой системе машинного обучения вам нужны три вещи: набор данных, модель машинного обучения (примером является GPT) и алгоритм обучения. Сначала вы передаете примеры из набора данных. Затем модель прогнозирует правильный результат для этого примера. Если модель неверна, вы используете алгоритм обучения, чтобы повысить вероятность того, что модель будет правильной для подобных примеров в будущем. Вы повторяете этот процесс до тех пор, пока у вас не закончатся данные или пока вы не будете удовлетворены результатами. Завершив этот процесс, вы сможете использовать свою модель для прогнозирования будущих данных.
Базовым примером этого процесса является обучение компьютера распознаванию рукописных цифр, подобных приведенным ниже.
Источник
Вы собираете тысячи или сотни тысяч изображений цифр. Вы начинаете с модели машинного обучения, для которой еще не было примеров. Вы передаете изображения в модель и просите ее предсказать, какое число, по ее мнению, находится на изображении. Он вернет число от нуля до девяти, скажем, единицу. Затем вы, по сути, говорите ему: «На самом деле это число пять, а не один». Алгоритм обучения обновляет модель, поэтому в следующий раз она с большей вероятностью ответит пятью. Вы повторяете этот процесс для (почти) всех доступных изображений, и в идеале у вас есть хорошо работающая модель, которая может правильно распознавать цифры в 90% случаев. Теперь вы можете использовать эту модель для чтения миллионов цифр в больших масштабах быстрее, чем это может сделать человек. На практике Почтовая служба США использует модели машинного обучения для чтения 98% рукописных адресов.
Вы можете потратить месяцы или годы на анализ деталей даже крошечной части этого процесса (посмотрите, сколько существует различных версий алгоритмов оптимизации).
Распространенные типы машинного обучения
На самом деле существует четыре различных типа методов машинного обучения: контролируемые, неконтролируемые, полуконтролируемые и с подкреплением. Основное различие заключается в том, как помечены их данные (т. е. с правильным ответом или без него).
Обучение под присмотром
Модели контролируемого обучения получают помеченные данные (с правильными ответами). Пример рукописных цифр попадает в эту категорию: мы можем сказать модели: «Пять — правильный ответ». Целью модели является изучение явных связей между входными и выходными данными. Эти модели могут выводить либо дискретные метки (например, предсказывать «кошку» или «собаку» по изображению домашнего животного), либо числа (например, прогнозируемую цену дома с учетом количества кроватей, ванн, местоположения и т. д.). .
Обучение без присмотра
В моделях обучения без учителя предоставляются немаркированные данные (без правильных ответов). Эти модели выявляют закономерности во входных данных для их значимой группировки. Например, учитывая множество изображений кошек и собак без правильного ответа, модель ML без присмотра будет искать сходства и различия в изображениях, чтобы группировать изображения собак и кошек вместе. Кластеризация, правила ассоциации и уменьшение размерности — основные методы неконтролируемого машинного обучения.
Полуконтролируемое обучение
Обучение с полуконтролем — это подход машинного обучения, который находится между обучением с учителем и обучением без учителя. Этот метод предоставляет значительный объем неразмеченных данных и меньший набор помеченных данных для обучения модели. Сначала модель обучается на размеченных данных, а затем присваивает метки неразмеченным данным, сравнивая их сходство с размеченными данными.
Обучение с подкреплением
Обучение с подкреплением не имеет определенного набора примеров и ярлыков. Вместо этого модели задается среда (например, обычные игры), функция вознаграждения и цель. Модель учится достигать цели методом проб и ошибок. Он выполнит действие, и функция вознаграждения сообщит ему, поможет ли это действие достичь главной цели. Затем модель обновляется, чтобы выполнить большее или меньшее количество этих действий. Модель может научиться достигать цели, делая это много раз.
Известный пример модели обучения с подкреплением — AlphaGo Zero. Эта модель была обучена побеждать в играх в го, и ей давалось только состояние доски для го. Затем он сыграл миллионы игр сам с собой, со временем узнавая, какие ходы дают ему преимущества, а какие нет. За 70 часов тренировок он достиг сверхчеловеческого уровня, превзойдя чемпионов мира по го.
Самостоятельное обучение
На самом деле существует пятый тип машинного обучения, который в последнее время стал важным: обучение с самоконтролем. Модели самообучения получают немаркированные данные, но учатся создавать метки на основе этих данных. Это лежит в основе моделей GPT, лежащих в основе ChatGPT. Во время обучения GPT модель стремится предсказать следующее слово по входной строке слов. Например, возьмем предложение «Кот сел на коврик». GPT дают «The» и просят предсказать, какое слово будет следующим. Он делает свое предсказание (скажем, «собака»), но, поскольку у него есть исходное предложение, он знает, какой правильный ответ: «кошка». Затем GPT дается «Кошка» и просится предсказать следующее слово и так далее. Таким образом, он может изучить статистические закономерности между словами и многое другое.
Приложения машинного обучения
Любая проблема или отрасль, в которой имеется много данных, могут использовать ML. Во многих отраслях это дало выдающиеся результаты, и постоянно возникают новые варианты использования. Вот некоторые распространенные случаи использования ML:
Письмо
ML моделирует мощные продукты для написания ИИ, такие как Grammarly. Благодаря обучению написанию большого количества отличных текстов, Grammarly может создать для вас черновик, помочь вам переписать и отшлифовать, а также вместе с вами провести мозговой штурм идей, и все это в предпочитаемом вами тоне и стиле.
Распознавание речи
Siri, Alexa и голосовая версия ChatGPT зависят от моделей ML. Эти модели обучаются на множестве аудиопримеров вместе с соответствующими правильными расшифровками. С помощью этих примеров модели могут превращать речь в текст. Без МО эта проблема была бы практически неразрешимой, поскольку у всех разные способы речи и произношения. Перечислить все возможности невозможно.
Рекомендации
За вашими лентами в TikTok, Netflix, Instagram и Amazon стоят модели рекомендаций ML. Эти модели обучены на многих примерах предпочтений (например, людям вроде вас этот фильм понравился больше того, этот продукт больше того продукта), чтобы показывать вам элементы и контент, которые вы хотите видеть. Со временем модели могут также учитывать ваши конкретные предпочтения, чтобы создать канал, который понравится именно вам.
Обнаружение мошенничества
Банки используют модели ОД для выявления случаев мошенничества с кредитными картами. Поставщики электронной почты используют модели машинного обучения для обнаружения и перенаправления спама. В моделях мошенничества с ОД приведено множество примеров фальсифицированных данных; затем эти модели изучают закономерности в данных, чтобы выявить мошенничество в будущем.
Беспилотные автомобили
Беспилотные автомобили используют машинное обучение для интерпретации и навигации по дорогам. ML помогает автомобилям идентифицировать пешеходов и полосы движения, прогнозировать движение других автомобилей и принимать решения об их следующих действиях (например, ускориться, перестроиться в другую полосу и т. д.). Беспилотные автомобили приобретают навыки, обучаясь на миллиардах примеров с использованием этих методов машинного обучения.
Преимущества машинного обучения
Если все сделано правильно, машинное обучение может привести к преобразованиям. Модели машинного обучения обычно могут сделать процессы дешевле, лучше или и то, и другое.
Эффективность затрат на рабочую силу
Обученные модели машинного обучения могут имитировать работу эксперта за небольшую плату. Например, человек-эксперт-риэлтор обладает отличной интуицией, когда речь идет о том, сколько стоит дом, но это может занять годы обучения. Нанимать опытных риэлторов (и экспертов любого рода) также дорого. Однако модель МО, обученная на миллионах примеров, может приблизиться к эффективности опытного риэлтора. Такую модель можно обучить за считанные дни, и ее использование после обучения будет стоить гораздо дешевле. Менее опытные риэлторы могут затем использовать эти модели, чтобы выполнить больше работы за меньшее время.
Эффективность времени
Модели машинного обучения не ограничены временем, как люди. AlphaGo Zero сыграла4,9 миллиона игрв го за три дня обучения . На это потребуются человеческие годы, если не десятилетия. Благодаря такой масштабируемости модель смогла исследовать широкий спектр движений и позиций го, что привело к сверхчеловеческим результатам. Модели машинного обучения могут даже уловить закономерности, которые упускают из виду эксперты; AlphaGo Zero даже нашла и использовала ходы, которые обычно не делают люди. Однако это не означает, что эксперты больше не ценны; Эксперты по Го стали намного лучше, используя такие модели, как AlphaGo, для опробования новых стратегий.
Недостатки машинного обучения
Конечно, у использования моделей ML есть и недостатки. А именно, их обучение дорогое, а их результаты нелегко объяснить.
Дорогое обучение
Обучение ML может оказаться дорогостоящим. Например, разработка AlphaGo Zero обошлась в 25 миллионов долларов, а разработка GPT-4 — более 100 миллионов долларов. Основные затраты на разработку моделей ML — это маркировка данных, затраты на оборудование и зарплата сотрудников.
Отличные модели контролируемого машинного обучения требуют миллионов помеченных примеров, каждый из которых должен быть помечен человеком. После того, как все метки собраны, для обучения модели потребуется специализированное оборудование. Графические процессоры (GPU) и тензорные процессоры (TPU) являются стандартом для оборудования ML, и их аренда или покупка могут быть дорогостоящими — покупка графических процессоров может стоить от тысяч до десятков тысяч долларов.
Наконец, для разработки отличных моделей машинного обучения необходимо нанимать исследователей или инженеров в области машинного обучения, которые могут требовать высоких зарплат благодаря своим навыкам и опыту.
Ограниченная ясность в принятии решений
Для многих моделей машинного обучения неясно, почему они дают такие результаты. AlphaGo Zero не может объяснить причины своего решения; он знает, что ход сработает в конкретной ситуации, но не знает,почему. Это может иметь серьезные последствия при использовании моделей машинного обучения в повседневных ситуациях. Модели машинного обучения, используемые в здравоохранении, могут давать неверные или предвзятые результаты, и мы можем не знать об этом, поскольку причина их результатов неясна. В целом, предвзятость является серьезной проблемой для моделей ML, а отсутствие объяснимости усложняет решение проблемы. Эти проблемы особенно касаются моделей глубокого обучения. Модели глубокого обучения — это модели машинного обучения, которые используют многоуровневые нейронные сети для обработки входных данных. Они способны обрабатывать более сложные данные и вопросы.
С другой стороны, более простые и «поверхностные» модели машинного обучения (такие как деревья решений и модели регрессии) не страдают теми же недостатками. Им по-прежнему требуется много данных, но в противном случае их обучение обходится дешево. Они также более объяснимы. Обратной стороной является то, что полезность таких моделей может быть ограничена; продвинутые приложения, такие как GPT, требуют более сложных моделей.
Будущее машинного обучения
Модели машинного обучения на основе трансформаторов были в моде последние несколько лет. Это конкретный тип модели ML, лежащий в основе GPT (буква T в GPT), Grammarly и Claude AI. Модели машинного обучения на основе диффузии, которые используются в таких продуктах для создания изображений, как DALL-E и Midjourney, также привлекли внимание.
Эта тенденция, похоже, не изменится в ближайшее время. Компании, занимающиеся машинным обучением, сосредоточены на увеличении размера своих моделей — более крупных моделей с лучшими возможностями и большими наборами данных для их обучения. Например, GPT-4 имел в 10 раз больше параметров модели, чем GPT-3. Вероятно, мы увидим, что еще больше отраслей используют генеративный искусственный интеллект в своих продуктах для создания персонализированного опыта для пользователей.
Робототехника также набирает обороты. Исследователи используют машинное обучение для создания роботов, которые могут перемещать и использовать объекты, как люди. Эти роботы могут экспериментировать в своей среде и использовать обучение с подкреплением, чтобы быстро адаптироваться и достигать своих целей, например, как бить футбольный мяч.
Однако по мере того, как модели ОД становятся все более мощными и распространенными, возникают опасения по поводу их потенциального воздействия на общество. Такие вопросы, как предвзятость, конфиденциальность и увольнение, горячо обсуждаются, и растет признание необходимости этических принципов и практики ответственного развития.
Заключение
Машинное обучение — это подмножество искусственного интеллекта, явной целью которого является создание интеллектуальных систем, позволяющих им учиться на данных. Контролируемое, неконтролируемое, полуконтролируемое обучение и обучение с подкреплением являются основными типами МО (наряду с самоконтролируемым обучением). Машинное обучение лежит в основе многих новых продуктов, появляющихся сегодня, таких как ChatGPT, беспилотные автомобили и рекомендации Netflix. Это может быть дешевле или лучше, чем действия человека, но в то же время изначально оно дорогое, менее объяснимое и управляемое. Машинное обучение также станет еще более популярным в ближайшие несколько лет.
В машинном обучении много сложностей, и возможности учиться и вносить свой вклад в эту область расширяются. В частности, руководства Grammarly по искусственному интеллекту, глубокому обучению и ChatGPT помогут вам узнать больше о других важных частях этой области. Кроме того, изучение деталей МО (например, того, как собираются данные, как на самом деле выглядят модели и алгоритмы «обучения») может помочь вам эффективно включить его в свою работу.
Поскольку ML продолжает расти и ожидается, что оно затронет почти все отрасли, сейчас самое время начать свой путь в ML!