머신러닝 101: 정의 및 작동 방식
게시 됨: 2024-05-23머신러닝(ML)은 우리 시대의 가장 중요한 기술 중 하나로 빠르게 자리 잡았습니다. ChatGPT, Netflix 추천, 자율주행차, 이메일 스팸 필터와 같은 제품의 기반이 됩니다. 이 널리 퍼진 기술을 이해하는 데 도움이 되도록 이 가이드에서는 ML이 무엇인지(그리고 ML이 아닌지), 작동 방식 및 영향을 다룹니다.
목차
- 머신러닝이란 무엇인가요?
- 머신러닝 작동 방식
- 머신러닝의 종류
- 응용
- 장점
- 단점
- ML의 미래
- 결론
머신러닝이란 무엇인가요?
머신러닝을 이해하려면 먼저 인공지능(AI)을 이해해야 합니다. 이 둘은 서로 바꿔서 사용되지만 동일하지는 않습니다. 인공지능은 목표이자 연구 분야이다. 목표는 인간(또는 초인적) 수준에서 생각하고 추론할 수 있는 컴퓨터 시스템을 구축하는 것입니다. AI는 또한 거기에 도달하기 위한 다양한 방법으로 구성됩니다. 머신러닝은 이러한 방법 중 하나로 인공지능의 하위 집합입니다.
머신러닝은 특히 AI를 추구하기 위해 데이터와 통계를 사용하는 데 중점을 둡니다. 목표는 수많은 예제(데이터)를 제공하여 학습할 수 있고 명시적으로 프로그래밍할 필요가 없는 지능형 시스템을 만드는 것입니다. 충분한 데이터와 좋은 학습 알고리즘이 있으면 컴퓨터는 데이터의 패턴을 포착하고 성능을 향상시킵니다.
이와 대조적으로 AI에 대한 비ML 접근 방식은 데이터에 의존하지 않으며 하드코딩된 논리를 가지고 있습니다. 예를 들어 모든 최적의 동작을 코딩하기만 하면 초인적인 성능을 갖춘 tic-tac-toe AI 봇을 만들 수 있습니다. 255,168개의 tic-tac-toe 게임이 가능하므로 시간이 좀 걸리겠지만 여전히 가능합니다. 하지만 체스 AI 봇을 하드코딩하는 것은 불가능합니다. 우주에는 원자보다 가능한 체스 게임이 더 많습니다. ML은 이러한 경우에 더 잘 작동합니다.
이 시점에서 합리적인 질문은 예를 제공할 때 컴퓨터가 정확히 얼마나 향상되는가입니다.
머신러닝 작동 방식
모든 ML 시스템에는 데이터세트, ML 모델(예: GPT), 학습 알고리즘이라는 세 가지가 필요합니다. 먼저 데이터세트의 예시를 전달합니다. 그런 다음 모델은 해당 예에 대한 올바른 출력을 예측합니다. 모델이 잘못된 경우 훈련 알고리즘을 사용하여 향후 유사한 예에 대해 모델이 더 적합할 가능성을 높입니다. 데이터가 부족하거나 결과에 만족할 때까지 이 프로세스를 반복합니다. 이 프로세스를 완료하면 모델을 사용하여 향후 데이터를 예측할 수 있습니다.
이 프로세스의 기본적인 예는 아래와 같이 손으로 쓴 숫자를 인식하도록 컴퓨터를 가르치는 것입니다.
원천
수천, 수십만 장의 숫자 사진을 수집합니다. 아직 예시를 본 적이 없는 ML 모델로 시작합니다. 모델에 이미지를 입력하고 이미지에 어떤 숫자가 있다고 생각하는지 예측하도록 요청합니다. 0에서 9 사이의 숫자(예: 1)를 반환합니다. 그런 다음 본질적으로 "이 숫자는 1이 아니라 5입니다."라고 말합니다. 훈련 알고리즘이 모델을 업데이트하므로 다음 번에 5로 응답할 가능성이 더 높습니다. 사용 가능한 (거의) 모든 사진에 대해 이 프로세스를 반복하면 이상적으로는 90%의 시간 동안 숫자를 정확하게 인식할 수 있는 성능이 뛰어난 모델을 갖게 됩니다. 이제 이 모델을 사용하여 인간이 할 수 있는 것보다 더 빠르게 수백만 자릿수를 읽을 수 있습니다. 실제로 미국 우체국에서는 ML 모델을 사용하여 손으로 쓴 주소의 98%를 읽습니다.
이 프로세스의 작은 부분이라도 세부 사항을 분석하는 데 몇 달 또는 몇 년이 걸릴 수 있습니다(최적화 알고리즘의 버전이 얼마나 많은지 살펴보십시오).
일반적인 유형의 기계 학습
실제로 기계 학습 방법에는 감독, 비지도, 준지도, 강화의 네 가지 유형이 있습니다. 주요 차이점은 데이터에 라벨이 지정되는 방식입니다(예: 정답이 있거나 없음).
지도 학습
지도 학습 모델에는 라벨이 지정된 데이터(정답 포함)가 제공됩니다. 손으로 쓴 숫자의 예가 이 범주에 속합니다. 모델에게 "5가 정답입니다"라고 알릴 수 있습니다. 모델은 입력과 출력 사이의 명시적인 연결을 학습하는 것을 목표로 합니다. 이러한 모델은 개별 라벨(예: 애완동물 이미지를 바탕으로 '고양이' 또는 '개' 예측) 또는 숫자(예: 침대, 욕실, 위치 등을 고려하여 예상되는 주택 가격)를 출력할 수 있습니다. .
비지도 학습
비지도 학습 모델에는 레이블이 지정되지 않은 데이터(정답 없음)가 제공됩니다. 이러한 모델은 입력 데이터의 패턴을 식별하여 데이터를 의미 있게 그룹화합니다. 예를 들어, 정답이 없는 많은 고양이와 개의 이미지가 있는 경우 비지도 ML 모델은 이미지의 유사점과 차이점을 조사하여 개와 고양이 이미지를 함께 그룹화합니다. 클러스터링, 연관 규칙 및 차원 축소는 비지도 ML의 핵심 방법입니다.
준지도 학습
준지도 학습(Semi-supervised learning)은 지도 학습과 비지도 학습 사이에 있는 기계 학습 접근 방식입니다. 이 방법은 모델 학습을 위해 상당한 양의 레이블이 지정되지 않은 데이터와 더 작은 레이블이 지정된 데이터 세트를 제공합니다. 먼저 모델은 레이블이 지정된 데이터에 대해 교육을 받은 다음 레이블이 지정된 데이터와의 유사성을 비교하여 레이블이 지정되지 않은 데이터에 레이블을 할당합니다.
강화 학습
강화 학습에는 주어진 예시와 라벨 세트가 없습니다. 대신, 모델에는 환경(예: 게임은 일반적인 게임), 보상 기능 및 목표가 제공됩니다. 모델은 시행착오를 통해 목표를 달성하는 방법을 학습합니다. 이는 작업을 수행하고 보상 기능은 해당 작업이 중요한 목표를 달성하는 데 도움이 되는지 알려줍니다. 그런 다음 모델은 해당 작업을 더 많거나 적게 수행하도록 자체적으로 업데이트됩니다. 모델은 이 작업을 여러 번 수행하여 목표를 달성하는 방법을 학습할 수 있습니다.
강화학습 모델의 유명한 예로는 AlphaGo Zero가 있습니다. 이 모델은 바둑 게임에서 승리하도록 훈련되었으며 바둑판의 상태만 제공되었습니다. 그런 다음 수백만 번의 게임을 자신과 비교하여 시간이 지남에 따라 어떤 동작이 이점을 제공하고 어떤 동작이 그렇지 않은지 학습했습니다. 70시간의 훈련으로 바둑 세계 챔피언을 능가하는 초인적인 수준의 성능을 달성했습니다.
자기 지도 학습
실제로 최근 중요해진 다섯 번째 유형의 기계 학습이 있습니다. 바로 자기 지도 학습입니다. 자기 지도 학습 모델에는 레이블이 지정되지 않은 데이터가 제공되지만 이 데이터에서 레이블을 만드는 방법을 학습합니다. 이는 ChatGPT의 GPT 모델의 기초가 됩니다. GPT 훈련 중에 모델은 입력된 단어 문자열을 바탕으로 다음 단어를 예측하는 것을 목표로 합니다. 예를 들어, "The cat sat on the mat."라는 문장을 생각해 보세요. GPT에는 "The"가 주어지고 다음에 어떤 단어가 나올지 예측하라는 요청을 받습니다. 예측(예: "개")을 하지만 원래 문장이 있으므로 정답인 "고양이"가 무엇인지 알고 있습니다. 그런 다음 GPT에 'The cat'이 주어지고 다음 단어를 예측하라는 요청을 받습니다. 이를 통해 단어 간의 통계적 패턴 등을 학습할 수 있습니다.
머신러닝의 응용
데이터가 많은 문제나 산업에는 ML을 사용할 수 있습니다. 많은 업계에서는 이를 통해 놀라운 결과를 얻었으며 더 많은 사용 사례가 지속적으로 발생하고 있습니다. ML의 몇 가지 일반적인 사용 사례는 다음과 같습니다.
글쓰기
ML 모델은 Grammarly와 같은 생성적 AI 쓰기 제품을 지원합니다. 많은 양의 훌륭한 글쓰기에 대한 훈련을 통해 Grammarly는 귀하를 위한 초안을 만들고, 귀하가 선호하는 어조와 스타일로 다시 작성하고 다듬는 데 도움을 주며, 귀하와 함께 아이디어를 브레인스토밍할 수 있습니다.
음성 인식
Siri, Alexa 및 ChatGPT의 음성 버전은 모두 ML 모델에 따라 다릅니다. 이러한 모델은 해당하는 올바른 대본과 함께 많은 오디오 예제를 통해 훈련되었습니다. 이러한 예를 통해 모델은 음성을 텍스트로 바꿀 수 있습니다. ML이 없으면 사람마다 말하고 발음하는 방식이 다르기 때문에 이 문제는 거의 해결하기 어려울 것입니다. 모든 가능성을 열거하는 것은 불가능할 것입니다.
권장 사항
TikTok, Netflix, Instagram 및 Amazon의 피드 뒤에는 ML 추천 모델이 있습니다. 이러한 모델은 귀하가 보고 싶은 항목과 콘텐츠를 보여주기 위해 선호도(예: 사람들이 해당 영화보다 이 영화를 좋아하고, 해당 제품보다 이 제품을 좋아함)에 대한 다양한 예를 바탕으로 훈련되었습니다. 시간이 지남에 따라 모델은 귀하의 특정 선호도를 통합하여 귀하에게 특히 매력적인 피드를 생성할 수도 있습니다.
사기 탐지
은행에서는 ML 모델을 사용하여 신용카드 사기를 감지합니다. 이메일 제공업체는 ML 모델을 사용하여 스팸 이메일을 감지하고 우회합니다. 사기 ML 모델에는 사기성 데이터의 많은 예가 제공됩니다. 그런 다음 이러한 모델은 데이터 간의 패턴을 학습하여 향후 사기를 식별합니다.
자율주행자동차
자율주행차는 ML을 사용해 도로를 해석하고 탐색합니다. ML은 자동차가 보행자와 도로 차선을 식별하고, 다른 자동차의 움직임을 예측하고, 다음 조치(예: 속도 높이기, 차선 전환 등)를 결정하는 데 도움이 됩니다. 자율주행차는 이러한 ML 방법을 사용하여 수십억 개의 사례를 학습함으로써 숙련도를 얻습니다.
머신러닝의 장점
잘 수행되면 ML은 혁신을 가져올 수 있습니다. ML 모델은 일반적으로 프로세스를 더 저렴하게, 더 좋게 만들거나 두 가지 모두를 수행할 수 있습니다.
인건비 효율성
훈련된 ML 모델은 적은 비용으로 전문가의 작업을 시뮬레이션할 수 있습니다. 예를 들어, 인간 전문 부동산 중개업자는 집값이 얼마인지에 대해 뛰어난 직관력을 갖고 있지만 이를 위해서는 수년간의 훈련이 필요할 수 있습니다. 전문 부동산 중개인(및 모든 종류의 전문가)도 고용하는 데 비용이 많이 듭니다. 그러나 수백만 개의 사례를 학습한 ML 모델은 전문 부동산 중개인의 성능에 더 가까워질 수 있습니다. 이러한 모델은 며칠 만에 훈련할 수 있으며 일단 훈련되면 사용 비용이 훨씬 저렴해집니다. 경험이 부족한 부동산 중개인은 이러한 모델을 사용하여 더 짧은 시간에 더 많은 작업을 수행할 수 있습니다.
시간 효율성
ML 모델은 인간과 같은 방식으로 시간의 제약을 받지 않습니다. AlphaGo Zero는 3일간의 훈련 동안490만 개의바둑 게임을 플레이했습니다. 이 작업을 수행하는 데는 수십 년은 아니더라도 인간이 수년이 걸릴 것입니다. 이러한 확장성으로 인해 모델은 다양한 바둑 동작과 위치를 탐색할 수 있었고 초인적인 성능을 발휘할 수 있었습니다. ML 모델은 전문가가 놓친 패턴도 포착할 수 있습니다. AlphaGo Zero는 일반적으로 인간이 사용하지 않는 동작을 찾아 사용하기도 했습니다. 그렇다고 전문가가 더 이상 가치가 없다는 의미는 아닙니다. 바둑 전문가들은 AlphaGo와 같은 모델을 사용하여 새로운 전략을 시도함으로써 훨씬 더 발전했습니다.
머신러닝의 단점
물론 ML 모델을 사용하는 데에는 단점도 있습니다. 즉, 훈련 비용이 많이 들고 결과를 쉽게 설명할 수 없습니다.
비싼 훈련
ML 학습에는 비용이 많이 들 수 있습니다. 예를 들어 AlphaGo Zero의 개발 비용은 2,500만 달러이고, GPT-4의 개발 비용은 1억 달러가 넘습니다. ML 모델 개발에 소요되는 주요 비용은 데이터 라벨링, 하드웨어 비용, 직원 급여입니다.
뛰어난 지도 ML 모델에는 수백만 개의 라벨이 지정된 예시가 필요하며 각 예시에는 사람이 라벨을 지정해야 합니다. 모든 라벨이 수집되면 모델을 교육하기 위해 특수 하드웨어가 필요합니다. GPU(그래픽 처리 장치) 및 TPU(텐서 처리 장치)는 ML 하드웨어의 표준이며 임대 또는 구입 비용이 비쌀 수 있습니다. GPU 구입 비용은 수천 달러에서 수만 달러에 이를 수 있습니다.
마지막으로 우수한 ML 모델을 개발하려면 기술과 전문 지식으로 인해 높은 급여를 요구할 수 있는 기계 학습 연구원이나 엔지니어를 고용해야 합니다.
의사결정의 명확성이 제한됨
많은 ML 모델의 경우, 그러한 결과를 제공하는 이유가 불분명합니다. AlphaGo Zero는 의사 결정의 이유를 설명할 수 없습니다. 특정 상황에서는 동작이 작동할 것이라는 점은 알지만그 이유는 알 수 없습니다. 이는 ML 모델을 일상적인 상황에서 사용할 때 심각한 결과를 초래할 수 있습니다. 의료 분야에 사용되는 ML 모델은 부정확하거나 편향된 결과를 제공할 수 있으며, 결과 이면의 이유가 불투명하기 때문에 우리가 이를 알지 못할 수도 있습니다. 일반적으로 편향은 ML 모델에서 큰 문제이며, 설명 가능성이 부족하면 문제를 해결하기가 더 어려워집니다. 이러한 문제는 특히 딥러닝 모델에 적용됩니다. 딥 러닝 모델은 다층 신경망을 사용하여 입력을 처리하는 ML 모델입니다. 그들은 더 복잡한 데이터와 질문을 처리할 수 있습니다.
반면에 더 간단하고 "얕은" ML 모델(예: 의사결정 트리 및 회귀 모델)에는 동일한 단점이 발생하지 않습니다. 여전히 많은 데이터가 필요하지만 그렇지 않으면 훈련하는 데 비용이 저렴합니다. 또한 더 설명하기 쉽습니다. 단점은 그러한 모델의 유용성이 제한될 수 있다는 것입니다. GPT와 같은 고급 애플리케이션에는 더 복잡한 모델이 필요합니다.
머신러닝의 미래
Transformer 기반 ML 모델은 지난 몇 년 동안 큰 인기를 끌었습니다. 이는 GPT(GPT의 T), Grammarly 및 Claude AI를 지원하는 특정 ML 모델 유형입니다. DALL-E, Midjourney 등 이미지 생성 제품을 구동하는 확산 기반 ML 모델도 주목을 받았습니다.
이러한 추세는 조만간 바뀔 것 같지 않습니다. ML 회사는 모델의 크기를 늘리는 데 중점을 두고 있습니다. 즉, 더 나은 기능과 훈련할 더 큰 데이터 세트를 갖춘 더 큰 모델입니다. 예를 들어 GPT-4는 GPT-3보다 모델 매개변수 수가 10배 더 많았습니다. 우리는 더 많은 산업에서 제품에 생성 AI를 사용하여 사용자를 위한 개인화된 경험을 만드는 것을 보게 될 것입니다.
로봇공학도 가열되고 있다. 연구자들은 ML을 사용하여 인간과 같은 물체를 움직이고 사용할 수 있는 로봇을 만들고 있습니다. 이러한 로봇은 환경에서 실험하고 강화 학습을 사용하여 빠르게 적응하고 목표(예: 축구공을 차는 방법)를 달성할 수 있습니다.
그러나 ML 모델이 더욱 강력해지고 널리 보급됨에 따라 사회에 미칠 잠재적 영향에 대한 우려가 있습니다. 편견, 개인정보 보호, 직업 대체와 같은 문제가 뜨거운 논의를 받고 있으며, 윤리적 지침과 책임 있는 개발 관행의 필요성에 대한 인식이 높아지고 있습니다.
결론
머신러닝은 AI의 하위 집합으로, 데이터를 통해 학습함으로써 지능형 시스템을 만드는 것이 명시적인 목표입니다. 지도 학습, 비지도 학습, 준지도 학습, 강화 학습이 ML의 주요 유형입니다(자기 지도 학습과 함께). ML은 ChatGPT, 자율주행차, Netflix 추천 등 오늘날 출시되는 많은 신제품의 핵심입니다. 인간의 성능보다 저렴하거나 더 나을 수 있지만, 동시에 초기에는 비용이 많이 들고 설명하기 어렵고 조종하기 어렵습니다. ML은 또한 향후 몇 년 동안 더욱 인기를 끌 것으로 예상됩니다.
ML에는 복잡한 부분이 많으며 해당 분야를 배우고 기여할 수 있는 기회가 확대되고 있습니다. 특히 AI, 딥 러닝 및 ChatGPT에 대한 Grammarly의 가이드는 이 분야의 다른 중요한 부분에 대해 자세히 배우는 데 도움이 될 수 있습니다. 그 외에도 ML의 세부 사항(예: 데이터 수집 방법, 모델의 실제 모습, '학습' 이면의 알고리즘)을 파악하면 ML을 작업에 효과적으로 통합하는 데 도움이 될 수 있습니다.
ML이 지속적으로 성장하고 거의 모든 산업에 영향을 미칠 것이라는 기대를 갖고 있는 지금, ML 여정을 시작할 때입니다!