機器學習 101:它是什麼以及它如何運作
已發表: 2024-05-23機器學習 (ML) 已迅速成為當今時代最重要的技術之一。 它是 ChatGPT、Netflix 推薦、自動駕駛汽車和電子郵件垃圾郵件過濾器等產品的基礎。 為了幫助您了解這種普遍存在的技術,本指南介紹了 ML 是什麼(以及不是什麼)、它的工作原理及其影響。
目錄
- 什麼是機器學習?
- 機器學習的工作原理
- 機器學習的類型
- 應用領域
- 優點
- 缺點
- 機器學習的未來
- 結論
什麼是機器學習?
要了解機器學習,我們必須先了解人工智慧(AI)。 儘管兩者可以互換使用,但它們並不相同。 人工智慧既是一個目標,也是一個研究領域。 目標是建構能夠在人類(甚至超人)層次上思考和推理的電腦系統。 人工智慧還包括許多不同的方法來實現這一目標。 機器學習是這些方法之一,使其成為人工智慧的子集。
機器學習特別注重使用數據和統計來實現人工智慧。 目標是創建智慧系統,該系統可以透過輸入大量範例(資料)來學習,並且不需要明確程式設計。 有了足夠的數據和良好的學習演算法,電腦就能識別數據中的模式並提高其效能。
相較之下,人工智慧的非機器學習方法不依賴數據,並且寫入了硬編碼邏輯。 ,但仍有可能)。 然而,對國際象棋人工智慧機器人進行硬編碼是不可能的——可能的國際象棋遊戲比宇宙中的原子還要多。 在這種情況下,機器學習會發揮更好的作用。
機器學習的工作原理
在任何 ML 系統中,您都需要三樣東西:資料集、ML 模型(GPT 就是一個範例)和訓練演算法。 首先,您傳入資料集中的範例。 然後,模型會預測該範例的正確輸出。 如果模型錯誤,您可以使用訓練演算法使模型更有可能適用於將來的類似範例。 您可以重複此過程,直到您用完數據或對結果感到滿意為止。 完成此過程後,您可以使用模型來預測未來的資料。
此過程的一個基本範例是教導電腦識別如下所示的手寫數字。
來源
您收集了數千或數十萬張數位圖片。 您從尚未看到任何範例的 ML 模型開始。 您將圖像輸入模型並要求它預測圖像中的數字。 它將傳回 0 到 9 之間的數字,例如 1。 然後,你本質上告訴它,“這個數字實際上是五,而不是一。” 訓練演算法會更新模型,因此下次更有可能回應 5。 您對(幾乎)所有可用圖片重複此過程,理想情況下,您擁有一個表現良好的模型,可以在 90% 的時間內正確識別數字。 現在,您可以使用此模型以比人類更快的速度大規模讀取數百萬位數。 在實踐中,美國郵政服務使用機器學習模型來讀取 98% 的手寫地址。
您可能會花費數月或數年的時間來剖析此流程的細節,即使是一小部分(看看有多少不同版本的最佳化演算法)。
機器學習的常見類型
其實有四種不同類型的機器學習方法:監督式、無監督式、半監督式和強化式。 主要區別在於數據的標記方式(即有或沒有正確答案)。
監督學習
監督學習模型被賦予標記資料(有正確答案)。 手寫數字的例子就屬於這一類:我們可以告訴模型,“五是正確的答案。” 該模型旨在學習輸入和輸出之間的明確聯繫。 這些模型可以輸出離散標籤(例如,根據寵物圖像預測「貓」或「狗」)或數字(例如,根據床、浴室、位置等的數量預測房屋的價格) 。
無監督學習
無監督學習模型給出未標記的數據(沒有正確答案)。 這些模型識別輸入資料中的模式以對資料進行有意義的分組。 例如,給定許多沒有正確答案的貓和狗圖像,無監督機器學習模型會查看圖像中的相似性和差異,以將狗和貓圖像分組在一起。 聚類、關聯規則和降維是無監督機器學習的核心方法。
半監督學習
半監督學習是一種介於監督學習和無監督學習之間的機器學習方法。 該方法提供了大量的未標記資料和較小的標記資料集來訓練模型。 首先,模型在標記資料上進行訓練,然後透過比較未標記資料與標記資料的相似度來為未標記資料分配標籤。
強化學習
強化學習沒有一組給定的範例和標籤。 相反,模型被賦予一個環境(例如,遊戲是常見的)、獎勵函數和目標。 該模型透過反覆試驗來學習實現目標。 它將執行一項操作,獎勵函數會告訴它該操作是否有助於實現整體目標。 然後,模型會更新自身以執行或多或少的該操作。 該模型可以透過多次執行此操作來學習實現目標。
強化學習模型的一個著名例子是 AlphaGo Zero。 該模型經過訓練以贏得圍棋比賽,並且只給出了圍棋棋盤的狀態。 然後,它與自己進行了數百萬場比賽,隨著時間的推移,它學習哪些動作給它帶來了優勢,哪些動作沒有。 它在 70 小時的訓練中取得了超人的表現,超越了圍棋世界冠軍。
自我監督學習
實際上,第五種類型的機器學習最近變得非常重要:自我監督學習。 自監督學習模型會獲得未標記的數據,但會學習根據這些數據建立標籤。 這是 ChatGPT 背後的 GPT 模型的基礎。 在 GPT 訓練期間,模型的目標是在給定輸入單字字串的情況下預測下一個單字。 例如,以「貓坐在墊子上」這句話為例。 GPT 被給予“The”,並被要求預測接下來出現的單字是什麼。 它做出預測(例如“狗”),但由於它有原始句子,它知道正確的答案是什麼:“貓”。 然後,GPT 被賦予“The cat”並要求預測下一個單詞,依此類推。 透過這樣做,它可以學習單字之間的統計模式等等。
機器學習的應用
任何擁有大量數據的問題或行業都可以使用機器學習。 許多行業都看到了這樣做的非凡成果,並且更多的用例不斷出現。 以下是機器學習的一些常見用例:
寫作
ML 模型為 Grammarly 等生成式 AI 寫作產品提供了動力。 透過接受大量優秀寫作的培訓,Grammarly 可以為您創建草稿,幫助您重寫和潤色,並與您一起集思廣益,所有這些都以您喜歡的語氣和風格進行。
語音辨識
Siri、Alexa 和 ChatGPT 的語音版本都依賴 ML 模型。 這些模型經過許多音訊範例以及相應的正確轉錄本的訓練。 透過這些範例,模型可以將語音轉換為文字。 如果沒有機器學習,這個問題幾乎會變得棘手,因為每個人都有不同的說話和發音方式。 不可能列舉所有的可能性。
建議
TikTok、Netflix、Instagram 和 Amazon 上的動態背後都是 ML 推薦模型。 這些模型經過許多偏好範例的訓練(例如,像您這樣的人喜歡這部電影而不是那部電影,喜歡這個產品而不是那個產品),以向您展示您想要查看的項目和內容。 隨著時間的推移,這些模型還可以結合您的具體偏好來創建對您特別有吸引力的提要。
詐欺識別
銀行使用機器學習模型來偵測信用卡詐欺。 電子郵件提供者使用機器學習模型來偵測和轉移垃圾郵件。 詐欺 ML 模型給出了許多詐欺資料的範例; 然後,這些模型學習資料中的模式,以識別未來的詐欺行為。
自動駕駛汽車
自動駕駛汽車使用機器學習來解釋和導航道路。 機器學習幫助汽車識別行人和道路車道,預測其他汽車的移動,並決定他們的下一步(例如加速、變換車道等)。 自動駕駛汽車透過使用這些機器學習方法對數十億個範例進行訓練來獲得熟練程度。
機器學習的優點
如果做得好,機器學習可以帶來改變。 機器學習模型通常可以使流程更便宜、更好或兩者兼而有之。
勞動成本效率
經過訓練的機器學習模型可以以一小部分成本模擬專家的工作。 例如,人類專家房地產經紀人對於房屋的價格有很強的直覺,但這可能需要多年的培訓。 聘請專業房地產經紀人(以及任何類型的專家)的成本也很高。 然而,經過數百萬個範例訓練的機器學習模型可能會更接近專業房地產經紀人的表現。 這樣的模型可以在幾天內完成訓練,一旦訓練完成,使用成本就會低得多。 經驗不足的房地產經紀人可以使用這些模型在更短的時間內完成更多的工作。
時間效率
機器學習模型不像人類那樣受時間限制。 AlphaGo Zero在三天的訓練中下了490 萬盤圍棋。 人類需要數年甚至數十年才能做到這一點。 由於這種可擴展性,該模型能夠探索各種圍棋走法和走法,從而實現超人的表現。 機器學習模型甚至可以發現專家錯過的模式; AlphaGo Zero 甚至發現並使用了人類通常不會下的棋法。 但這並不意味著專家不再有價值。 透過使用 AlphaGo 等模型來嘗試新策略,圍棋專家已經進步很多。
機器學習的缺點
當然,使用機器學習模型也有缺點。 也就是說,它們的訓練成本很高,而且它們的結果也不容易解釋。
培訓費用昂貴
機器學習培訓可能會變得昂貴。 例如,AlphaGo Zero的開發成本為2,500萬美元,GPT-4的開發成本超過1億美元。 開發機器學習模型的主要成本是資料標記、硬體費用和員工薪資。
優秀的監督機器學習模型需要數百萬個標記範例,每個範例都必須由人類標記。 收集完所有標籤後,需要專門的硬體來訓練模型。 圖形處理單元 (GPU) 和張量處理單元 (TPU) 是 ML 硬體的標準,租用或購買可能會很昂貴 - GPU 的購買成本可能在數千到數萬美元之間。
最後,開發優秀的機器學習模型需要聘請機器學習研究人員或工程師,由於他們的技能和專業知識,他們可以要求高薪。
決策的清晰度有限
對於許多機器學習模型來說,尚不清楚它們為何會給出這樣的結果。 AlphaGo Zero無法解釋其決策背後的原因; 它知道某項舉措在特定情況下會起作用,但不知道為什麼。 當機器學習模型在日常情況下使用時,這可能會產生重大後果。 醫療保健中使用的機器學習模型可能會給出不正確或偏差的結果,而我們可能不知道這一點,因為其結果背後的原因是不透明的。 一般來說,偏差是機器學習模型的一個巨大問題,而缺乏可解釋性使得問題更難解決。 這些問題尤其適用於深度學習模型。 深度學習模型是使用多層神經網路來處理輸入的機器學習模型。 他們能夠處理更複雜的數據和問題。
另一方面,更簡單、更「淺」的機器學習模型(例如決策樹和迴歸模型)不會遇到相同的缺點。 它們仍然需要大量數據,但以其他方式進行訓練的成本較低。 它們也更容易解釋。 缺點是此類模型的實用性可能受到限制。 GPT 等高階應用程式需要更複雜的模型。
機器學習的未來
基於 Transformer 的 ML 模型在過去幾年中風靡一時。 這是為 GPT(GPT 中的 T)、Grammarly 和 Claude AI 提供支援的特定 ML 模型類型。 基於擴散的 ML 模型為 DALL-E 和 Midjourney 等影像創建產品提供支持,也受到了關注。
這種趨勢似乎不會很快改變。 機器學習公司專注於增加模型的規模——更大的模型具有更好的功能和更大的資料集來訓練它們。 例如,GPT-4 的模型參數數量是 GPT-3 的 10 倍。 我們可能會看到更多產業在其產品中使用生成式人工智慧,為用戶創造個人化體驗。
機器人技術也在升溫。 研究人員正在使用機器學習來創建可以像人類一樣移動和使用物體的機器人。 這些機器人可以在他們的環境中進行實驗,並使用強化學習來快速適應並實現他們的目標,例如,如何踢足球。
然而,隨著機器學習模型變得更加強大和普遍,人們擔心它們對社會的潛在影響。 偏見、隱私和工作替代等問題正在引起激烈爭論,人們越來越認識到道德準則和負責任的開發實踐的必要性。
結論
機器學習是人工智慧的一個子集,其明確目標是透過讓系統從資料中學習來創建智慧系統。 監督學習、無監督學習、半監督式學習和強化學習(以及自我監督學習)是 ML 的主要類型。 ML 是當今推出的許多新產品的核心,例如 ChatGPT、自動駕駛汽車和 Netflix 推薦。 它可能比人類的表現更便宜或更好,但同時,它最初的成本很高,而且難以解釋和操縱。 機器學習也有望在未來幾年變得更加流行。
機器學習有很多複雜之處,學習和為該領域做出貢獻的機會正在增加。 特別是,Grammarly 關於 AI、深度學習和 ChatGPT 的指南可以幫助您更了解該領域的其他重要部分。 除此之外,深入了解 ML 的細節(例如資料如何收集、模型實際是什麼樣子以及「學習」背後的演算法)可以幫助您將其有效地融入您的工作中。
隨著 ML 的不斷發展,並且預計它將觸及幾乎所有行業,現在是開始您的 ML 之旅的時候了!