訓練是機器學習的核心, 其具體做法有三種
監督式學習(supervised learning)
用大量的資料來訓練模型,每筆資料都搭配一個標準答案(又稱teaching data) ,
模型的預測結果會和標準答案做比對,以修正模型參數,進而達成學 習效果。
迴歸(regression)模型:
輸出值 為連續變化的數值,例如預測商店的每日銷售額;
分類(classification)模型:
輸出值 為離散值,稱為「類別(class)」, 例如辨別照片中的動 物是甚麼種類。
非監督式學習(unsupervised learning)
只提供訓練資料,不提供標準答案,讓模型自行摸索出資料的規則
並產生預 測(答案)的訓練法。
例如:僅根據資料的特性,將資料自動分組的「分群 (clustering)」
便是一種典型的非監督式學習。
強化式學習(reinforcement learning)
沒有 訓練資料與標準答案,讓機器從與環境 互動中去學習,
進而擬定行動對 策。
由於沒有已知的大量資料,適合用於探索未知的領域。
在學習中,藉由 犯錯給予處罰,未犯錯給予獎勵的方式,讓機器去探索出
正確的答案。例如: 打敗棋王的AlphaGo