2025年6月19日 星期四

2025 06 20 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 訓練是機器學習的核心, 其具體做法有三種 監督式學習(supervised learning) 非監督式學習(unsupervised learning) 強化式學習(reinforcement learning)

訓練是機器學習的核心, 其具體做法有三種


監督式學習(supervised learning) 

 用大量的資料來訓練模型每筆資料都搭配一個標準答案(又稱teaching data)

     模型的預測結果會和標準答案做比對,以修正模型參數,進而達成學 習效果。 

 迴歸(regression)模型: 

     輸出值 為連續變化的數值,例如預測商店的每日銷售額; 

  分類(classification)模型: 

     輸出值 為離散值,稱為「類別(class)」, 例如辨別照片中的動 物是甚麼種類

 

非監督式學習(unsupervised learning)

  只提供訓練資料,不提供標準答案,讓模型自行摸索出資料的規則

     並產生預 測(答案)的訓練法。

      例如:僅根據資料的特性,將資料自動分組的「分群 (clustering)

                便是一種典型的非監督式學習。


 強化式學習(reinforcement learning) 

  沒有   訓練資料與標準答案,讓機器從與環境  互動中去學習,

     進而擬定行動對 策。

     由於沒有已知的大量資料適合用於探索未知的領域。

    在學習中,藉由 犯錯給予處罰未犯錯給予獎勵的方式,讓機器去探索出

    正確的答案。例如: 打敗棋王的AlphaGo