機器學習 的 分類 與演算法
監督式學習(Supervised Learning)
透過 已標記 的 資料 訓練模型。
常見演算法:
1.線性迴歸(Linear Regression):
解決 連續性 資料 預測。
2.支持向量機(SVM):
利用 超平面 來進行 分類。
3.決策樹(Decision Tree):
透過 樹狀結構 進行 分 類 或 迴 歸。
4.隨機森林(Random Forest):
結合 多個決策樹 進行 投票。
5.神經網絡(Neural Network):
模仿 人腦神經元 結構。
非監督式學習(Unsupervised Learning)
使用 未標記 的 資料 進行模型訓練。
常見演算法:
1. K-means 聚類(K-means Clustering):
將資料 分 為 K 個群組。
2. 主成分分析(PCA):
降維技術,用於 資料簡化。
3.自組織映射(SOM):
用於 可視化 與 資料壓縮。
強化學習(Reinforcement Learning, RL)
定義: 通過 智能體(Agent)與環境的交互,不斷試錯 以學習 最優行動策 略。
應用場景:
1. 自主駕駛
2.機器人控制
3. 遊戲 AI(如 AlphaGo)
核心概念:
1. 狀態(State) :描述 當前 環境。
2. 行動(Action) : 智能體 能採取 的 行動。
3. 獎勵(Reward) :行動 後 獲得的 回饋,用於 評估 行動好壞。
常用算法:
1. Q-Learning
2. 深度強化學習(Deep Q-Network, DQN)