TTQS人才發展品質管理系統TalenT Quality-management System
親愛的 TTQS 三類專業人員 您好:
感謝您參加 114年TTQS評核指標共識研習。
▌活動資訊
名稱:TTQS評核指標共識研習講師:*****
日期:114年09月17日(星期三)
時間:14:00~17:00(報到時間:13:40~13:50)
地點:台北市大安區*****
TTQS人才發展品質管理系統TalenT Quality-management System
親愛的 TTQS 三類專業人員 您好:
感謝您參加 114年TTQS評核指標共識研習。
▌活動資訊
名稱:TTQS評核指標共識研習
生成式 AI 能夠依據輸入的資料產出新的內容,如文字、圖片、音樂和影片等
生成式 AI 則是基於機器學習採用生成模型 (Generative Model) 衍生出來的,
且生成模型會大量倚賴深度學習
人工智慧 (Artificial Intelligence)/
機器學習 (Machine Learning)
深度學習 (Deep Learning)
的關係
深度學習是機器學習的一部分,
機器學習又是人工智慧的一部分
生成式 AI 能夠依據輸入的資料 產出新的內容,
而這是因為 他能 學習資料中 的 分佈,並 透過學習 到的 分佈,產生新的結果,
而這個過程會有兩個主要部份
資料分佈的學習:
生成式 AI 會先從大量的資料中學習其分佈模式,這些資料可以是任何形式,
例如文字資料庫、圖片資料庫等。
常用的技術有
1.自回歸模型 (Autoregressive Model)、
2.自編碼器 (Autoencoder)、
3.變分自編碼器(Variational Autoencoder)和
4.生成對抗網路(Generative Adversarial Networks)等。
內容生成:
學習到資料分佈後,模型能夠從該分佈中採樣並生成新資料。
比如在文字生成中,生成式 AI 可以
根據語言模型 生成 與輸 入 文字風格相似的新句子;
在圖片生成中,AI 可以根據學習到的圖片特徵生成新的圖片。
這邊列舉幾個例子
文字生成:例如 OpenAI 的 ChatGPT、Anthropic 的 Claude 或是 Google 的 Gemini
圖片生成:例如 Midjourney、OpenAI 的 Dall·E
音樂生成:例如 Suno
影片生成:例如 OpenAI 的 Sora
機器學習是如何運作的
1、資料收集與準備
數據 是機器學習的核心。
1.1首先需要從數據庫、文件、API或其他來源收集數據。
1.2 接下來是 數據清洗,包括處理缺失值(刪除、填充或插值)、
修正異常值或錯誤數據。
數據的質量直接 影響模型 的效能,
因此 數據準備 是整個流程中 最重要 且 耗時 的 步驟之一。
2、選擇合適的演算法模型
依據 問題類型 和 數據特點 選擇合適 的 演算法 是 關鍵。
分類問題 可以使用
2.1邏輯回歸
2.2決策樹
2.3支持向量機
2.4隨機森林
2.5神經網路
回歸問題 適合
2.6 線性回歸
2.7 嶺回歸
2.8 Lasso回歸
聚類問題 可以使用
2.9 K均值
2.10 層次聚類
2.11 DBSCAN
此外,還需考慮 數據 規模 和 複雜性:
小數據集 適合 簡單模型(如決策樹或線性回歸),而
大數據集 則適合 深度學習模型(如神經網路)。
演算法選擇 直接影響 模型的 效能 和 效率。
3、開始模型訓練
模型訓練 是將 數據 輸入模型 並 調整參數
以 最小化預測誤差 的過程。
首先需要 將數據劃 分為
3.1訓練集: 用於 模型學習
3.2驗證集: 用於 超參數調整
3.3測試集 用於 最終評估
訓練過程包括
3.4 前向傳播 (生成預測)
3.5 計算損失
3.6 反向傳播(調整參數)
3.7 直到模型收斂(損失不再顯著下降)
4、模型分析評估
模型評估 的 目的 是 驗證模型 的 效能 和 泛化 能力。
常用的 效能指標 包括
分類任務中的
4.1 準確率
4.2 召回率
4.3 F1分數
4.4 AUC-ROC曲線
回歸任務中的
4.5 均方誤差(MSE)
4.6 均方根誤差(RMSE)
4.7 平均絕對誤差(MAE)
通過評估可以發現模型的不足,
例如 過擬合 或 欠擬合,並為後續優化提供方向。
5、模型優化與調參
模型優化是 提升效能 的 關鍵步驟。
超參數調整 是 核心,
可以通過
5.1網格搜尋(Grid Search)
5.2隨機搜尋(Random Search)
5.3貝葉斯優化
等方法尋 找最佳超參數組合。
正則化技術(如L1/L2正則化或Dropout)
可以 防止過擬合,而
集成學習(如投票法、Bagging或Boosting)
則 通過 組合多個模型 提高效能。
優化的目的是在 保持模型 泛化能力 的同時,
盡可能 提高 其在 測試集上 的表現。
6、模型部署與應用
模型部署 是 將 訓練好的模型 應用到 實際場景中的過程。
首先需要
將 模型 保存為 文件(如.pkl或.h5),
然後
根據需求 選擇 部署方式,
例如
6.1 本地部署(集成到應用程式中)或
6.2 雲端部署(通過API提供服務,如Flask、Django或FastAPI)。
部署後 需要
6.3 持續監控 模型效能,
6.4 檢測 數據漂移或概念漂移,並
6.5定期 重新 訓練模型
以適應新數據,確保模型在實際應用中保持 高效 和 準確。
7、持續改進
機器學習 是一個動態過程,需要
通過 回饋循環 和 A/B測試 不斷 優化 模型。
收集使用者 回饋或新數據,用於模型的持續改進。
A/B測試 可以比較不同模型版本的效能,選擇最優方案。
通過不斷 迭代Iterative Method,模型能夠適應變
化 的 環境 和 需求, 保持最佳效能。
持續改進 是 確保模型 長期有效性 的關鍵步驟。
人工智慧:簡單來說就是 讓機器擁有 人類的智慧
機器學習:從大量資料中學習,以 達到 擁有智慧的目的
深度學習:從機器學習中延伸出的一種規則方法,
然後模範 人類大腦 進一步的 去分析資料
神經網路: 神經網路 是 深度學習 的 基礎架構,
深度學習 是 神經網路
在 深度 和 複雜度 上的一種 擴展。
這種機器學習之所以稱為「深度」,是因為 包含許多層神經網路,
以及 大量複雜 且 離散 的數據。
為了實現深度學習,系統會與
多層神經網路 互動,萃取出 更高層次 的 結果。
例如,當深度學習系統 處理自然影像 並
尋找黑心金光菊(Gloriosa daisies)時,
第一層會先辨識植物,
隨著神經網路層層分析,
系統會辨識出花朵, 然後是菊科植物,
最後便是黑心金光菊。
深度學習應用的範例包括 語音辨識、影像分類 和 藥學分析。
人工神經網路(ANN)是根據 生物大腦神經元 建立的模型,
人工神經元 稱為節點,於 多層中 叢集 且 平行 運作。
人工神經元 收到 數值訊號 會進行處理,並傳訊號要求
另一個神經元進行連接。
如同人類的大腦,神經強化可以改善 模式辨識、專業知識 與 整體學習能力。
機器學習以及深度學習與神經網路,都屬於 AI的衍生領域。
AI 會分析資料 以 制定決策 和 預測。
機器學習演算法 讓 AI 不僅能處理資料,還能在
不藉助額外程式設計的情況下,
使用資料 進行 學習 並 更 精準。