生成式人工智慧(Generative AI)和
鑑別式(分辨式)人工智慧(Discriminative AI)
是人工智慧中兩個重要的概念。
首先理解一下鑑別式(分辨式)人工智慧(Discriminative AI),
顧名思義,這是需要有標注標籤資料以供「分辨」,
我們常以(X, y)來表示有標注標籤的資料,X 代表資料本身,y 表示其標籤。
從分辨區隔手中的標注資料,進而「訓練」篩選出一個好的分類器 (Classifier),
用於對那些沒有「標注」僅有 X 的資料,預測其標籤 y。
具體來說,鑑別式(分辨式)模型依據有限的資料分佈 與 其對應的標籤
找出一映射的函數 F(X),用此函數值當成X 所對應的標籤 y。
鑑別式(分辨式)AI 模型的代表性算法包括
支持向量機(SVM)、
決策樹(Decision Tree)、
羅吉斯迴歸(Logistic Regression)等。
從這樣的學習模式,不難想像,需要倚賴大量高品質具有標籤的標注資料,
當然也提高了模型訓練成本,限縮大型複雜鑑別式(分辨式) AI 模型的發展。
而生成式 AI 模型與鑑別式(分辨式)模型就根本的差異,
在於生成式 AI 模型 巧妙運用大量 沒有標注標籤的資料 X,
試圖 自我產生 資料 與 隱藏於資料中的 訊息。
而 移除標注資料的限制後,讓大型的複雜模型的訓練,
藉助於強大 GPU 的算力與大量的資料,得以實現。
生成式 AI,雖無必要使用有標注標籤的資料,
但若仍有標注標籤的資料合併使用,
訓練過程中再引入強化學習(Reinforcement learning)機制,
可協助引導模型快速朝向「正確」合用的方向收斂。
而這樣的模式,也讓通用性的人工智慧漸露曙光。
這種人工智慧可以創造生成出自然語言、音樂、圖像和其他形式的資料。