(3)數據轉換(Data Transformation)
將數據 轉換成 適合分析 的格式。
數據格式轉換(Data Format Transformation):
將數據從一種格式轉換為另一種格式
(如CSV 轉換為 JSON)。
數據類型轉換(Data Type Conversion):
將數據從一種數據類型轉換為另一種數據類型
(如 字串 轉換為 數值)。
數據正規化/標準化(Data Normalization/ Standardization):
將數值數據縮放到特定範圍(如[0,1]或-1 至1),
以 消除不同變數 之間的 單位影響,使數據 在模型中
具有可比性。
數據離散化(Data Discretization):
將 連續型數據 轉換為 離散的 區間 或 類別
(如將年齡分為「青年」、「中年」、「老年」)。
數據縮減(Data Reduction):
透過 特徵選擇、特徵提取 或 降維技術,
如主成分分析(Principal Components Analysis, PCA)
減少數據的 維度 或 體積,
從而 提高 分析效率 並 節省 儲存空間。