B. 探索性分析(Exploratory Analysis)
探索性分析 是一種數據分析方法,旨在無需預設假設的情況下,透過 多角度
探索數據,發現其中的 模式、關聯和異常,為後續的深入分析或建模提供基礎。
以下為探索性分析相關重要觀念:
a. 散佈圖矩陣(Scatter Plot Matrix)
特點與用途:用於展示多個變量 兩兩之間 的相關性,
適合 高維 數據 的初步探索。
應用範例:分析 銷售數據中 價格、數量與地區 之間的 互動關係。
b. 熱圖(Heatmap)
特點與用途:透過 色彩強度 展示 數據項目之間 的 關聯程度,
通常用於相關分析。
應用範例 :了解 客戶消費行為特徵 之間的關聯
(如年齡與消費金額)。
c. 平行坐標圖(Parallel Coordinates Plot)
特點與用途:適合 分析高維數據,展示多個變量 的 趨 勢 和 模 式。
應用範例 :比較不同產品類型在 多項指標上 的表現
(如成本、收益、風險等)。
d. 箱型圖/盒鬚圖(Box Plot)
特點與用途:展示數據分佈情況,突出 離群值 與 中位數 等特徵。
應用範例 :比較 不同地區 的 收入分佈 差異。
e. 相關性分析(Correlation Analysis)
特點與用途:測量兩個變量之間的相關性,
如 皮爾森相關係數(PearsonCorrelation Coefficient)。
應用範例:分析 廣告支出 與 銷售收入之間的相關性,判斷廣告效果。
f. 聚類分析(Clustering Analysis)
特點與用途:將數據分為多個組群,組內 數據相似度高
而 組間差異大 , 如K均值聚類(K-Means)、
層次聚類(Hierarchical Clustering)等。
應用範例:客戶分群,根據 消費行為
將用戶分為高價值客戶、一般客戶等。
g. 主成分分析(Principal Component Analysis, PCA)
特點與用途:減少數據維度,同時保留大部分數據內訊息,
便於 視覺化 或 進一步分析。
應用範例 :簡化 銷售數據的 多維特徵 以發現核心指標。
h. 異常檢測(Anomaly Detection)
特點與用途:識別數據集中不符合預期的異常點,
如 離群值 或 罕見模式。
應用場景 :檢測金融交易中的欺詐行為。