C. 診斷性分析(Diagnostic Analysis)
診斷性分析 旨在探究數據中的 特定現象 或 結果 的根本原因。
此類分析通常基於敘述性分析的結果,進一步深入了解數據背後
的邏輯與影響因素。
以下為常用的分析方法:
a. 鑽取/向下分析(Drill-down Analysis)
特點與用途:從宏觀數據 逐層 深入到細節層級,
逐步鎖定 問題範圍。
應用場景: 銷售下降時,透過地區、產品類別 或 時間段分析,
確定問題發生的具體區域或品類。
b. 關聯分析(Association Analysis)
特點與用途:分析數據項目之間的共現關係或模式。
方法如Apriori 演算法,
用於分析超市購物車數據
(如「啤酒與尿布的關聯性」)。
應用場景:在推薦系統中 發掘 產品之間 的 購買關聯。
c. 因果分析(Causal Analysis)
特點與用途:透過 統計 與 實驗方法 分析變量 之間的 因果關係,
避免混淆 相關性 與 因果性。
方法如
因果圖(Causal Diagrams)、隨機試驗(A/B 測試)。
應用場景:檢驗行銷活動對銷售增長的實際影響。
D. 預測性分析(Predictive Analysis)
預測性分析 使用 歷史數據 來預測未來可能發生的事件或趨勢,
通常是基於 統計方法 與 機器學習 模型。
以下為常用的模型/方法:
a. 迴歸模型(Regression Models)
特點與用途:用於數值型 結果 的 預測。
方法:線性迴歸、多元迴歸、邏輯迴歸等。
應用場景:預測 房地產價格、銷售額、天氣變化等。
b. 分類模型(Classification Models)
特點與用途:用於將數據分為不同類別。
方法:決策樹、隨機森林、
支援向量機(Support Vector Machine, SVM)、
深度學習(如神經網路等)。
應用場景:信用風險評估、疾病診斷、用戶行為預測。
c. 時間序列模型(Time Series Models)
特點與用途:用於分析時間相關 數據,捕捉趨勢、季節性與
周期性模式。
方法:ARIMA、SARIMA、LSTM 等。
應用場景:銷售預測、需求規劃、股票價格預測。
d. 集成學習方法(Ensemble Methods)
特點與用途:結合多個模型 提高 預測準確性。
方法:
隨機森林(Random Forest)、
梯度提升機(Gradient Boosting Machine,GBM)、
極限梯度提升(eXtreme Gradient Boosting, XGBoost)
等。


