2025年6月6日 星期五

2025 06 07 左永安 顧問/講師/委員/宮主/永續長/執行長/理事長 科目二生成式 AI應用與規劃 以下哪個不適合處理異常值? 眾數、平均數、標準差、四分位數 答案:平均數(Mean)不適合處理異常值

 以下哪個不適合處理異常值? 眾數、平均數、標準差、四分位數


平均數(Mean)不適合處理異常值,因為異常值會大幅影響平均數的計算.

 眾數(Mode)、標準差和四分位數通常能較好地抵抗異常值. 

  •    平均數:
    平均數是所有數據點的總和除以數據點的數量。 如果數據集中包含極端值(異常值),它們會拉高或拉低平均數,導致平均數不準確地代表數據集的中心趨勢.

  • 眾數:
  • 眾數是數據集中出現最頻繁的數值。 它不受異常值影響,即使數據集中有異常值,
  • 眾數仍能準確反映數據集中最常見的數值. 

  • 標準差:
  • 標準差衡量數據集中數據點與平均數的偏離程度。 由於平均數會受到異常值影響,標準差也會受到異常值的影響。 然而,標準差本身並非測量異常值的指標,而是衡量數據集中數據點的整體變異性
  • 四分位數:
  • 四分位數將數據集分成四個相等的部分,
  • 第一四分位數(Q1)、
  • 第二四分位數(中位數,Q2)和
  • 第三四分位數(Q3)。 

  • 四分位數不受異常值影響,可以更準確地描述數據集的分布.


  • 總結: 只有平均數會受到異常值的影響。

  •  眾數、標準差和四分位數可以更好地抵抗異常值的影響,因此它們更適合處理包含異常值的數據集.