以下哪個不適合處理異常值? 眾數、平均數、標準差、四分位數
平均數(Mean)不適合處理異常值,因為異常值會大幅影響平均數的計算.
眾數(Mode)、標準差和四分位數通常能較好地抵抗異常值.
- 平均數是所有數據點的總和除以數據點的數量。 如果數據集中包含極端值(異常值),它們會拉高或拉低平均數,導致平均數不準確地代表數據集的中心趨勢.
- 眾數:
- 眾數是數據集中出現最頻繁的數值。 它不受異常值影響,即使數據集中有異常值,
- 眾數仍能準確反映數據集中最常見的數值.
- 標準差:
- 標準差衡量數據集中數據點與平均數的偏離程度。 由於平均數會受到異常值影響,標準差也會受到異常值的影響。 然而,標準差本身並非測量異常值的指標,而是衡量數據集中數據點的整體變異性
- 四分位數:
- 四分位數將數據集分成四個相等的部分,即
- 第一四分位數(Q1)、
- 第二四分位數(中位數,Q2)和
- 第三四分位數(Q3)。
- 四分位數不受異常值影響,可以更準確地描述數據集的分布.
- 總結: 只有平均數會受到異常值的影響。
- 眾數、標準差和四分位數可以更好地抵抗異常值的影響,因此它們更適合處理包含異常值的數據集.