人工智慧基礎概論
平均差(Mean Deviation):
是 所有 觀察值 與 平 均數 之間
絕 對 差 值 的 平 均,其數 值 越大,
表示 資料的 分散程度 越高。
抽樣變異(Sampling Variation)
在進行 統計分析 時,從 母體中 抽取樣本
所 計算出的 統計量(如 樣本平均數、樣本標準差 ),
往 往 因 樣本的 隨機性 而與 對應的 母體參數 有所差異。
這種 因 抽樣 而產生 的 統計量變動 現象,稱
為抽樣變異(Sampling Variation)。
統計推論:
根據 樣本資料,判斷 是否 接受 或 拒 絕 統計假設 的過程。
在統計學中,H0是虛無假設(Null Hypothesis)的簡寫,表示研究者想要推翻的假設。 當H0為真時,表示研究者提出的對立假設(alternative hypothesis,簡寫為H1)不成立。
在假設檢定中,我們根據樣本資料來決定是否拒絕H0。 如果拒絕H0,表示有足夠的證據支持H1;如果無法拒絕H0,表示沒有足夠的證據推翻H0,但這並不代表H0一定為真。
詳細說明:
- 虛無假設 (H0): 這是研究者想要用數據來推翻的假設。 舉例來說,如果想驗證某種藥物有效,虛無假設可能是「藥物無效」。
- 對立假設 (H1): 這是研究者想要支持的假設,通常是與虛無假設相反的陳述。 在上述例子中,對立假設可能是「藥物有效」。
- 假設檢定: 這是一個統計程序,用來判斷是否有足夠的證據支持對立假設。 在這個過程中,我們計算一個p值,用來衡量在虛無假設為真的情況下,觀察到我們所觀察到的樣本結果或更極端結果的可能性。
- p值: 如果p值小於顯著水準(通常是0.05),我們就拒絕虛無假設,表示有顯著的證據支持對立假設。 如果p值大於顯著水準,我們就無法拒絕虛無假設,這並不代表虛無假設為真,僅代表沒有足夠的證據來推翻它。
- 型一錯誤(Type I error): 當虛無假設實際上為真,但我們卻錯誤地拒絕了它。
- 型二錯誤(Type II error): 當虛無假設實際上為假,但我們卻錯誤地沒有拒絕它。
總結:
在假設檢定中,H0為真時,我們希望能夠正確地接受它,但如果p值小於顯著水準,我們還是會拒絕H0,這就產生了型一錯誤。
反之,H0為假時,我們希望能夠正確地拒絕它,但如果p值大於顯著水準,我們就無法拒絕H0,這就產生了型二錯誤。 假設檢定是一個有犯錯可能性的過程,我們只能根據樣本資料來判斷是否拒絕H0,而不能直接證明H0的真偽。
K-means 的原理相對簡單,主要透過 反覆分配點 到 最近中心、
並 更新中心點 來 最小化平方誤差和 ,並非複雑方法。
K-means 常與PCA(降维)、Elbow method(選k值)等方法結合,
具有一定彈性。
對於 球形 且 大小密度 接近 的群體, K-means 表現良好。
當我們進行一次假設檢定,得到的p值為0.03,而我們事先設定的顯著性水準為0.05。
以下哪一個叙述最合乎统計檢定的意義?
(A)我們有97%的信心拒絕虚無假設
(B)我們在95%的信心水準下拒絕虚虚無假設
(C)我們無法拒絕盧無假設
(D)我們犯型一錯誤的機率為5%
答案:(B)我們在95%的信心水準下拒绝虚無假設。
解析:顯著性水準設定為0.05表示,我們容許 最多5%的機率
犯型一錯誤(即Type-I Error), 並非代表實際犯錯的機率是5%。