AI應用規劃師初級: L11 人工智慧基礎概論
L11201 資料基本概念與來源
120. 若欲 透過 巨量資料分析 來剖析 核心的商業價值,
下列何者 需最先 被執 行?
(A) 數據建模
(B) 資料解析
(C) 定義問題
(D) 資料理解
121. 關於 卡方分配、F分配、t分配 之比較,下列敘述何者 不正確?
(A) 皆為小樣本
(B) 皆為不連續分配
(C) 三者皆有自由度
(D) 皆來自於常態母體
122. 關於 卜瓦松分配 之特性,下列敘述何者 不正確?
(A) 某一時段內發生的次數與其他時段發生的次數相互獨立
(B) λ 與所選擇之時間長度成比例
(C) 在極短時間內成功兩次以上之機率不可忽略不計
(D) 在相同長度的時段內發生事件的機率皆相同
123. 當所有觀察值 都落在 迴歸直線上,則x與y之間的相關係數為何?
(A) -1 < r < 1
(B) 僅r = 1
(C) 僅r = -1
(D) r = 1 或 r = -1
124. 下圖為海藻資料集的變數Chla分佈狀況,請問最接近何種機率分佈?
(A) 常態分佈
(B) 偏態分佈
(C) 幾何分佈
(D) 均勻分佈
125. 考慮 簡單線性迴歸(Linear Regression)模型,其 變異數分析表中,
迴 歸模型 的 自由度 為何?
(A) 1
(B) 2
(C) 12
(D) 20
126. 機器學習(Machine Learning)是從所搜集的資料中建構出
(學習出 learning 或 配適出 fitting)X 與 Y 之間的函數關係Y = f(X),
下列敘述 何者不正確?
(A) X稱為預測變數(Predictors)
(B) X稱為獨立變數(Independent Variables)
(C) Y稱為反應變數(Responses)
(D) Y稱為屬性(Features)
127. 關於模型績效評估,下列敘述何者 不正確?
(A) 殘差(或稱預測誤差)是真實的反應變數值 減去 預測的反應變數 值
(B) 所有的模型績效衡量準則都基於 殘差
(C) 均方根預測誤差(Root Mean Squared Error, RMSE)其單位為 反應 變數
原始單位的平方
(D) 瞭解殘差的分佈情形有助於評估模型的優劣與適用情境
128. 抽樣(Sampling)是統計學重要的概念之一,下列敘述何者正確?
(A) 巨量資料趨近於母體,因此分析時一定要採用抽樣方法
(B) 資料分析師如欲估計線性迴歸模型的變異性,可以用重抽樣方法
(Resampling Methods)對每一組重抽樣訓練樣本配適模型後,
檢 視各模型績效的差異程度,這種作法使我們可以獲得只以原訓練
集配適一次因而無法獲得的有用資訊
(C) 隨機抽樣(Random Sampling)是反覆地從訓練集或資料集中抽出
或有不同的各組樣本,並重新配適各組樣本的模型,以獲得模型
相關的額外資訊
(D) 拔靴取樣法(Bootrapping)是隨機 k 等分(通常是十等份)
訓練 集樣本後,每次留下一份作為測試集樣本,而以其餘 k-1 份樣本
進行模型訓練
129. 關於 模型訓練 與 測試機制,下列敘述何者正確?
(A) 用測試集對最佳模型未來之績效估計工作,又可稱為(候選)模 型
挑選(Model Selection)的階段
(B) 模型建立與優化的步驟,又可稱為模型評定/績效估計
(Model Assessment/Performance Estimate)階段
(C) 模型建立後,常透過交叉驗證(Cross-Validation)進行優化,
避 免過度配適(Overfitting)的情況發生
(D) 最佳模型的績效估計工作來說,績效準則的計算速度是首要考量