AI應用規劃師初級: L11 人工智慧基礎概論
L11201 資料基本概念與來源
180. 關於獨立(independence)與 相依(dependency),下列敘述何者 正確?
(A) 統計獨立的觀念對於類別與數值變數兩種變數有不同的定義
(B) 相關(correlation)係數為 0,代表兩變數統計獨立
(C) 類別與數值變數的相依定義是相同的
(D) 類別變數 的關聯(association) 衡量 較數值變數的相關衡量
更為 複雜, 因為關聯性的衡量方式 遠比 相關性的為多
181. 關於「基於密度 的 集群分析算法(Density-Based Spatial Clustering of
Applications with Noise,DBSCAN)」下列敘述何者不正確?
(A) 是以中心點為基礎的方法
(B) 能抵抗雜訊,且能處理任何形狀和大小的群集
(C) 需要人工指定集群的數目
(D) 找出遠離低密度區域之高密度的區域
182. 下列關於階層式集群,何者不正確?
(A) 概念簡單,可用樹狀結構來表現整個計算過程
(B) 只需要資料點兩兩之間的距離,就可以建構集群結果
(C) 即使處理大量資料也能保持高效率
(D) 不需要事先定義群數
183. 請問我們可以使用哪一種方法 進行屬性萃取?
(A) 交替最小次方法(Alternating Least Square, ALS)
(B) 二元搜索樹(Binary Search Tree)
(C) 主成分分析(Principal Component Analysis, PCA)
(D) K平均法(K-Means)
184. 已知iris資料集前3筆資料如下圖所示:
(A) pairs(iris)
(B) pairs[iris]
(C) pairs(iris[-5])
(D) pairs[iris(-5)]
185. 關於K平均法(K-Means),下列敘述何者 不正確?
(A) 將資料分割成 不相交的K個群集
(B) 如果資料與某群集中心的相似度大於其他群集,則該資料歸類於 其他群集
(C) 目標是達到 群集內 的距離平方達到最小
(D) 目標是達到 群集間 的 距離平方達到最大
186. 下列何種問題適合使用K平均法(K-Means)?
(A) 家庭背景對薪資的影響
(B) 男性的長相對其女朋友數量的影響
(C) 根據花蕊長和花瓣寬將花朵集群
(D) 根據上下文填入克漏字
187. 關於K平均法(K-Means)集群分析,下列敘述何者不正確?
(A) 事前需要估算 資料中有多少集群存在,方能執行演算法
(B) 不適合 非球形 或 數據密度 變化大 的集群問題
(C) 算法只要收斂,保證可以獲得最佳的集群結果
(D) 算法 可彈性變化,經過簡單的調整後,可以解決大部份的缺點
188. 屬性轉換(Feature Transformation)與 資料縮減(Data Reduction)
屬 於資料前處理(Data Preprocessing)的重要工作,下列敘述何者不正 確?
(A) 線性迴歸、偏最小平方法(PLS)、類神經網絡(NN)等算法內 嵌有
變數選擇機制的方法,對於預測變數中的雜訊,或是無訊息 力的變數
等較不敏感
(B) 文字資料探勘(Text Mining)中的詞頻-逆文件頻率可視為維度 縮減
(C) 詞組提取(Chunk Extraction)與 N元(N-gram)字組,算是文 字
資料探勘的降維方法
(D) 選用的模型種類決定資料前處理的需求
189. 關於 非監督式學習,下列敘述何者正確?
(A) 以預測變數(predictors)來準確預測反應變數(response variable)
(B) 瞭解反應變數與預測變數兩者間的關係
(C) 線性迴歸與羅吉斯迴歸都屬於非監督式學習
(D) 能發現變數間或觀測值間的子群體