AI應用規劃師初級: L11 人工智慧基礎概論
L11201 資料基本概念與來源
160. 若對 類別變量 進行 資料探索,下列敘述何者正確?
(A) 得知資料的變異程度
(B) 得知資料的分佈情形
(C) 得知資料間的相關性
(D) 得知資料的出現頻次
161. 請問經過 下列轉換方法 做資料轉換後,哪個方法會產生出
較 原 資料 多 的 變數?
(A) 虛擬編碼(Dummy Encoding)
(B) 降低維度(Dimension Reduction)
(C) 特徵縮放比例(Feature Scaling)
(D) 特徵選擇(Feature Selection)
162. 有一個 類別型變項 名稱為「鞋子顏色」,值域(亦即所有可能出現的 值)
為{紅, 藍, 綠},下列何者為正確的 One-Hot Encoding 方式
(變 項名稱:值域)?
(A) 鞋子_紅:{1,0} , 鞋子_藍:{1,0}, 鞋子_綠:{1,0}
(B) 鞋子顏色:{紅, 藍, 綠}
(C) 鞋子顏色:{1, 2, 3}
(D) 鞋子_紅:{1, 2} , 鞋子_藍:{1, 2}, 鞋子_綠:{1, 2}
163. 下列哪個方法 需要 類別標籤(Label)資訊?
(A) 線性判別分析(Linear Discriminant Analysis)
(B) 主成分分析(Principle Component Analysis)
(C) 潛在語意分析(Latent Semantic Analysis)
(D) 獨立成分分析(Independent Component Analysis)
164. 關於 屬性挑選,下列敘述何者正確?
(A) 過濾式屬性挑選法(Filter)單就預測變數空間中進行挑選工作
(B) 封裝式屬性挑選法(Wrapper)不考慮後續建模方式的方法
(C) 大數據(Big Data)時代下,用越多屬性詮釋反應變數越好
(D) 屬性挑選時通常僅需考慮個別屬性的分佈狀況,
無須考慮屬性間 的互動關係
165. 若您在分析資料後發現,由於資料的 某些欄位 具有 高度相關性 而影響
了分析結果,請問可能是忘了進行下列哪一步驟?
(A) 清理資料
(B) 轉換資料結構
(C) 屬性挑選
(D) 蒐集的資料不正確
166. 擷取網頁資料時,通常會透過HTML的規則進行網頁解析(Parse),
下列敘述何者 不正確?
(A) CSS 選擇器(Selector)是常用解析網頁元素的一種語法
(B) GET (2) (3) (4) XPath(XML Path Language)是常用解析網頁元素
的一種語法
(C) cURL是常用解析網頁元素的一種語法
(D) 絕大部分的網頁都是以 HTML 格式來呈現的
167. 可以透過哪些方式 取得 HTML 表單?
(1) GET
(2) HOLD
(3) POST
(4) PUSH
(A) (1) 和 (2)
(B) (2) 和 (3)
(C) (1) 和 (3)
(D) (1) 和 (4)
168. 關於 巨量資料 進行 機器學習建模 的觀念,
下列敘述何者正確?
(A) 以原始資料進行建模模型
(B) 資料重量不重質
(C) 無須對資料背景理解
(D) 資料轉為結構化資料
169. 在擁有 大量且需要 即時處理 的資料時,
下列何者 並非最必要 之技術?
(A) 訊息佇列(Message Queue)
(B) 虛擬化(Virtualization)
(C) 非關聯式資料庫(NoSQL)
(D) 串流技術(Streaming)