2025年9月1日 星期一

2025 09 01 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 (A) 係數縮減法(Shrinkage) (B) 逐步迴歸法(Stepwise Regression) (C) 子集挑選法(Subset Selection) (D) 事後修剪法(Post-pruning) (A) 主從式分散架構(Master-Slave) (B) P2P 架構(P2P Architecture) (C) 分片機制(Sharding) (D) 高度集中化運算平台(Centalized Computing Platform) (A) 不需要Master Node 來管理集群 (B) 可以將文件分散式儲存 (C) 適合儲存文字型資料 (D) 自動備份存入的檔案

AI應用規劃師初級: L11201 資料基本概念與來源


 11.  有一群客戶的消費額最大為3800元、最小為1800元。

        假設將資料經過 最小最大正規化(Min-Max Normalization)

        轉換成0到1的範圍區間, 則若一客戶的消費額為  2300元時

        該消費額會被轉換為什麼數字?

           (A) 0.2

           (B) 0.25 

           (C) 0.4 

           (D) 0.5 


12. 下列何者不是常用來  儲存 log file   的資料格式?

          (A) Doc 

          (B) Csv 

          ( C) Textfile 

          (D) Parquet 


13. 下列何種方法可以用來進行   特徵轉換

          (A) Diffusion maps 

          (B) Locally-linear embedding 

          (C) Relational perspective map 

          (D) 以上皆是 


14. 下列何者  不是  降維的好處? 

          (A) 減少運算時間與儲存空間 

          (B) 移除  共線性資料   能有效提高   線性模型   的效能 

          (C) 當資料維度降至2~3維時,能很容易的直接視覺化展示資料分佈 

          (D) 降維後的資料集訊息量增加,不會減少


15. 下列何項  不是  迴歸分析   常用的   維度   縮減技術? 

     (A) 係數縮減法(Shrinkage) 

     (B) 逐步迴歸法(Stepwise Regression) 

     (C) 子集挑選法(Subset Selection) 

     (D) 事後修剪法(Post-pruning) 


16. 欲  擷取網頁內容  時,若發現   網頁內容改變  但  網址   不變時,

      較有可能為 何  請求方法?

         (A) POST

         (B) PUT 

         (C) GET 

         (D) READ


17. 下列何者  並非現今  巨量資料系統   架構  的   設計趨勢? 

         (A) 主從式分散架構(Master-Slave) 

         (B) P2P 架構(P2P Architecture) 

         (C) 分片機制(Sharding) 

         (D) 高度集中化運算平台(Centalized Computing Platform) 


18. 關於  巨量資料平台Hadoop,下列敘述  何者正確? 

       (A) Name-Node 節點需要配置較多的記憶體,用來儲存文件資料 

       (B) 在HDFS(Hadoop Distributed File System)上的文件,不支援隨 機存取 

       (C) 支援一次寫入一次存取,確保資料完整存取 

       (D) 以上皆是 


19. 下列 何者不是  HDFS(Hadoop Distributed File System)的特色? 

      (A) 不需要Master Node 來管理集群 

      (B) 可以將文件分散式儲存 

      (C) 適合儲存文字型資料 

      (D) 自動備份存入的檔案 


20. 在撰寫MapReduce的程式時,下列何者操作  不適合   在Reducer   中實現?

       (A) x - y 

       (B) x * y 

       (C) x + y 

       (D) count 






2025 09 01 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11201 資料基本概念與來源 (A) 卡方檢定 (B) 相關係數 (C) 共變異數 (D) 四分位數 (A) 圓餅圖(Pie chart) (B) 散佈圖(Scatter plot) (C) 折線圖(Line chart) (D) 長條圖(Bar chart)

AI應用規劃師初級: L11201 資料基本概念與來源



1. 下列何項   資料前處理的步驟?

       (A) 資料清理(Cleaning)

       (B) 資料操弄(Manipulation) 

       (C) 資料建模(Modeling)

        (D) 資料變形(Reshaping) 


 2. 假設Facebook公司給您1000位用戶的基本資料,如:姓名、性別、年 齡、學校、

     居住地,最可能是  R語言中  的何種資料結構?

       (A) 資料框架(Data frame) 

       (B) 串列(List) 

       (C) 向量(Vector) 

       (D) 矩陣(Matrix) 


3. 使用下列何種方法,可以知道資料之中   有偏差甚大  的  離群值 存在? 

       (A) 將該欄位資料繪製成盒鬚圖(Box plot) 

       (B) 將資料以直方圖(Histogram)表示 

       (C) 計算平均值與中位數的差異 

       (D) 以上皆是 


 4. 下列何者不是   資料倉儲  的特性?

       (A) 主題導向的(Subject-oriented)

       (B) 經過整合的(Integrated)

      (C) 不會流失的(Non-volatile) 

      (D) 屬於OLTP系統 


 5. 下列何者為資料遺缺的狀況?

      (A) 完全隨機誤差(Missing Completely at Random,MCAR)

      (B) 隨機誤差(Missing at Random,MAR) 

      (C) 非隨機誤差(Not Missing at Random,NMAR) 

       (D) 以上皆是


6. 繪製下列何種圖表,資料集內  至少需要    包含兩個變量

      (A) 直方圖(Histogram) 

      (B) 圓餅圖(Pie chart) 

      (C) 散佈圖(Scatter plot)

      (D) 盒鬚圖(Box plot) 


 7. 下列何者  不是用於  資料的   相關性分析(Correlation Analysis)

         (A) 卡方檢定

         (B) 相關係數 

         (C) 共變異數 

         (D) 四分位數


 8. 從 SQL Database的角度,如果要    輕易計算   不同性別  的   平均體重

       資料 表欄位   應該要  怎樣設計比較恰當? 

       (A) 男性,女性,其他,男性體重,女性體重,其他體重

       (B) 性別,男性體重,女性體重 

       (C) 性別,體重 

       (D) 以上皆非 


 9. 下列何種圖表適合用來    展示時間序列(Time Series)  類型的資料?

       (A) 圓餅圖(Pie chart) 

       (B) 散佈圖(Scatter plot)

       (C) 折線圖(Line chart) 

       (D) 長條圖(Bar chart) 


10. 下列何者是   利用時間序列  來觀察不同維度  之間   隨時間變化  的資訊?

        (A) 勝率比(Odds ratio)

        (B) 平行座標圖(Parallel coordinates)

        (C) 目標投影追蹤(Targeted projection pursuit) 

        (D) 運行圖(Run chart) 




2025 09 01 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11201 資料基本概念與來源 下列何者屬於「結構化資料」的範例?哪一種資料屬於等比尺度(Ratio Scale)且具有絕對零點?大數據的4V特性通常指Volume(量)、Velocity(速)、Variety(多樣性)、Veracity(真實性)。視覺化是分析大數據的方法,但非其固有特性。

 

AI應用規劃師初級: L11201 資料基本概念與來源

 下列何者屬於「結構化資料」的範例?

(A) 社群媒體貼文內容

(B) 資料庫中的顧客交易紀錄表格

(C) 攝影照片檔案

(D) 客服通話的錄音檔

答案: (B)

說明: 結構化資料具有固定欄位與格式,如資料庫表格。

其他選項如貼文、照片、錄音檔通常是非結構化資料

非結構化資料  沒有固定格式,如自然語言文本

資料庫表格、CSV檔  是  結構化資料JSON檔  是 半結構化資料

半結構化資料   具有標籤  等 結構性標記,但格式不如資料表固定,

JSON和XML是典型例子。


哪一種資料屬於等比尺度(Ratio Scale)且具有絕對零點?

(A) 攝氏溫度(°C)

(B) 信用評等等級(AAA, AA, A…)

(C) 人的身高(公分) 

(D) 星期幾(週一至週日)

答案: (C)

說明: 

身高有絕對零點(0公分代表沒有高度)

可以進行比例比較(200公分是100公分的兩倍高)。

攝氏溫度                      是   等距尺度(0度不代表沒溫度),

信用評等 和 星期幾  是  次序 或  名目尺度
 

大數據的4V特性通常指

      1.Volume(量)

     2.Velocity(速)

     3. Variety(多樣性)

     4. Veracity(真實性)

視覺化   是分析  大數據的   方法,但非其    固有特性。