2025年9月5日 星期五

2025 09 05 左永安 顧問/講師/委員/宮主/秘書長/永續長/執行長/理事長 AI應用規劃師初級: L11 人工智慧基礎概論 L11201 資料基本概念與來源 關於卡方分配(Chi-squared Distribution),下列敘述何者不正確? (A) 卡方分配的曲線為非對稱的 (B) 卡方分配的期望值為其自由度 (C) 卡方分配的期望值與變異數相等 (D) 卡方分配的自由度越大會使其變異數越大

 AI應用規劃師初級: L11 人工智慧基礎概論 

     L11201 資料基本概念與來源


170. 關於巨量資料處理,下列敘述  何者 正確? 

       (A) 任何資料皆可作為特定分析目的訓練樣本 

       (B) 巨量資料缺少某些變量不會影響判斷結果 

       (C) 可透過網路爬蟲或API來搜集大量外部資料 

       (D) 透過巨量資料處理可由機器完全取代人工判斷 


 171. 關於卡方分配(Chi-squared Distribution),下列敘述何者 不正確? 

      (A) 卡方分配的曲線為  非對稱的

      (B) 卡方分配的 期望值為其 自由度 

      (C) 卡方分配的期望值與變異數相等 

      (D) 卡方分配的自由度越大 會使其 變異數越大


172. 參考以下報表之結果,何者敘述為 正確




     (A) eruptions 變數的最小值為43.0 

     (B) eruptions 變數的75百分位數為4.454 

     (C) waiting 變數的最大值為82.0 

     (D) waiting 變數的中位數為70.9


173. 針對 3種不同飲料  與 4種不同商店  進行 二因子變異數分析

          則交互作 用的 自由度為多少

           (A) 6

           (B) 7 

          (C) 12 

           (D) 20 


174.   請參考以下迴歸分析結果:下列敘述何者正確?

 

          (A) 模型


   (A) 不具有線性模型解釋能力 

          (B) 模型的截距為3.45000 

          (C) 模型的樣本數為13 

          (D) 模型的判定係數(Coefficient of Determination)為 0.991


175. 預測建模前  經常會先以各式統計量數,移除無用 的預測變數,

          下列敘 述何者正確? 

        (A) 數值型預測變數可以其間的相關係數,剔除贅餘的預測變數 

        (B) 線性迴歸模型中納入退化分佈(Degenerate Distribution)的預測 變數,

              並不會損傷其績效 

        (C) percentUnique 是以最常見的類別值頻次,除以次常見類別值頻次 的比值,

              來辨識有退化分佈現象的類別型變數 

        (D) freqRatio 是以獨一無二的類別值數量與樣本大小的比值,

              來辨識 有退化分佈現象的類別型變數 


 176. 重抽樣方法(Resampling Methods)是當代統計學不可或缺的工具之 一,

           下列敘述何者錯誤

         (A) 拔靴取樣法(Bootrapping)採行多次不置回抽樣的方式,取出與 

               原樣本大小相同的子集 

         (B) k摺交叉驗證(K-fold Cross Validation)是隨機 k 等分(通常是 十等份)

               訓練集樣本後,每次留下一份作為測試集樣本,而以其 餘k-1份樣本

               進行模型訓練 

          (C) 重抽樣方法是反覆地從訓練集或資料集中抽出或有不同的各組 樣本,

                並重新配適各組樣本的模型,以獲得模型相關的額外資訊 

          (D) 拔靴取樣法與k摺交叉驗證兩種重抽樣方法的差別只在於樣本 子集

                 如何被挑出,而彙整與摘要統計的方式則是相同的 


177. 機器學習 經常以 樣本子集  進行 模型訓練 與 測試,

   下列敘述何者正確? 

          (A) 測試集(Test Set)用以最佳化模型參數

            (B) 核驗集(Validation Set)用以建立模型

            (C) 訓練樣本集(Training Set)用以合理估計模型績效 

           (D) 訓練與測試機制經常運用重抽樣(Resampling)策略 


178. 關於 模型訓練 與 測試機制,下列敘述何者不正確? 

       (A) 模型建立與優化的步驟又可稱為(候選)模型挑選(Model Selection)的階段

       (B) 用測試集對最佳模型未來之績效估計工作又可稱為模型評定/績 效估計

              (Model Assessment/Performance Estimate)階段

       (C) 模型挑選 與未來績效評定 估計工作 應儘量使用相同的樣本進行 訓練、

              調校與測試 

         (D) 對於模型挑選工作來說,當欲評估的參數組合眾多,績效準則的 計算

               速度應   為首要考量 


179. 關於 模型訓練 與 測試機制 中的 資料切分,下列敘述何者不正確

            (A)  在樣本充足的情況下,通常將之切割為兩或三個子集,分別肩負 

                  模型建立、  最佳化 與 估計最佳化模型,對新案例的預測績效

             (B) 決定最佳的模型複雜度或參數組合後,最後再以整個校驗集建立 

                   最佳複雜度  或 最佳參數組合下 的最終模型 

            (C) 保留法(holdout)包含內外兩圈的重抽樣機制,分別負責模型最 佳化

                   與績效估計的工作,如此內外圈反覆執行所需計算量 

     應 是負 擔 最重的訓練     與測試機制

           (D) 雙重抽樣法充分運用了資料集中的各個樣本,基本上所有樣本都 會

                  作為訓練樣本、 驗證樣本與測試樣本,但不會有樣本同時參與 模型

     建立 與未來績效的估計工作上,也就是說不會發生球員兼裁 判的狀況