gk
G検定トップ
> 交差検証(k-fold)と探索の組み合わせとは?【G検定対策】
まず結論
交差検証(k-fold)はモデル性能を安定して評価する方法であり、グリッドサーチ・ランダムサーチ・ベイズ最適化などの探索手法と組み合わせて使われるのが基本で、G検定では「探索と評価の役割分担」を理解しているかが問われる。
直感的な説明
この2つは役割が違います。
-
探索:
- 「どのハイパーパラメータを試すか」を決める
-
交差検証:
- 「その設定は本当に良いか」を公平に判定する
イメージとしては、
候補を出す人(探索)と、採点する人(交差検証)
が分かれている感じです。
定義・仕組み
交差検証(k-fold cross validation)
- データをk分割
- 1つを検証用、残りを訓練用に使う
- これをk回繰り返す
- 評価値の平均を性能として用いる
探索手法との組み合わせ
- 各ハイパーパラメータ候補ごとに
- k-fold交差検証で性能を評価
- 平均性能が最も良い設定を採用
つまり、
- 探索単体では「当たり外れ」がある
- 交差検証と組み合わせることで安定評価ができる
という関係です。
いつ使う?(得意・不得意)
得意なケース
- データ数が少ない場合
- 汎化性能を正確に評価したい場合
- モデル選択を慎重に行いたい場合
注意点
- 計算量が増える
- 探索 × k-fold で時間がかかる
G検定ひっかけポイント
G検定では、探索と評価を混同させる選択肢が出ます。
よくあるひっかけ
- 交差検証は探索手法である → ✕
- k-foldはハイパーパラメータを決める → ✕
正誤を切る判断基準
- 候補を決める? → 探索
- 性能を評価する? → 交差検証
- 安定した評価? → k-fold
まとめ(試験直前用)
- 探索は候補選び
- 交差検証は性能評価
- k-foldはデータ分割で安定評価
- 探索と組み合わせて使う
- G検定では役割分担を確認
🔗 関連記事
🏠 G検トップに戻る