ds modeling
まず結論
カーネル(Kernel)とは、画像の畳み込み処理で使われる小さな行列で、画像をどのように変換するかを決める「計算ルール」です。
DS検定では
フィルタ処理
畳み込み
カーネル
の関係を理解しているかが問われることがあります。
直感的な説明
画像のフィルタ処理は
「周りのピクセルを見て値を決める」
という計算でした。
このとき
どのような計算をするかを決める表
がカーネルです。
例えば次のような表です。
1 1 1 1 1 1 1 1 1
この表を画像の上に重ねて
ピクセル値
カーネルの値
を掛け合わせて計算します。
つまり
カーネル=画像処理のルールを表した行列
です。
定義・仕組み
カーネルとは
畳み込み(Convolution)処理で使われる小さな行列
です。
一般的には
3×3
5×5
などのサイズの行列が使われます。
畳み込み処理では
① カーネルを画像の一部に重ねる ② 対応する値を掛ける ③ 合計して新しいピクセル値を作る ④ カーネルを1ピクセルずらす
という処理を画像全体に繰り返します。
このとき
カーネルの値が画像処理の結果を決めます。
カーネルの例
ぼかし処理の例
1 1 1 1 1 1 1 1 1
周囲の値を平均することで
→ 画像が滑らかになる
エッジ検出の例
-1 -1 -1 -1 8 -1 -1 -1 -1
輪郭部分の変化が強調され
→ エッジが強調される
どんな場面で使う?
カーネルは
画像フィルタ処理の中心的な仕組みです。
例えば
ノイズ除去
ぼかし
シャープ化
エッジ検出
など多くの画像処理で使われます。
CNN(畳み込みニューラルネットワーク)
CNNでは
カーネルを学習によって自動で作ります。
つまり
人が決めるカーネル
ではなく
AIが特徴を学習したカーネル
が使われます。
これによって
形
模様
輪郭
などの特徴を検出できます。
よくある誤解・混同
誤解①
カーネル=畳み込み
これは正しくありません。
カーネル
→ 計算ルール
畳み込み
→ そのルールを使った計算方法
という関係です。
誤解②
カーネルは画像処理だけのもの
実際には
CNN
信号処理
音声処理
などでも使われる概念です。
DS検定のひっかけ
DS検定では
フィルタ
カーネル
畳み込み
の関係が混同されることがあります。
整理すると
フィルタ処理 ↓ 畳み込み(計算方法) ↓ カーネル(計算ルール)
です。
まとめ(試験直前用)
カーネルは 畳み込み処理で使う小さな行列
画像処理の「計算ルール」を表す
カーネルの値によって
ぼかし
ノイズ除去
エッジ検出 などの処理が決まる
CNNではカーネルをAIが学習する
DS検定では
カーネル=計算ルール 畳み込み=計算方法
と整理できると迷いにくくなります。
対応スキル項目(AI利活用スキルシート)
スキルカテゴリ名 AIの技術理解
サブカテゴリ名 画像・音声処理
★ 画像・動画・音声などのデータに対する基本的な処理方法を理解している
🔗 関連記事
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アノテーションとは?(AI学習データを作る重要な作業)【DS検定】
- Aprioriアルゴリズムとは?(アソシエーション分析の基本手法)【DS検定】
- アソシエーション分析とは?購買データの関係性を見つける分析【DS検定】
- 共起頻度・支持度・信頼度・リフト値の違いとは?【DS検定】