ds unstructured-data preprocessing
まず結論
画像のフィルタ処理とは、画像データに対してノイズ除去や特徴強調などの処理を行い、分析や認識に使いやすい形にする前処理のことです。
DS検定では
「画像はピクセル値の集合として処理される」
という点と、
ノイズ除去やエッジ強調などの前処理の目的
を理解しているかが問われます。
直感的な説明
写真を撮ったとき、次のような経験はありませんか。
- 少し暗いので 明るさを調整する
- ぼやけているので 輪郭をはっきりさせる
- ザラザラしたノイズを 除去する
スマホの写真編集アプリでもよく行う処理です。
実はAIによる画像分析でも、
そのままの画像を使うのではなく、分析しやすい状態に整える処理
を行うことが多くあります。
例えば、
- ノイズを除去する
- 輪郭(エッジ)を強調する
- 明るさやコントラストを調整する
といった処理です。
このような処理をまとめて
画像のフィルタ処理と呼びます。
定義・仕組み
画像はAIから見ると
「ピクセル値の集合」です。
例えば1枚の画像は、
- 明るさ(濃淡)
- RGB値(色)
といった数値の集合として扱われます。
そのため、画像の処理は基本的に
ピクセル値を計算によって変換する処理
になります。
代表的なフィルタ処理には次のようなものがあります。
ノイズ除去(平滑化フィルタ)
画像のザラザラしたノイズを減らす処理です。
例えば
- 平均化フィルタ
- ガウシアンフィルタ
- メディアンフィルタ
などがあります。
これにより
本来の特徴が見えやすくなる
という効果があります。
エッジ強調(輪郭抽出)
画像の輪郭(エッジ)を強調する処理です。
代表例
- Sobelフィルタ
- Laplacianフィルタ
製品検査や文字認識などでは
輪郭情報が重要になるためよく使われます。
色変換
画像を別の表現に変換する処理です。
例えば
- RGB → グレースケール
- RGB → HSV
などがあります。
分析では
色を減らして処理を簡単にする
ことも多いです。
どんな場面で使う?
画像のフィルタ処理は
画像分析の前処理としてよく使われます。
例えば次のような場面です。
製造業の外観検査
製品のキズや欠陥を検出する場合
- ノイズ除去
- エッジ強調
を行うことで
欠陥部分を見つけやすくすることができます。
医療画像解析
MRIやCT画像では
- ノイズ除去
- コントラスト調整
などを行い
病変を見やすくする処理を行います。
自動運転
カメラ画像から
- 車線
- 歩行者
- 標識
を検出するために
画像の前処理が行われます。
よくある誤解・混同
誤解①
AIは画像をそのまま理解している
これは誤解です。
AIは画像を
ピクセル値の数値データ
として処理しています。
そのためノイズなども
数値の特徴として誤認識する可能性があります。
そのためフィルタ処理によって
不要なノイズを除去することが重要になります。
誤解②
フィルタ処理=画像をきれいにするだけ
これも誤解です。
画像処理の目的は
- ノイズ除去
- 特徴強調
- 分析しやすくする
など
AIが特徴を抽出しやすくすることです。
DS検定のひっかけ
DS検定では次のような理解が問われます。
選択肢で
- 「AIは画像をそのまま理解する」
- 「画像は数値ではない」
と書かれていたら 誤りです。
画像は
ピクセル値(数値データ)の集合
として処理されます。
まとめ(試験直前用)
- 画像は ピクセル値の集合(数値データ)
- フィルタ処理は 画像分析の前処理
- 主な目的
- ノイズ除去
- 特徴強調
- 画像変換
- AIがノイズを特徴と誤認識しないようにするために重要
DS検定では
「画像=ピクセル値の集合」
という前提を理解しているかがよく問われます。
対応スキル項目(AI利活用スキルシート)
-
スキルカテゴリ名
AIの技術理解 -
サブカテゴリ名
画像・音声処理
★ 画像・動画・音声などのデータに対する基本的な処理方法を理解している
🔗 関連記事
- アノテーションとは?(AI学習データを作る重要な作業)【DS検定】
- データ拡張(Data Augmentation)とは?画像AIの学習データを増やす方法【DS検定】
- データ抽出と集計の違いとは?(SQL・BIで混同しやすい操作)【DS検定】
- データトランスフォーメーションとは?(非構造化データの変換)【DS検定】
- 係り受け解析とは?形態素解析との違いを整理【DS検定】