ds unstructured-data design
まず結論
画像のデジタル表現とは、画像を「標本化(サンプリング)」と「量子化」によって数値データとして表す仕組みです。
DS検定では、
標本化=画像をピクセル(画素)に分割すること
量子化=各ピクセルの明るさや色を数値の段階で表すこと
という役割の違いを理解しているかが問われます。
選択肢では
「標本化と量子化の役割の違い」を混同させる問題がよく出ます。
直感的な説明
写真を モザイク画像 にすると考えると分かりやすいです。
まず画像を 細かいマス目に区切るとします。
□ □ □ □ □ □ □ □ □ □ □ □
この 1つ1つのマスがピクセル(画素)です。
ここで2つの処理が行われます。
① 標本化(サンプリング) → 画像をマス目に区切る
② 量子化 → 各マスの明るさや色を数値で決める
例えば
ピクセル 明るさ
□ 0 □ 128 □ 255
このようにして、画像は
「大量の数値データ」
として保存されます。
つまりデジタル画像とは
ピクセルの集合 + 数値データ
なのです。
定義・仕組み
画像をデジタルデータとして扱うためには、次の2つの処理が行われます。
標本化(サンプリング)
画像を 格子状の点に分割する処理です。
このときの点が ピクセル(画素)です。
ピクセル数が多いほど
解像度が高い
画像が細かく表現できる
という特徴があります。
このピクセルの密度は
解像度(resolution)
として表されます。
代表的な単位
dpi(dots per inch)
ppi(pixels per inch)
値が大きいほど
細かい画像表現が可能になります。
もしピクセル数が少ないと
画像がギザギザになる
階段状の線になる
これを ジャギー(jaggy) と呼びます。
また、格子の間隔が粗いと
本来存在しない縞模様が見える現象
が起こることがあります。
これを
エイリアシング(aliasing)
と呼びます。
このギザギザを目立たなくする処理が
アンチエイリアシング(anti-aliasing)です。
量子化(quantization)
量子化とは
ピクセルの明るさや色を数値の段階で表す処理
です。
例えばグレースケール画像では
ビット数 表現できる段階
1bit 2段階 8bit 256段階
8bit画像では
0〜255
の256段階で明るさを表します。
量子化の段階が少ないと
色の境目が目立つ
グラデーションが不自然
になります。
画像の色表現
画像の色は主に次の2種類があります。
グレースケール
白黒画像 明るさだけで表現する
カラー画像
RGB(赤・緑・青)を組み合わせて表現する
代表的な画像フォーマット
デジタル画像は様々な形式で保存されます。
代表例
フォーマット 特徴
JPEG 圧縮率が高い(不可逆圧縮) PNG 劣化なし圧縮(可逆圧縮) GIF 256色まで・簡易アニメーション対応 BMP 非圧縮・ファイルサイズが大きい TIFF 高品質保存・印刷や医療画像で使用
DS検定では
代表的な画像フォーマットの名前
を問う基礎問題が出ることがあります。
どんな場面で使う?
この仕組みは
画像データを扱うすべてのAI・データ分析
で使われます。
例えば
画像認識
医療画像分析
自動運転
顔認識
製造業の外観検査
などです。
データサイエンスでは
画像は
ピクセルの数値データ
として扱われます。
つまり
画像 = 数値行列(データ)
として機械学習モデルに入力されます。
よくある誤解・混同
誤解①
標本化と量子化は同じ意味
これは誤りです。
用語 役割
標本化 画像をピクセルに分割 量子化 ピクセルの値を段階化
DS検定では この違いを問う問題が非常に多いです。
誤解②
解像度が高い=色の段階が多い
これも誤りです。
概念 内容
解像度 ピクセル数 量子化 明るさ・色の段階
つまり
標本化 → 空間の細かさ
量子化 → 色の細かさ
です。
誤解③
エイリアシングとアンチエイリアシング
DS検定では次の関係を理解しておく必要があります。
用語 意味
エイリアシング ギザギザ・偽模様が発生する現象 アンチエイリアシング ギザギザを目立たなくする処理
選択肢では
「エイリアシングを防ぐ技術はアンチエイリアシング」
という対応を問われることがあります。
誤解④
画像はそのまま機械学習に入力できる
実際には
正規化
サイズ変更
チャンネル変換
などの 前処理が必要になります。
まとめ(試験直前用)
画像のデジタル表現は 標本化+量子化
標本化=画像をピクセルに分割(解像度)
量子化=明るさ・色の段階
エイリアシング=ギザギザ現象
アンチエイリアシング=ギザギザを抑える処理
DS検定では
「標本化=ピクセル数」 「量子化=色の段階」
この対応が思い出せれば正解できます。
対応スキル項目(AI利活用スキルシート)
スキルカテゴリ名 AI・データサイエンス
サブカテゴリ名 画像・音声・自然言語などのデータ理解
★ 画像・音声・自然言語などの非構造化データの特徴を理解している
🔗 関連記事
- アクセス制御リスト(ACL)とは?ファイル権限の基本を整理【DS検定】
- 中間層で使用される活性化関数とは?(ReLU・シグモイド・ソフトマックスの違い)【DS検定】
- アジャイル開発とは?ウォーターフォール開発との違いを整理【DS検定】
- 分析アプローチ設計とは?(分析プロジェクトを成功させる設計プロセス)【DS検定】
- 必要なデータ・分析手法・可視化を適切に選択する力とは?【DS検定】