画像のオープンデータセットまとめ | AI・データサイエンス・IT学習ノート

gk dataset cnn cheatsheet

G検定トップ＞画像のオープンデータセットまとめ

まず結論

MNIST / CIFAR-10 / Pascal VOC は画像データセット
SQuAD は画像ではなく自然言語処理（NLP）用
G検定では 「画像か？文章か？」 を即判断できることが重要

直感的な説明

G検定で出るデータセット問題は、

名前を知っているかどうか
タスクが画像か文章かを分けられるか

がほぼ全てです。

特に
SQuAD は「有名だから画像っぽく見える」
という 典型ひっかけ です。

代表的な画像オープンデータセット

MNIST

手書き数字（0〜9）
白黒画像（28×28）
画像分類の超定番

👉 一番ベーシックな画像データ

CIFAR-10

10クラスのカラー画像
飛行機・車・動物など
小サイズだが実画像

👉 CNNの入門〜評価用

Pascal VOC

物体検出・画像認識用
バウンディングボックス付き
クラス数は少なめ

👉 物体検出の代表例

画像ではないデータセット（超重要）

SQuAD（Stanford Question Answering Dataset）

文章データ
質問応答タスク
自然言語処理（NLP）

👉
画像のオープンデータセットではない

一覧で整理（試験用）

データセット	分野	主タスク
MNIST	画像	数字分類
CIFAR-10	画像	物体分類
Pascal VOC	画像	物体検出
SQuAD	NLP	質問応答

G検定ひっかけポイント

❌ よくある誤解

❌ 「有名＝画像データ」
❌ 「VOCは文章データ」
❌ 「SQuADは画像＋質問」

✅ 正しい切り方

画像？文章？ を最初に判断
画像なら
→ MNIST / CIFAR / VOC
文章なら
→ SQuAD

試験での即断キーワード

「手書き数字」 → MNIST
「カラー画像」 → CIFAR-10
「物体検出」 → Pascal VOC
「質問応答」 → SQuAD（画像ではない）

まとめ（試験直前用）

画像データセットは MNIST / CIFAR / VOC
SQuADはNLP
「画像かどうか」を最初に見る
有名でも分野が違えば即×

👉 次は
COCO / ImageNet / Open Images
を足すとデータセット問題はほぼ完封できます。

🔗 関連記事

🏠 G検トップに戻る