TF-IDF・Word2Vec・BERTの違いとは？役割で整理するNLP基礎【G検定対策】 | AI・データサイエンス・IT学習ノート

最終更新日：2026年5月6日

gk nlp neural_network

G検定トップ＞ TF-IDF・Word2Vec・BERTの違いとは？役割で整理するNLP基礎【G検定対策】

まず結論

TF-IDF・Word2Vec・BERTは「文章をどう数値化するか」のレベルが違うだけで、役割が明確に異なる。
G検定では「どこまで文脈を考慮できるか」で切り分ける。

直感的な説明

3つを人間にたとえると、こうなります。

TF-IDF：
👉 単語の「出現頻度」だけを見る人
Word2Vec：
👉 単語の「意味の近さ」を考える人
BERT：
👉 文全体の「文脈」を理解して読む人

つまり、 👉 賢さの段階が違う
と考えると一気に整理できます。

定義・仕組み

TF-IDF

単語の出現頻度に基づく特徴量
文脈・語順は考慮しない
古典的な手法

ポイント：

シンプル
高速
意味は理解しない

Word2Vec

単語をベクトルとして表現
意味が似た単語は近いベクトルになる
文脈は「ある程度」考慮（局所的）

ポイント：

単語の意味を捉える
文全体の理解はできない
単語単位の表現

BERT

Transformerベースの言語モデル
双方向に文脈を理解
文全体を考慮した表現を生成

ポイント：

文脈理解が可能
事前学習＋微調整
現在のNLPの中心技術

いつ使う？（得意・不得意）

TF-IDFが向く場面

シンプルな文章分類
計算コストを抑えたい場合
ベースラインモデル

Word2Vecが向く場面

単語の意味類似度計算
特徴量として単語ベクトルを使いたい場合

BERTが向く場面

感情分析
質問応答
文脈理解が重要なタスク全般

G検定ひっかけポイント

G検定では、次の混同を狙ってきます。

よくある誤解

❌「TF-IDFは意味を理解する」
❌「Word2Vecは文全体を理解する」
❌「BERTは単なる特徴量手法」

正しい判断基準

頻度ベース → TF-IDF
意味の近さ → Word2Vec
文脈理解 → BERT

問題文に
「出現頻度」「重み付け」
とあれば TF-IDF。

「意味が近い単語」
とあれば Word2Vec。

「文脈」「双方向」「事前学習モデル」
とあれば BERT。

まとめ（試験直前用）

TF-IDF：頻度だけ
Word2Vec：単語の意味
BERT：文脈理解
文脈をどこまで扱うかで切る
賢さの段階で覚える