Skip to the content.

G検定トップ > 形態素解析(Morphological Analysis)とは?【G検定対策】

まず結論

形態素解析(Morphological Analysis)とは、
文章を意味を持つ最小単位(形態素)に分割し、それぞれに品詞などの情報を付与する処理である。
G検定では「分割する工程か?意味や構造を解析する工程か?」を正しく区別できるかが問われる。


直感的な説明

形態素解析は、
「文章を、言葉として扱える最小の部品に分解する作業」

たとえば
「私はリンゴを食べる」

  • 私 / は / リンゴ / を / 食べる

のように分けて、

  • 名詞
  • 助詞
  • 動詞

といった 品詞ラベル を付ける。

👉
意味理解やベクトル化の“前段階”にあたる処理。


定義・仕組み

形態素解析とは、

文を 形態素(意味を持つ最小単位) に分割し、
各形態素に 品詞・活用形・原形 などの情報を付与する自然言語処理の基本技術

である。

重要なポイント:

  • 単語に分けるだけではない
  • 品詞情報を付与するのが本質
  • 日本語のように 単語境界が曖昧な言語で特に重要

代表的なツール:

  • MeCab
  • Janome

いつ使う?(得意・不得意)

形態素解析が使われる場面

  • 日本語テキスト処理の最初の工程
  • 単語カウント(Bag of Words)
  • TF-IDF、Word Embedding の前処理

注意点

  • 意味理解そのものは行わない
  • 文の

🔗 関連記事


🏠 G検トップに戻る