Skip to the content.

DS検定トップ > ユーグリッドノルムとは?(ベクトルの長さの測り方)【DS検定】

まず結論

ユーグリッドノルムは、ベクトルを「長さ(大きさ)」として1つの数にまとめるものです。 DS検定では「距離」や「似ている/似ていない」を判断する土台として、ノルムの意味が分かっているかを問われやすいです。

直感的な説明

ベクトルは「矢印」だと思うと楽です。

  • 矢印の向き → どっちの方向にズレているか
  • 矢印の長さ → どれくらいズレているか

ユーグリッドノルムは、この「矢印の長さ」を出す方法です。 たとえば、

  • 顧客の特徴(年齢・購入回数・利用金額)を3つの数で表す
  • その3つをまとめて「平均との差がどれくらい大きいか」を1つの数で見たい

みたいなときに出番があります。

定義・仕組み

ユーグリッドノルムは、ざっくり言うと次の流れです。

  1. 各要素を二乗して(マイナスを消して)
  2. 足し算して(全部の大きさを合体して)
  3. ルートを取る(元のスケールに戻す)

式で書くと(※意味だけ押さえればOK):

  • ベクトル (x = (x_1, x_2, \dots, x_n)) のユーグリッドノルムは
  • ( x = \sqrt{x_1^2 + x_2^2 + \dots + x_n^2})

3行1列(3×1)の例(ここでミスりやすい!)

たとえば次のベクトル:

\[\begin{bmatrix} 3\ 4\ 12 \end{bmatrix}\]

ユーグリッドノルムは (\sqrt{3^2 + 4^2 + 12^2} = \sqrt{9 + 16 + 144} = \sqrt{169} = 13)

ポイント:縦に3つ並んでいても、やることは「全部二乗して足す」だけです。 「3行1列だから3で割る」「平均を取る」みたいな操作はしません。

どんな場面で使う?

使うべき場面

  • 距離として使いたいとき(例:k近傍法、クラスタリングの距離)
  • 誤差の大きさを1つの数で見たいとき(例:予測と実測のズレの大きさ)
  • 似ている/似ていないの判断の土台

使うと誤解しやすい場面

  • 特徴量の単位がバラバラ(年齢と金額など)なのに、そのまま距離を取る

    • 金額が距離を支配してしまい「年齢の差」がほぼ無視される、が起きがち
    • こういうときは「標準化」などの前処理がセットで出てきます

よくある誤解・混同

  • 誤解1:ノルム=平均との差(平均を引く)

    • ⭕ ノルムは「長さ」。平均との差を取りたいなら、まず平均との差ベクトルを作ってからノルムを取る
  • 誤解2:ユーグリッドノルム=要素を足すだけ

    • ⭕ 二乗→和→ルート。足すだけだとマイナスで相殺してしまう
  • 誤解3:ユーグリッド距離とユーグリッドノルムが別物

    • かなり近いです
    • 2点 (a) と (b) のユーグリッド距離は、差 (a-b) のユーグリッドノルム
    • DS検定ではここを混同させてくることがあります
  • 選択肢で注意:

    • 「ノルム=平均」
    • 「次元(要素数)で割る」
    • 「符号が残る」 みたいに書かれていたら、だいたい誤りです。

まとめ(試験直前用)

  • ユーグリッドノルム=ベクトルを「長さ」にして1つの数にする
  • やることは二乗→足す→ルート(マイナスを消して大きさを合体)
  • ユーグリッド距離=2点の差ベクトルのユーグリッドノルム
  • 単位が違う特徴量で距離を取るなら、標準化など前処理とセットで考える

対応スキル項目(データサイエンス力シート)

  • 数学基礎
  • 線形代数
  • ★ 行列同士、および行列とベクトルの計算方法を正しく理解し、複数の線形式を行列の積で表現できる

🔗 関連記事


🏠 DS検定トップに戻る