ds linear-algebra math
DS検定トップ
> ユーグリッドノルムとは?(ベクトルの長さの測り方)【DS検定】
まず結論
ユーグリッドノルムは、ベクトルを「長さ(大きさ)」として1つの数にまとめるものです。 DS検定では「距離」や「似ている/似ていない」を判断する土台として、ノルムの意味が分かっているかを問われやすいです。
直感的な説明
ベクトルは「矢印」だと思うと楽です。
- 矢印の向き → どっちの方向にズレているか
- 矢印の長さ → どれくらいズレているか
ユーグリッドノルムは、この「矢印の長さ」を出す方法です。 たとえば、
- 顧客の特徴(年齢・購入回数・利用金額)を3つの数で表す
- その3つをまとめて「平均との差がどれくらい大きいか」を1つの数で見たい
みたいなときに出番があります。
定義・仕組み
ユーグリッドノルムは、ざっくり言うと次の流れです。
- 各要素を二乗して(マイナスを消して)
- 足し算して(全部の大きさを合体して)
- ルートを取る(元のスケールに戻す)
式で書くと(※意味だけ押さえればOK):
- ベクトル (x = (x_1, x_2, \dots, x_n)) のユーグリッドノルムは
-
( x = \sqrt{x_1^2 + x_2^2 + \dots + x_n^2})
3行1列(3×1)の例(ここでミスりやすい!)
たとえば次のベクトル:
\[\begin{bmatrix} 3\ 4\ 12 \end{bmatrix}\]ユーグリッドノルムは (\sqrt{3^2 + 4^2 + 12^2} = \sqrt{9 + 16 + 144} = \sqrt{169} = 13)
ポイント:縦に3つ並んでいても、やることは「全部二乗して足す」だけです。 「3行1列だから3で割る」「平均を取る」みたいな操作はしません。
どんな場面で使う?
使うべき場面
- 距離として使いたいとき(例:k近傍法、クラスタリングの距離)
- 誤差の大きさを1つの数で見たいとき(例:予測と実測のズレの大きさ)
- 似ている/似ていないの判断の土台
使うと誤解しやすい場面
-
特徴量の単位がバラバラ(年齢と金額など)なのに、そのまま距離を取る
- 金額が距離を支配してしまい「年齢の差」がほぼ無視される、が起きがち
- こういうときは「標準化」などの前処理がセットで出てきます
よくある誤解・混同
-
誤解1:ノルム=平均との差(平均を引く)
- ⭕ ノルムは「長さ」。平均との差を取りたいなら、まず平均との差ベクトルを作ってからノルムを取る
-
誤解2:ユーグリッドノルム=要素を足すだけ
- ⭕ 二乗→和→ルート。足すだけだとマイナスで相殺してしまう
-
誤解3:ユーグリッド距離とユーグリッドノルムが別物
- かなり近いです
- 2点 (a) と (b) のユーグリッド距離は、差 (a-b) のユーグリッドノルム
- DS検定ではここを混同させてくることがあります
-
選択肢で注意:
- 「ノルム=平均」
- 「次元(要素数)で割る」
- 「符号が残る」 みたいに書かれていたら、だいたい誤りです。
まとめ(試験直前用)
- ユーグリッドノルム=ベクトルを「長さ」にして1つの数にする
- やることは二乗→足す→ルート(マイナスを消して大きさを合体)
- ユーグリッド距離=2点の差ベクトルのユーグリッドノルム
- 単位が違う特徴量で距離を取るなら、標準化など前処理とセットで考える
対応スキル項目(データサイエンス力シート)
- 数学基礎
- 線形代数
- ★ 行列同士、および行列とベクトルの計算方法を正しく理解し、複数の線形式を行列の積で表現できる
🔗 関連記事
- eの微分・積分を最短で整理【DS検定リテラシー】
- 行列の固有値とは?意味を直感で整理【DS検定】
- 逆行列とは何か?求め方と意味をやさしく整理【DS検定】
- 行列の掛け算とは?(行列同士の掛け算)【DS検定リテラシー】
- 数理・アルゴリズム・データ活用基礎(オプション)【DS検定対応】