Skip to the content.

DS検定トップ > 機械学習で解決する代表的なタスクとは?(分類・予測・クラスタリング・異常検知・時系列予測・レコメンド)【DS検定】

まず結論

機械学習で解決する代表的なタスクとは、 データからパターンを学習して問題を解決する処理の種類のことです。

DS検定では特に次のタスクがよく登場します。

分類(Classification)

予測(回帰:Regression)

クラスタリング(Clustering)

異常検知(Anomaly Detection)

時系列予測(Time Series Forecasting)

レコメンド(Recommendation)

DS検定では 「この問題はどのタスクに当たるか?」 を判断させる問題がよく出ます。

直感的な説明

機械学習は簡単に言うと

「データからパターンを学んで判断する仕組み」

です。

企業では次のような目的で使われます。

やりたいこと 機械学習タスク

メールが迷惑メールか判定 分類 売上を予測 回帰 顧客を似たグループに分ける クラスタリング 不正アクセスを見つける 異常検知 将来の需要を予測 時系列予測 商品のおすすめを提示 レコメンド

つまり

「何を判断したいのか」

によってタスクが決まります。

定義・仕組み

分類(Classification)

データを決められたカテゴリに分類するタスクです。

メール → スパム / 通常

画像 → 犬 / 猫

顧客 → 購入する / しない

特徴

出力は カテゴリ

教師あり学習

予測(回帰:Regression)

数値を予測するタスクです。

売上予測

気温予測

来客数予測

特徴

出力は 数値

連続値を扱う

DS検定では

分類(カテゴリ) vs 回帰(数値)

を区別する問題がよく出ます。

クラスタリング(Clustering)

似ているデータを自動でグループ化するタスクです。

顧客の購買傾向からグループ化

商品の特徴から分類

特徴

正解ラベルなし

教師なし学習

異常検知(Anomaly Detection)

通常とは異なるデータを検出するタスクです。

不正クレジットカード利用

サイバー攻撃

設備故障

特徴

正常データとの違いを検出

時系列予測(Time Series Forecasting)

時間の流れを考慮して未来を予測するタスクです。

売上予測

電力需要予測

株価予測

特徴

データに時間順序がある

レコメンド(Recommendation)

ユーザーに合った商品やコンテンツを推薦するタスクです。

ECサイトの商品おすすめ

動画配信サービス

音楽配信サービス

どんな場面で使う?

タスク 活用例

分類 スパム判定、画像認識 回帰 売上予測 クラスタリング 顧客セグメント 異常検知 不正検知 時系列予測 需要予測 レコメンド 商品推薦

機械学習タスクの全体像

機械学習 │ ├─ 教師あり学習 │ ├─ 分類 │ ├─ 回帰 │ └─ 時系列予測 │ └─ 教師なし学習 ├─ クラスタリング └─ 異常検知

(レコメンドは両方の手法が使われる)

よくある誤解・混同

分類 vs クラスタリング

分類 クラスタリング

正解ラベルあり 正解ラベルなし 教師あり学習 教師なし学習

回帰 vs 時系列予測

回帰 時系列

数値予測 時間データ 時間順序なし 時間順序あり

分類・回帰・クラスタリングの一発判定

正解ラベルはあるか?

YES │ ├─ 出力がカテゴリ → 分類 └─ 出力が数値 → 回帰

NO │ ├─ 似たものをまとめる → クラスタリング └─ 普通と違うものを見つける → 異常検知

DS検定では、

出力が何か

正解ラベルがあるか

時間の流れを考えるか

の3点で見分けると整理しやすいです。

まとめ(試験直前用)

分類=カテゴリを予測

回帰=数値を予測

クラスタリング=似たデータを自動で分ける

異常検知=普通と違うデータを見つける

時系列予測=時間順序を使って未来を予測

レコメンド=ユーザーに合う候補を提示

対応スキル項目(データサイエンス力)

機械学習

タスク理解

★ 問題設定に応じて適切な機械学習タスクを判別できる

🔗 関連記事


🏠 DS検定トップに戻る