A教師あり学習(Supervised Learning)
入力データと正解ラベルのペアを大量に与えて学習させ、未知の入力に対する予測を行う方式。出力が離散値なら「分類」、連続値なら「回帰」と呼びます。スパム判定や売上予測など多くの実用例があります。
入力と正解のペアで学習
分類(離散)と回帰(連続)に大別
ラベル付きデータの整備が前提
機械学習の3分類のうち2つ。教師あり学習は「正解ラベル付きデータ」から学び、教師なし学習は「ラベルのないデータ」から構造やパターンを発見します。残る1つの強化学習は、行動と報酬から学習する別アプローチです。
| 観点 | 教師あり学習 | 教師なし学習 |
|---|---|---|
| 正解ラベル | 必要(入力と正解のペア) | 不要(入力データのみ) |
| 主なタスク | 分類・回帰 | クラスタリング・次元削減・異常検知 |
| 代表的な手法 | 線形回帰、ロジスティック回帰、決定木、SVM、ニューラルネット | k-means法、階層的クラスタリング、主成分分析(PCA) |
| 使い所 | スパム判定、与信スコア、需要予測 | 顧客セグメント、異常検知、データ可視化 |
入力データと正解ラベルのペアを大量に与えて学習させ、未知の入力に対する予測を行う方式。出力が離散値なら「分類」、連続値なら「回帰」と呼びます。スパム判定や売上予測など多くの実用例があります。
入力と正解のペアで学習
分類(離散)と回帰(連続)に大別
ラベル付きデータの整備が前提
正解ラベルのないデータから、データに潜む構造やパターンを自動的に見つけ出す方式。似たデータをグループ化するクラスタリング、次元を圧縮する主成分分析、外れ値を見つける異常検知などが代表的です。
ラベル不要でデータ構造を発見
k-means法・階層クラスタリングが代表
顧客セグメンテーションや異常検知に活用
「教師あり=ラベルあり・分類/回帰」「教師なし=ラベルなし・クラスタリング/次元削減」。3分類目の強化学習(行動と報酬で学習)も併せて押さえる。
Q1. 教師あり学習の例として最も適切なものはどれか。
正解:2. 過去のメールから新着メールがスパムかを判定する
スパム判定は入力(メール)と正解ラベル(スパム/非スパム)のペアで学習する典型的な教師あり学習(分類)。
Q2. 教師なし学習に分類されるアルゴリズムはどれか。
正解:3. k-means法
k-means法はデータをk個のクラスタに分割する代表的な教師なし学習アルゴリズム。他は教師あり学習。
Q3. 機械学習における「分類」と「回帰」の違いとして最も適切なものはどれか。
正解:2. 分類は離散値の予測、回帰は連続値の予測
どちらも教師あり学習。出力が離散値(カテゴリ)なら分類、連続値(数値)なら回帰。