【G検定】分類問題と回帰問題

【G検定まとめ】要点整理＆当日用カンペの項目別詳解ページです。

詳細な知識や実装は試験には必ずしも必須ではありませんが、試験対策として理解を深めたい方はぜひ最後までご覧ください。

G検定まとめはこちら

分類問題と回帰問題

教師あり学習の問題は出力値の種類によって、大きく2種類（回帰と分類問題）に分けられる。分類問題は出力が離散値であり、カテゴリを予測したいときに利用される。回帰問題は出力が連続値であり、その連続値そのものを予測したいときに利用される。

概要

分類の個別のカテゴリ変数を予測することです。このアルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを特定のカテゴリまたはクラスラベルにマッピングすることを学習します。たとえば、分類アルゴリズムをトレーニングして、電子メールの内容に基づいて電子メールがスパムかどうかを予測できます。

回帰の目的は連続数値変数を予測することです。アルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを連続出力値にマッピングすることを学習します。たとえば、回帰アルゴリズムをトレーニングして、場所、寝室の数、面積などの特徴に基づいて家の価格を予測できます。

分類問題では、出力は「はい」または「いいえ」のような離散値ですが、回帰問題では、出力は実数のような連続値です。

分類問題

機械学習における分類問題の典型的な例は、電子メールのスパム検出です。一連の電子メールが与えられた場合、目標は、送信者、件名、電子メールの内容などの特徴に基づいて各電子メールを「スパム」または「非スパム」に分類するように機械学習モデルをトレーニングすることです。特徴は一連の数値変数またはカテゴリ変数として表すことができ、ロジスティック回帰、デシジョンツリー、またはサポートベクターマシンなどのアルゴリズムを使用してモデルをトレーニングできます。トレーニングされたモデルを使用して、新しい受信メールをスパムまたは非スパムとして分類できます。

分類の問題の一般的な例には、次のものがあります。

画像分類: 画像内のオブジェクトまたはシーンを予測します。
感情分析: ポジティブ、ネガティブ、ニュートラルなど、特定のテキストの感情を予測します。
スパム検出: メールがスパムかどうかを予測します。
不正検出: 金融取引が不正かどうかを予測します。
診断予測: 症状と患者データに基づいて医療診断を予測します。
顧客離れ予測: 顧客がサービスの使用をやめるかどうかを予測します。
ローンのデフォルト予測: 借り手がローンをデフォルトするかどうかを予測します。
株価予測: 将来の株価を予測すること。

回帰問題

機械学習における回帰問題の典型的な例は、家の価格を予測することです。場所、サイズ、ベッドルームとバスルームの数、築年数などの一連の特徴を考慮して、これらの特徴に基づいて家の価格を予測できるモデルをトレーニングすることが目標です。このモデルは、住宅とその価格のラベル付きデータセットでトレーニングし、それを使用して、まだ見ぬ新しい住宅の予測を行うことができます。予測は、金額などの連続値として表すことができるため、これは分類問題ではなく回帰問題になります。

回帰問題の例を次に示します。

住宅価格予測: 場所、寝室の数、面積などの特徴に基づいて住宅の販売価格を予測します。
株価予測: 過去の株価やその他の市場データに基づいて、将来の株価を予測します。
需要予測: マーケティングキャンペーン、経済指標、過去の販売データなどの要因に基づいて、製品の需要を予測します。
エネルギー消費予測: 環境変数と使用パターンに基づいて、建物または家庭のエネルギー消費を予測します。
医療結果の予測: 人口統計データと病歴データに基づいて、患者の入院期間または再入院の可能性を予測します。
気候変動予測: 過去の気候データと現在の環境条件に基づいて、将来の気温、降水量、およびその他の気象パターンを予測します。

回帰問題の簡単な実装例

回帰問題

Python での単純な線形回帰問題の実装例を次に示します。モデルを使用して予測を行い、元のデータと回帰直線をプロットします

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# generate some random data
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 3, 2, 5, 7, 8, 8, 9, 10, 12])

# create a linear regression model and fit the data
model = LinearRegression()
model.fit(x.reshape(-1, 1), y)

# make predictions using the model
y_pred = model.predict(x.reshape(-1, 1))

# plot the data and the regression line
plt.scatter(x, y)
plt.plot(x, y_pred, color='red')
plt.show()

結果のグラフは次のとおりです。赤い線はデータに最も適合する回帰直線を表し、青い点は元のデータポイントを表します。

G検定学習法

最後までご覧いただきありがとうございました。

当サイトではG検定に役立つ情報をまとめています。

ぜひご覧ください。

参考書籍

①教科書として使用する書籍

体系的に知識を整理することができます。

まずは、この１冊を読んでG検定の学習を進めましょう。

検索機能が使用できるので、Kindle版が特におすすめです。

②問題集として使用する書籍

ある程度学習が進んだら、本番を意識して問題集に取り組みましょう。

本番の試験環境を意識して、このページ「要点整理＆当日用カンペ」を使用しながら解答してみましょう。

カテゴリー: G検定、資格

タグ: G検定

分類問題と回帰問題

概要

分類問題

回帰問題

回帰問題の簡単な実装例

回帰問題

G検定学習法

本サイトの活用方法

【G検定2024最新】試験当日も使える! 187項目の要点整理＆試験対策カンペ【新シラバス対応】

G検定シラバス改訂の概要と変更のポイント

【G検定試験対策】理解度確認問題集全200問【直前対策】

【G検定まとめ2024】YouTube動画リスト（問題編）

【G検定まとめ2024】YouTube動画リスト（講義編）

【G検定まとめ2024】試験当日も使える! 要点整理＆試験対策カンペ【旧シラバス】

参考書籍

【G検定】第3次AIブームとディープラーニング

新BingのAIチャットの概要と事例まとめ

【G検定】分類問題と回帰問題

分類問題と回帰問題

概要

分類問題

回帰問題

回帰問題の簡単な実装例

回帰問題

G検定学習法

本サイトの活用方法

【G検定2024最新】試験当日も使える! 187項目の要点整理＆試験対策カンペ【新シラバス対応】

G検定シラバス改訂の概要と変更のポイント

【G検定試験対策】理解度確認問題集 全200問【直前対策】

【G検定まとめ2024】YouTube動画リスト（問題編）

【G検定まとめ2024】YouTube動画リスト（講義編）

【G検定まとめ2024】試験当日も使える! 要点整理＆試験対策カンペ【旧シラバス】

参考書籍

【G検定】第3次AIブームとディープラーニング

新BingのAIチャットの概要と事例まとめ

【G検定試験対策】理解度確認問題集全200問【直前対策】