【G検定まとめ】要点整理&当日用カンペの項目別詳解ページです。

詳細な知識や実装は試験には必ずしも必須ではありませんが、試験対策として理解を深めたい方はぜひ最後までご覧ください。

G検定まとめはこちら

分類問題と回帰問題

教師あり学習の問題は出力値の種類によって、大きく2種類(回帰と分類問題)に分けられる。分類問題は出力が離散値であり、カテゴリを予測したいときに利用される。回帰問題は出力が連続値であり、その連続値そのものを予測したいときに利用される。

概要

分類の個別のカテゴリ変数を予測することです。このアルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを特定のカテゴリまたはクラス ラベルにマッピングすることを学習します。たとえば、分類アルゴリズムをトレーニングして、電子メールの内容に基づいて電子メールがスパムかどうかを予測できます。

回帰の目的は連続数値変数を予測することです。アルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを連続出力値にマッピングすることを学習します。たとえば、回帰アルゴリズムをトレーニングして、場所、寝室の数、面積などの特徴に基づいて家の価格を予測できます。

分類問題では、出力は「はい」または「いいえ」のような離散値ですが、回帰問題では、出力は実数のような連続値です。

分類問題

機械学習における分類問題の典型的な例は、電子メールのスパム検出です。一連の電子メールが与えられた場合、目標は、送信者、件名、電子メールの内容などの特徴に基づいて各電子メールを「スパム」または「非スパム」に分類するように機械学習モデルをトレーニングすることです。特徴は一連の数値変数またはカテゴリ変数として表すことができ、ロジスティック回帰、デシジョン ツリー、またはサポート ベクター マシンなどのアルゴリズムを使用してモデルをトレーニングできます。トレーニングされたモデルを使用して、新しい受信メールをスパムまたは非スパムとして分類できます。

分類の問題の一般的な例には、次のものがあります。

  1. 画像分類: 画像内のオブジェクトまたはシーンを予測します。
  2. 感情分析: ポジティブ、ネガティブ、ニュートラルなど、特定のテキストの感情を予測します。
  3. スパム検出: メールがスパムかどうかを予測します。
  4. 不正検出: 金融取引が不正かどうかを予測します。
  5. 診断予測: 症状と患者データに基づいて医療診断を予測します。
  6. 顧客離れ予測: 顧客がサービスの使用をやめるかどうかを予測します。
  7. ローンのデフォルト予測: 借り手がローンをデフォルトするかどうかを予測します。
  8. 株価予測: 将来の株価を予測すること。

回帰問題

機械学習における回帰問題の典型的な例は、家の価格を予測することです。場所、サイズ、ベッドルームとバスルームの数、築年数などの一連の特徴を考慮して、これらの特徴に基づいて家の価格を予測できるモデルをトレーニングすることが目標です。このモデルは、住宅とその価格のラベル付きデータセットでトレーニングし、それを使用して、まだ見ぬ新しい住宅の予測を行うことができます。予測は、金額などの連続値として表すことができるため、これは分類問題ではなく回帰問題になります。

回帰問題の例を次に示します。

  1. 住宅価格予測: 場所、寝室の数、面積などの特徴に基づいて住宅の販売価格を予測します。
  2. 株価予測: 過去の株価やその他の市場データに基づいて、将来の株価を予測します。
  3. 需要予測: マーケティング キャンペーン、経済指標、過去の販売データなどの要因に基づいて、製品の需要を予測します。
  4. エネルギー消費予測: 環境変数と使用パターンに基づいて、建物または家庭のエネルギー消費を予測します。
  5. 医療結果の予測: 人口統計データと病歴データに基づいて、患者の入院期間または再入院の可能性を予測します。
  6. 気候変動予測: 過去の気候データと現在の環境条件に基づいて、将来の気温、降水量、およびその他の気象パターンを予測します。

回帰問題の簡単な実装例

回帰問題

Python での単純な線形回帰問題の実装例を次に示します。モデルを使用して予測を行い、元のデータと回帰直線をプロットします

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# generate some random data
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 3, 2, 5, 7, 8, 8, 9, 10, 12])

# create a linear regression model and fit the data
model = LinearRegression()
model.fit(x.reshape(-1, 1), y)

# make predictions using the model
y_pred = model.predict(x.reshape(-1, 1))

# plot the data and the regression line
plt.scatter(x, y)
plt.plot(x, y_pred, color='red')
plt.show()

結果のグラフは次のとおりです。赤い線はデータに最も適合する回帰直線を表し、青い点は元のデータ ポイントを表します。

G検定学習法

最後までご覧いただきありがとうございました。

当サイトではG検定に役立つ情報をまとめています。

ぜひご覧ください。

本サイトの活用方法

【G検定まとめ2024】試験当日も使える! 要点整理&試験対策カンペ【動画】

1. 人工知能とは 第1回:人工知能の定義、人工知能研究の歴史 2. 人工知能をめぐる動向 第2回:探索・推論 第3回:知識表現、機械学習・深層学習 3. 人工知能分野の問題 第4回:人工知能分野の問題 4. 機械学習の […]

【G検定まとめ2024】試験当日も使える! 要点整理&試験対策カンペ

G検定の要点をシラバスから抜粋してまとめました。これから学習する方も、復習したい方にもお使いいただけます。試験当日用のG検定のカンニングペーパー参考としてもお役立てください。試験結果を保証するものではありませんので、試験 […]

【G検定2023まとめ】理解度確認&問題集まとめ【直前対策】

G検定の要点を問題形式にまとめました。試験前の理解度確認、直前対策にお役立てください。 (最終更新日:2023年3月1日) 1. 人工知能とは 問題を解く 2. 人工知能をめぐる動向 問題を解く 3. 人工知能分野の問題 […]

【G検定2023】G検定の概要と試験のポイント

このシリーズではG検定の要点を項目ごとにまとめています。 今回の記事では「G検定の概要と試験のポイント」について紹介します。 試験の概要  G検定(公式名:ジェネラリスト検定)は、JDLA:Japan Deep Lear […]

【G検定】G検定合格体験記 〜学習方法と受験体験〜

このシリーズではG検定の要点を項目ごとにまとめています。 今回の記事では、2022年7月2日(土)開催のG検定(2022#2 )に合格した学習方法と受験体験について紹介します。 これから受験される方へ参考になれば幸いです […]

【G検定2022】シラバスでみるG検定の試験内容

このシリーズではG検定の要点を項目ごとにまとめています。 今回の記事ではシラバスをもとに「G検定の試験内容」について紹介します。 試験の概要  G検定(公式名:ジェネラリスト検定)は、JDLA:Japan Deep Le […]

参考書籍

教科書として使用する書籍

体系的に知識を整理することができます。

まずは、この1冊を読んでG検定の学習を進めましょう。

検索機能が使用できるので、Kindle版が特におすすめです。

②問題集として使用する書籍

ある程度学習が進んだら、本番を意識して問題集に取り組みましょう。

本番の試験環境を意識して、このページ「要点整理&当日用カンペ」を使用しながら解答してみましょう。