【G検定まとめ】要点整理&当日用カンペの項目別詳解ページです。

詳細な知識や実装は試験には必ずしも必須ではありませんが、試験対策として理解を深めたい方はぜひ最後までご覧ください。

G検定まとめはこちら

分類問題と回帰問題

教師あり学習の問題は出力値の種類によって、大きく2種類(回帰と分類問題)に分けられる。分類問題は出力が離散値であり、カテゴリを予測したいときに利用される。回帰問題は出力が連続値であり、その連続値そのものを予測したいときに利用される。

概要

分類の個別のカテゴリ変数を予測することです。このアルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを特定のカテゴリまたはクラス ラベルにマッピングすることを学習します。たとえば、分類アルゴリズムをトレーニングして、電子メールの内容に基づいて電子メールがスパムかどうかを予測できます。

回帰の目的は連続数値変数を予測することです。アルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを連続出力値にマッピングすることを学習します。たとえば、回帰アルゴリズムをトレーニングして、場所、寝室の数、面積などの特徴に基づいて家の価格を予測できます。

分類問題では、出力は「はい」または「いいえ」のような離散値ですが、回帰問題では、出力は実数のような連続値です。

分類問題

機械学習における分類問題の典型的な例は、電子メールのスパム検出です。一連の電子メールが与えられた場合、目標は、送信者、件名、電子メールの内容などの特徴に基づいて各電子メールを「スパム」または「非スパム」に分類するように機械学習モデルをトレーニングすることです。特徴は一連の数値変数またはカテゴリ変数として表すことができ、ロジスティック回帰、デシジョン ツリー、またはサポート ベクター マシンなどのアルゴリズムを使用してモデルをトレーニングできます。トレーニングされたモデルを使用して、新しい受信メールをスパムまたは非スパムとして分類できます。

分類の問題の一般的な例には、次のものがあります。

  1. 画像分類: 画像内のオブジェクトまたはシーンを予測します。
  2. 感情分析: ポジティブ、ネガティブ、ニュートラルなど、特定のテキストの感情を予測します。
  3. スパム検出: メールがスパムかどうかを予測します。
  4. 不正検出: 金融取引が不正かどうかを予測します。
  5. 診断予測: 症状と患者データに基づいて医療診断を予測します。
  6. 顧客離れ予測: 顧客がサービスの使用をやめるかどうかを予測します。
  7. ローンのデフォルト予測: 借り手がローンをデフォルトするかどうかを予測します。
  8. 株価予測: 将来の株価を予測すること。

回帰問題

機械学習における回帰問題の典型的な例は、家の価格を予測することです。場所、サイズ、ベッドルームとバスルームの数、築年数などの一連の特徴を考慮して、これらの特徴に基づいて家の価格を予測できるモデルをトレーニングすることが目標です。このモデルは、住宅とその価格のラベル付きデータセットでトレーニングし、それを使用して、まだ見ぬ新しい住宅の予測を行うことができます。予測は、金額などの連続値として表すことができるため、これは分類問題ではなく回帰問題になります。

回帰問題の例を次に示します。

  1. 住宅価格予測: 場所、寝室の数、面積などの特徴に基づいて住宅の販売価格を予測します。
  2. 株価予測: 過去の株価やその他の市場データに基づいて、将来の株価を予測します。
  3. 需要予測: マーケティング キャンペーン、経済指標、過去の販売データなどの要因に基づいて、製品の需要を予測します。
  4. エネルギー消費予測: 環境変数と使用パターンに基づいて、建物または家庭のエネルギー消費を予測します。
  5. 医療結果の予測: 人口統計データと病歴データに基づいて、患者の入院期間または再入院の可能性を予測します。
  6. 気候変動予測: 過去の気候データと現在の環境条件に基づいて、将来の気温、降水量、およびその他の気象パターンを予測します。

回帰問題の簡単な実装例

回帰問題

Python での単純な線形回帰問題の実装例を次に示します。モデルを使用して予測を行い、元のデータと回帰直線をプロットします

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# generate some random data
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 3, 2, 5, 7, 8, 8, 9, 10, 12])

# create a linear regression model and fit the data
model = LinearRegression()
model.fit(x.reshape(-1, 1), y)

# make predictions using the model
y_pred = model.predict(x.reshape(-1, 1))

# plot the data and the regression line
plt.scatter(x, y)
plt.plot(x, y_pred, color='red')
plt.show()

結果のグラフは次のとおりです。赤い線はデータに最も適合する回帰直線を表し、青い点は元のデータ ポイントを表します。

G検定学習法

最後までご覧いただきありがとうございました。

当サイトではG検定に役立つ情報をまとめています。

ぜひご覧ください。

本サイトの活用方法

【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】

G検定の要点をシラバスから抜粋してまとめました。これから学習する方も、復習したい方にもお使いいただけます。試験当日用のG検定のカンニングペーパー参考としてもお役立てください。試験結果を保証するものではありませんので、試験 […]

G検定シラバス改訂の概要と変更のポイント

シラバス改訂の概要 一般社団法人日本ディープラーニング協会(JDLA)は、2024年11月実施の「G検定2024 #6」よりG検定(ジェネラリスト検定)のシラバスを改訂すると発表しました。 JDLAによると、今回の改訂で […]

【G検定2024まとめ】理解度確認問題集【直前対策】

問題 すべての問題の解答が終わると答えを見ることができます。 解説動画 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シ […]

【G検定まとめ2024】YouTube動画リスト(問題編)

講義編はこちら 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シラバス改訂の概要と変更のポイント 2024年6 […]

【G検定まとめ2024】YouTube動画リスト(講義編)

問題編はこちら 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シラバス改訂の概要と変更のポイント 2024年6 […]

【G検定まとめ2024】試験当日も使える! 要点整理&試験対策カンペ【旧シラバス】

G検定の要点をシラバスから抜粋してまとめました。これから学習する方も、復習したい方にもお使いいただけます。試験当日用のG検定のカンニングペーパー参考としてもお役立てください。試験結果を保証するものではありませんので、試験 […]

参考書籍

教科書として使用する書籍

体系的に知識を整理することができます。

まずは、この1冊を読んでG検定の学習を進めましょう。

検索機能が使用できるので、Kindle版が特におすすめです。

②問題集として使用する書籍

ある程度学習が進んだら、本番を意識して問題集に取り組みましょう。

本番の試験環境を意識して、このページ「要点整理&当日用カンペ」を使用しながら解答してみましょう。