【G検定まとめ】要点整理&当日用カンペの項目別詳解ページです。
詳細な知識や実装は試験には必ずしも必須ではありませんが、試験対策として理解を深めたい方はぜひ最後までご覧ください。
G検定まとめはこちら
分類問題と回帰問題
教師あり学習の問題は出力値の種類によって、大きく2種類(回帰と分類問題)に分けられる。分類問題は出力が離散値であり、カテゴリを予測したいときに利用される。回帰問題は出力が連続値であり、その連続値そのものを予測したいときに利用される。
概要
分類の個別のカテゴリ変数を予測することです。このアルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを特定のカテゴリまたはクラス ラベルにマッピングすることを学習します。たとえば、分類アルゴリズムをトレーニングして、電子メールの内容に基づいて電子メールがスパムかどうかを予測できます。
回帰の目的は連続数値変数を予測することです。アルゴリズムは、ラベル付けされたデータセットでトレーニングされ、入力フィーチャを連続出力値にマッピングすることを学習します。たとえば、回帰アルゴリズムをトレーニングして、場所、寝室の数、面積などの特徴に基づいて家の価格を予測できます。
分類問題では、出力は「はい」または「いいえ」のような離散値ですが、回帰問題では、出力は実数のような連続値です。
分類問題
機械学習における分類問題の典型的な例は、電子メールのスパム検出です。一連の電子メールが与えられた場合、目標は、送信者、件名、電子メールの内容などの特徴に基づいて各電子メールを「スパム」または「非スパム」に分類するように機械学習モデルをトレーニングすることです。特徴は一連の数値変数またはカテゴリ変数として表すことができ、ロジスティック回帰、デシジョン ツリー、またはサポート ベクター マシンなどのアルゴリズムを使用してモデルをトレーニングできます。トレーニングされたモデルを使用して、新しい受信メールをスパムまたは非スパムとして分類できます。
分類の問題の一般的な例には、次のものがあります。
- 画像分類: 画像内のオブジェクトまたはシーンを予測します。
- 感情分析: ポジティブ、ネガティブ、ニュートラルなど、特定のテキストの感情を予測します。
- スパム検出: メールがスパムかどうかを予測します。
- 不正検出: 金融取引が不正かどうかを予測します。
- 診断予測: 症状と患者データに基づいて医療診断を予測します。
- 顧客離れ予測: 顧客がサービスの使用をやめるかどうかを予測します。
- ローンのデフォルト予測: 借り手がローンをデフォルトするかどうかを予測します。
- 株価予測: 将来の株価を予測すること。
回帰問題
機械学習における回帰問題の典型的な例は、家の価格を予測することです。場所、サイズ、ベッドルームとバスルームの数、築年数などの一連の特徴を考慮して、これらの特徴に基づいて家の価格を予測できるモデルをトレーニングすることが目標です。このモデルは、住宅とその価格のラベル付きデータセットでトレーニングし、それを使用して、まだ見ぬ新しい住宅の予測を行うことができます。予測は、金額などの連続値として表すことができるため、これは分類問題ではなく回帰問題になります。
回帰問題の例を次に示します。
- 住宅価格予測: 場所、寝室の数、面積などの特徴に基づいて住宅の販売価格を予測します。
- 株価予測: 過去の株価やその他の市場データに基づいて、将来の株価を予測します。
- 需要予測: マーケティング キャンペーン、経済指標、過去の販売データなどの要因に基づいて、製品の需要を予測します。
- エネルギー消費予測: 環境変数と使用パターンに基づいて、建物または家庭のエネルギー消費を予測します。
- 医療結果の予測: 人口統計データと病歴データに基づいて、患者の入院期間または再入院の可能性を予測します。
- 気候変動予測: 過去の気候データと現在の環境条件に基づいて、将来の気温、降水量、およびその他の気象パターンを予測します。
回帰問題の簡単な実装例
回帰問題
Python での単純な線形回帰問題の実装例を次に示します。モデルを使用して予測を行い、元のデータと回帰直線をプロットします
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# generate some random data
x = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
y = np.array([1, 3, 2, 5, 7, 8, 8, 9, 10, 12])
# create a linear regression model and fit the data
model = LinearRegression()
model.fit(x.reshape(-1, 1), y)
# make predictions using the model
y_pred = model.predict(x.reshape(-1, 1))
# plot the data and the regression line
plt.scatter(x, y)
plt.plot(x, y_pred, color='red')
plt.show()
結果のグラフは次のとおりです。赤い線はデータに最も適合する回帰直線を表し、青い点は元のデータ ポイントを表します。
G検定学習法
最後までご覧いただきありがとうございました。
当サイトではG検定に役立つ情報をまとめています。
ぜひご覧ください。
本サイトの活用方法
【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】
G検定の要点をシラバスから抜粋してまとめました。これから学習する方も、復習したい方にもお使いいただけます。試験当日用のG検定のカンニングペーパー参考としてもお役立てください。試験結果を保証するものではありませんので、試験 […]
G検定シラバス改訂の概要と変更のポイント
シラバス改訂の概要 一般社団法人日本ディープラーニング協会(JDLA)は、2024年11月実施の「G検定2024 #6」よりG検定(ジェネラリスト検定)のシラバスを改訂すると発表しました。 JDLAによると、今回の改訂で […]
【G検定2024まとめ】理解度確認問題集【直前対策】
問題 すべての問題の解答が終わると答えを見ることができます。 解説動画 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シ […]
【G検定まとめ2024】YouTube動画リスト(問題編)
講義編はこちら 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シラバス改訂の概要と変更のポイント 2024年6 […]
【G検定まとめ2024】YouTube動画リスト(講義編)
問題編はこちら 関連記事【G検定2024最新】試験当日も使える! 187項目の要点整理&試験対策カンペ【新シラバス対応】 2024年10月24日 G検定シラバス改訂の概要と変更のポイント 2024年6 […]
【G検定まとめ2024】試験当日も使える! 要点整理&試験対策カンペ【旧シラバス】
G検定の要点をシラバスから抜粋してまとめました。これから学習する方も、復習したい方にもお使いいただけます。試験当日用のG検定のカンニングペーパー参考としてもお役立てください。試験結果を保証するものではありませんので、試験 […]
参考書籍
①教科書として使用する書籍
体系的に知識を整理することができます。
まずは、この1冊を読んでG検定の学習を進めましょう。
検索機能が使用できるので、Kindle版が特におすすめです。
②問題集として使用する書籍
ある程度学習が進んだら、本番を意識して問題集に取り組みましょう。
本番の試験環境を意識して、このページ「要点整理&当日用カンペ」を使用しながら解答してみましょう。