CNNにおいて画像データまたは特徴マップを空間的な局所ごとに代表値に集約することで、解像度を下げる層の名称として、最も適切なものを1つ選べ。
CNNにおいて、畳み込み層の出力に対して非線形な変換を行う層の名称として、最も適切なものを1つ選べ。
CNNにおいて、活性化関数としてよく使われるReLU関数の式として、最も適切なものを1つ選べ。
CNNの学習に利用する画像データに対して行うべきではない処理を1つ選べ。
以下の画像認識に用いるモデルに関する説明として、最も適切なものを1つ選べ。
以下の画像認識に用いるモデルに関する説明として、最も適切でないものを1つ選べ。
RNNを用いた自然言語処理の説明として、最も適切なものを1つ選べ。
GANでは生成器Gと識別器Dが相互に学習しながら進化していく。以下のうち、GANの学習におけるGとDの目的関数として正しいものを1つ選べ。
物体検出は、画像に写っている物体の分類と位置の特定を行うタスクである。代表的な2段階モデルのアルゴリズムとして、最も適切なものを1つ選べ。
セマンティックセグメンテーションタスクに用いる手法の1つであるU-Netの説明として、最も適切なものを1つ選べ。
セマンティックセグメンテーションタスクに用いる手法の1つであるFCNの説明として、最も適切なものを1つ選べ。
リカレントニューラルネットワーク(RNN)の中で、過去の時刻の情報を長期的に保持できる構造として、最も適切なものを1つ選べ。
LSTMにおける入力ゲートは、長期記憶に追加する情報の量を決めるためのゲートである。入力ゲートは、入力 xt と一つ前のセルの出力値 ht-1 を受け取り、どのような関数を用いて計算するか。
深層強化学習に関する以下の文章のうち、最も適切なものを1つ選べ。
強化学習のアルゴリズムに関する以下の文章のうち、最も適切なものを1つ選べ。
DeepMind社が開発し、ルールを教えられずに囲碁や将棋などのゲームをマスターした、強化学習が使われているプログラムを以下の選択肢から1つ選んで答えよ。
DeepMind社が開発し、チェスや将棋などのボードゲームだけでなく、ビデオゲームの「スタークラフトⅡ」でも人間を超えた、深層強化学習が使われているプログラムを以下の選択肢から1つ選んで答えよ。
DeepMind社が開発し、タンパク質の立体構造を予測することができる、深層学習が使われているプログラムを以下の選択肢から1つ選んで答えよ。
新しい問題を作りました。以下の文章を読んで、空欄(ア)~(エ)に当てはまる語句の組み合わせとしてふさわしいものを1つ選んで答えてください。 音声生成モデルの代表例として、( ア )と( イ )の2つのモデルがあります。( ア )は教師あり学習の手法でもある( ウ )を応用したもので、テキストから音声波形を直接生成することによって、高品質な音声合成を可能にしています。一方の( イ )は、2つのネットワークを連結することによって、テキストから音声特徴量を生成し、それから音声波形を生成することを可能にしています。この2つのネットワークは( エ )と呼ばれています。
以下の文章を読んで、空欄(ア)~(エ)に当てはまる語句の組み合わせとしてふさわしいものを1つ選んで答えてください。 画像分類モデルの代表例として、( ア )と( イ )の2つのモデルがあります。( ア )は畳み込みニューラルネットワーク(CNN)を応用したもので、画像から特徴量を抽出することによって、画像がどのクラスに属するかを判定します。一方の( イ )は、CNNと再帰型ニューラルネットワーク(RNN)を組み合わせたもので、画像からキャプション(文章)を生成することができます。この2つのモデルは( ウ )や( エ )などの応用分野に使われています。
以下の文章を読んで、空欄(ア)~(オ)に当てはまる語句の組み合わせとしてふさわしいものを1つ選んで答えてください。 画像分類モデルとは、画像を何らかの主題に基づき分類する処理方法です。画像分類モデルは、画像から特徴量を抽出する部分(学習部分)と、その特徴量から種類を分類する部分(判別器)で構成されています。画像から特徴量を抽出する部分では、畳み込みニューラルネットワーク(CNN)がよく使われます。CNNは、( ア )や( イ )などの演算を繰り返すことで、画像のテクスチャや色や形状などのパターンを見つけることができます。CNNには様々な種類がありますが、代表的なものとして( ウ )や( エ )などがあります。( ウ )は層数が非常に深い(152層など)にもかかわらず、勾配消失問題(gradient vanishing problem)を回避することができる工夫がされています。( エ )はCNNと再帰型ニューラルネットワーク(RNN)を組み合わせたもので、画像からキャプション(文章)を生成することができます。これらのモデルはImageNet Large Scale Visual Recognition Challenge (ILSVRC)やMicrosoft COCO Image Captioning Challengeなどのコンペティションで高い性能を示しました。また、これらのモデルは( オ )や画像検索などの応用分野に使われています。
Faster R-CNN、YOLO、SSDの中で、最も高速な手法はどれか。1つ選べ。
以下の選択肢の中から、単語埋め込みモデルの特徴として正しいものを1つ選べ。
自然言語処理分野においてもディープラーニングは成果を上げている。自然言語処理のいくつかの用語について整理する。品詞タグ付けと関連性の深いものとして、最も適切なものを1つ選べ。
自然言語処理分野においてもディープラーニングは成果を上げている。自然言語処理のいくつかの用語について整理する。構文解析と関連性の深いものとして、最も適切なものを1つ選べ。
自然言語処理分野においてもディープラーニングは成果を上げている。自然言語処理のいくつかの用語について整理する。BERTと関連性の深いものとして、最も適切なものを1つ選べ。
自然言語処理分野においてもディープラーニングは成果を上げている。自然言語処理のいくつかの用語について整理する。GPT-3と関連性の深いものとして、最も適切なものを1つ選べ。
word2vecで用いられる単語(あるいは項目)のベクトルを可視化するとき、最も適切なものを1つ選べ。
word2vecで用いられる単語(あるいは項目)のベクトルを足し算や引き算するとき、以下の式の結果として最も適切な単語を1つ選べ。 「日本」-「東京」+「パリ」=?
音声認識技術は、人間の発話をテキストやコマンドに変換する技術である。音声認識技術には、音響モデルと言語モデルの2つの要素が必要である。音響モデルと言語モデルに関して述べた以下の文章のうち、適切なものを全て選べ。
音声認識技術は、さまざまな応用分野で利用されている。たとえば、自動車やスマートフォンなどのデバイスに搭載された音声アシスタントは、音声認識技術を利用してユーザーの要求に応える。音声アシスタントに関して述べた以下の文章のうち、最も適切なものを1つ選べ。
音声認識技術は、音声信号をテキストやコマンドに変換するだけでなく、音声信号の特徴や属性を分析することもできる。たとえば、話者の年齢や性別、感情などを推定することが可能である。音声信号の特徴や属性に関して述べた以下の文章のうち、最も適切なものを1つ選べ。
DQNで用いられた深層ニューラルネットワークの役割は次のうちのどれに当たるか、最も適切なものを1つ選べ。
DQNでは経験リプレイという手法を用いて学習を安定化させています。経験リプレイとは次のうちのどれに当たるか、最も適切なものを1つ選べ。
次の強化学習に関連する用語のうち、正しい組み合わせはどれか、1つ選んで答えよ。
次の強化学習に関連する用語のうち、正しい組み合わせはどれか、1つ選んで答えよ。
トランスフォーマーにおけるAttentionの役割として、最も適切なものはどれか、1つ選んで答えよ。
トランスフォーマーのモデルには、エンコーダとデコーダという二つの部分があります。 このうち、エンコーダは何をする部分か、1つ選んで答えよ。
トランスフォーマーのモデルには、Multi-head Attentionという仕組みがあります。 これは、Attentionを複数回並列に行い、それらの結果を結合することで、何を実現するか、1つ選んで答えよ。