Python
【音声認識2023】音声からテキストへ変換する「Faster Whisper」でYouTube動画の文字起こしを実装する

今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を実装する方法を紹介します。 基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 […]

続きを読む
Python
【Huggingface Transformers】日本語↔英語の翻訳を実装する

このシリーズでは自然言語処理の最先端技術である「Transformer」に焦点を当て、環境構築から学習方法までを紹介します。 今回の記事では、Huggingface Transformersを利用した日本語&#x2194 […]

続きを読む
Python
【Segment Anything②】Google Colabでマスクの自動生成を実装する

今回の記事ではSegment Anything Modelによるマスクの自動生成の実装について紹介します。実際にマスクの自動生成を実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後まで […]

続きを読む
Python
【Segment Anything】Google Colabでゼロショットセグメンテーションを実装する

今回の記事ではSegment Anythingについて紹介します。実際にゼロショットのセグメンテーションを実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後までご覧ください。 Segm […]

続きを読む
E資格
【E資格】第20回:パタメータの更新手法の比較【ゼロから作るDeep Learning】

このシリーズではE資格対策として、書籍「ゼロから作るDeep Learning」を参考に学習に役立つ情報をまとめています。 <参考書籍> 更新手法の比較 異なる最適化アルゴリズム(SGD, Momentum, […]

続きを読む