【音声認識2023】音声からテキストへ変換する「Faster Whisper」でYouTube動画の文字起こしを実装する
2023年4月15日
今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を実装する方法を紹介します。 基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 […]
【Huggingface Transformers】日本語↔英語の翻訳を実装する
2023年4月14日
このシリーズでは自然言語処理の最先端技術である「Transformer」に焦点を当て、環境構築から学習方法までを紹介します。 今回の記事では、Huggingface Transformersを利用した日本語↔ […]
【Segment Anything②】Google Colabでマスクの自動生成を実装する
2023年4月13日
今回の記事ではSegment Anything Modelによるマスクの自動生成の実装について紹介します。実際にマスクの自動生成を実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後まで […]
【Segment Anything】Google Colabでゼロショットセグメンテーションを実装する
2023年4月12日
今回の記事ではSegment Anythingについて紹介します。実際にゼロショットのセグメンテーションを実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後までご覧ください。 Segm […]
【E資格】第20回:パタメータの更新手法の比較【ゼロから作るDeep Learning】
2023年4月11日
このシリーズではE資格対策として、書籍「ゼロから作るDeep Learning」を参考に学習に役立つ情報をまとめています。 <参考書籍> 更新手法の比較 異なる最適化アルゴリズム(SGD, Momentum, […]