「Faster Whisper」で英語のYouTube動画を日本語で文字起こしする
2023年4月16日
今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を使用して、英語のYouTube動画を日本語で文字起こしする方法を紹介します。 Google colabを […]
【音声認識2023】音声からテキストへ変換する「Faster Whisper」でYouTube動画の文字起こしを実装する
2023年4月15日
今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を実装する方法を紹介します。 基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 […]
【Huggingface Transformers】日本語↔英語の翻訳を実装する
2023年4月14日
このシリーズでは自然言語処理の最先端技術である「Transformer」に焦点を当て、環境構築から学習方法までを紹介します。 今回の記事では、Huggingface Transformersを利用した日本語↔ […]
【Segment Anything②】Google Colabでマスクの自動生成を実装する
2023年4月13日
今回の記事ではSegment Anything Modelによるマスクの自動生成の実装について紹介します。実際にマスクの自動生成を実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後まで […]
【Segment Anything】Google Colabでゼロショットセグメンテーションを実装する
2023年4月12日
今回の記事ではSegment Anythingについて紹介します。実際にゼロショットのセグメンテーションを実装してみましょう。Google Colabを使用して簡単に実装できますので、ぜひ最後までご覧ください。 Segm […]