音声認識 - つくもち屋

2023年11月7日

今回の記事ではテキストから音声ファイルを生成できるText-to-Speech のAPIの実装を紹介します。 Google Colabを使用して簡単に実装できますので、ぜひ最後までご覧ください。 OpenAI API の […]

2023年11月7日

今回はOpenAI の Whisper モデルを最新版である「Whisper large-v3」を使用して、YouTube動画を文字起こしする方法を紹介します。 Google colabを使用して簡単に実装することができ […]

2023年4月16日

今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を使用して、英語のYouTube動画を日本語で文字起こしする方法を紹介します。 Google colabを […]

2023年4月15日

今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を実装する方法を紹介します。基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 […]

2023年3月27日

オープンソースの音声合成ソフトであるVOICEVOXについて紹介します。実際に音声ファイルを作成してみましょう。Google colabを使用して簡単に実装することができますので、ぜひ最後までご覧ください。（Google […]