Python
【音声合成】VOICEVOXで音声ファイルを作成する

オープンソースの音声合成ソフトであるVOICEVOXについて紹介します。実際に音声ファイルを作成してみましょう。Google colabを使用して簡単に実装することができますので、ぜひ最後までご覧ください。(Google […]

続きを読む
NLP
【🔰Huggingface Transformers入門⑨】文章分類モデルを作成する(4) 〜推論結果の判断根拠をLIMEで可視化する〜

このシリーズでは、自然言語処理において主流であるTransformerを中心に、環境構築から学習の方法までまとめます。 今回の記事ではHuggingface Transformersの入門として、livedoor ニュー […]

続きを読む
Python
【Image Diffusion】Tune-A-Videoでテキストから動画生成する

2022年12月に発表されたテキストの指示により動画を生成する、画像拡散モデルのOne-Shotチューニングの手法について紹介します。 実際にテキストを与えて動画を生成してみましょう。 Google colabを使用して […]

続きを読む
Python
【Text-based Image Editing】InstructPix2Pixでテキストを元に画像を編集する

2022年11月に発表されたテキストの指示により画像を編集する、拡散モデルベースの画像編集モデルです。 サンプル画像を使用して、実際に任意のテキストを与えて画像を編集してみましょう。 Google colabを使用して簡 […]

続きを読む
Python
【物体検出2023】YOLOv8まとめ⑦  物体検出のためのアノテーション

YOLOv8とは YOLOv8は2023年1月に公開された最新バージョンであり、既存のオブジェクト検出器を上回り、速度と精度の面で限界を押し広げています。 物体検出だけでなく、セグメンテーションタスクや画像分類タスクでも […]

続きを読む