【音声合成】VOICEVOXで音声ファイルを作成する
2023年3月27日
オープンソースの音声合成ソフトであるVOICEVOXについて紹介します。実際に音声ファイルを作成してみましょう。Google colabを使用して簡単に実装することができますので、ぜひ最後までご覧ください。(Google […]
【🔰Huggingface Transformers入門⑨】文章分類モデルを作成する(4) 〜推論結果の判断根拠をLIMEで可視化する〜
2023年2月26日
このシリーズでは、自然言語処理において主流であるTransformerを中心に、環境構築から学習の方法までまとめます。 今回の記事ではHuggingface Transformersの入門として、livedoor ニュー […]
【Image Diffusion】Tune-A-Videoでテキストから動画生成する
2023年2月1日
2022年12月に発表されたテキストの指示により動画を生成する、画像拡散モデルのOne-Shotチューニングの手法について紹介します。 実際にテキストを与えて動画を生成してみましょう。 Google colabを使用して […]
【Text-based Image Editing】InstructPix2Pixでテキストを元に画像を編集する
2023年1月30日
2022年11月に発表されたテキストの指示により画像を編集する、拡散モデルベースの画像編集モデルです。 サンプル画像を使用して、実際に任意のテキストを与えて画像を編集してみましょう。 Google colabを使用して簡 […]
【物体検出2023】YOLOv8まとめ⑦ 物体検出のためのアノテーション
2023年1月21日
YOLOv8とは YOLOv8は2023年1月に公開された最新バージョンであり、既存のオブジェクト検出器を上回り、速度と精度の面で限界を押し広げています。 物体検出だけでなく、セグメンテーションタスクや画像分類タスクでも […]