このページではPython活用事例を紹介します。

動画編集(YouTube)

動画や音声データを抽出し、保存することができます。

【音声認識2023】Google Colab で「Whisper large-v3」を使ってYouTube動画を文字起こしする(large-v2との精度比較あり)

今回はOpenAI の Whisper モデルを最新版である「Whisper large-v3」を使用して、YouTube動画を文字起こしする方法を紹介します。 Google colabを使用して簡単に実装することができ […]

「Faster Whisper」で英語のYouTube動画を日本語で文字起こしする

今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を使用して、英語のYouTube動画を日本語で文字起こしする方法を紹介します。 Google colabを […]

【音声認識2023】音声からテキストへ変換する「Faster Whisper」でYouTube動画の文字起こしを実装する

今回はOpenAI の Whisper モデルを再実装した高速音声認識モデルである「Faster Whisper」を実装する方法を紹介します。 基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 […]

【音声認識2022】音声からテキストへ変換する「Whisper」でYouTube動画の文字起こしを実装する

今回は2022年9月に公開された、音声認識モデルである「Whisper」を実装する方法を紹介します。 基本的な操作から、YouTube動画の文字起こしまでを実装してみましょう。 Google colabを使用して簡単に実 […]

【Python活用】「yt-dlp」を使ってYouTube動画や音楽をダウンロードする

このシリーズでは、Pythonの様々な活用の方法を紹介しています。 今回は、PythonでYouTube動画を簡単にダウンロードする方法を紹介します。 Google colabを使用して簡単に実装することができますので、 […]

OCR

画像ファイルからテキスト情報を読み取ることができます。

【Python活用】「Tesseract OCR」と「PyOCR」を使って画像からテキストを読み取る【OCR】

このシリーズでは、Pythonの様々な活用の方法を紹介しています。 今回は「Tesseract OCR」と「PyOCR」を使って、画像からテキストを読み取る方法を紹介します。 実際にOCR技術を使ってみましょう。 Goo […]

PDFの操作

PDFファイルからテキストや画像などの情報を抽出することができます。

【PDF】PDFファイルの論文から画像を出力する

今回の記事ではPDFファイルの論文から画像を出力する方法を紹介します。 PyMuPDFとは PyMuPDFは、PDF、XPS、OpenXPS、EPUBなどの様々なファイル形式を解析し、変換する作業をサポートするPytho […]

【Tips🔰】Google colabでPDFから表を取り出しCSVファイルを保存する

今回の記事ではPDFから表を取り出しCSVファイルを保存する方法を紹介します。 Google colabで簡単に実装できますので、ぜひ最後までご覧ください。 PDFから表を取り出しCSVファイルを保存する 必要なライブラ […]

作図・描画

【Tips🔰】Google colabでLaTeX形式の数式の画像を作成する

今回の記事ではLaTeX形式の数式の画像を作成する方法を紹介します。 Google colabで簡単に実装できますので、ぜひ最後までご覧ください。 LaTEXとは 概要 LaTeX(ラテックまたはラテフと発音されることも […]

【Python】木構造のグラフを描画する【graphviz】

graphvizライブラリを使用して木構造のグラフを描画する方法を紹介します。Google colabを使用して簡単に実装することができますので、ぜひ最後までご覧ください。 Google Colabの使い方はこちら Gr […]

情報取得

【Tips🔰】Google colabでwikipediaライブラリを用いてwikiの情報を取得する

今回の記事ではwikipediaライブラリを用いてwikiの情報を取得する方法を紹介します。 Google colabで簡単に実装できますので、ぜひ最後までご覧ください。 wikipediaライブラリとは 概要 「wik […]