GASとGoogle ColabでPDFのOCR - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/Helvetica822

1 userがブックマークコメント

コメント

0

記事へのコメント0件

注目コメント
新着コメント

新着コメントはまだありません。
このエントリーにコメントしてみましょう。

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

GASとGoogle ColabでPDFのOCR - Qiita

はじめにたくさんのPDFをデータ化したいことがあり、ある程度は手動で補正する必要が出てくるのは許容... はじめにたくさんのPDFをデータ化したいことがあり、ある程度は手動で補正する必要が出てくるのは許容しつつできるだけ楽にテキストを取り出したいということでOCRしました。前提ちゃんとドキュメントとして認識されている(PDFリーダーで文字選択できる)PDFあり。画像として認識されているPDFもあり。上記2つが混ざっているPDFもあり。流れ PDFはGoogleドライブに保存 PythonでPDFを画像化(ドキュメントとして認識されているものも画像に寄せる) GASでOCR これだけです。画像化は別にローカル環境でも良いのですが、あんまり環境あっち行ったりこっち行ったりしたくないということでGoogleアカウント内で完結できるようGoogle Colabを使用しました。ちなみにGASを使ったのは初めてでした。また1ファイルずつ手動で良ければGoogleドキュメントに読ませるとテ

ブックマークしたユーザー

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx