OCRツール Rev1
2021/04/06 categories:TOOL| tags:TOOL|Python|OpenCV|
以前、以下の記事で作成したプログラムを改良して、Tesseract OCR用のGUIツールを作成しました。
セルを自動認識してOCR
以下のように処理を行い、セル認識やOCRを行います
- PopplerでPDFを画像化
- OpenCVを使用してセルを自動認識
- 全体画像をセルごとの画像に分割してファイルリストに表示
- Tesseract OCRで分割した画像をOCR
- OCRしたテキストをCSVで保存
認識範囲を手動で指定してOCR
以下の動画のように、マウスで認識範囲を指定することもできます。また、認識範囲はコピーやペーストが可能です。