OpenCVとTesseract-OCRで作る表のOCRツール
PNG画像やPDFをOpenCVで表のセルの位置を認識して、認識したセルをTesseract-OCRでOCRツールを作ってみました。
ファイルを開く
Openをクリックしてファイルを選択するとファイルを開けます。対応しているファイルはPNGとPDFです。

画像の表示
表のFile nameをクリックすると画像が表示されて、マウスホイールを回して拡大縮小して、マウスホイールクリックでドラッグすると表示位置を変えられます。

表からセルを認識
Recognizeをクリックすると画像から表のセルを認識して画像上に表示します。右側のRectxxをクリックすると選択したセルの位置を赤枠で表示します。

画像をセルごとに分割
Split by rectsをクリックすると選択したファイルの画像をセルごとに分割します。

分割するエリアを手入力する
Draw rectをクリックして画像内をドラッグすると分割するエリアを手入力できます。

分割した画像をOCRする
OCRをクリックすると、ファイルの表内に表示されているrectxの列の画像をOCRして、結果をrectx_textの列に表示します。

ソースコード
githubにアップロードしました
記事の共有
関連記事
- Pythonでボールねじとモーターとカップリングの選定をしてみる 全通り計算編
- Pythonで作るn次元n目並べ その2:1次元n目並べ速度計測
- Pythonで作るシンプル画像ビューワ
- PyQt5 QTableViewのサンプル
- OpenCVのndarrayとPyQt5のQImage、QPixmapの相互変換