レシートの読み込みやスキャンした配布物のテキスト化に使えそう。種類は色々あるが個人用途としては安価に見える。性能が満足できるものがあるかまた調べたい。
- tesseract
- Google Cloud Vision API
- Microsoft Cognitiveサービス
- docomo、evernote(オンライン)、NHocr(オフライン)
- docomoは500リクエスト/日まで無料
- 日本語認識ライブラリのOCR系の記事まとめ - 珈琲駆動開発
- 他にも紹介記事あり
検索するとGoogle Driveに付属するものやonlineocrが出てきたが、apiがないと使い勝手が悪そうである。
- 追記: https://mzucker.github.io/2016/08/15/page-dewarping.htmlを参考にすれば本をそのままスキャンできそう