[メモ] SmartOCR Lite Edition

| | コメント(0) | トラックバック(0)
SmartOCR とは
・日本語対応OCRソフト。
 (OCRとは、光学文字認識(Optical Character Recognition) のこと。つまり、画像の中の文字をテキストとして認識してくれるもの)
・認識率の高さと Lite Edition がフリーなことで、有名になった。
・Lite Edition の他に Professional Edition や SmartOCR Library SDK の販売も行っていた。
・しかし、開発元である スマートリーディング が解散してしまったために今では手に入らない。


SmartOCR Lite Edition を試しに使ってみた。
ちなみに設定はすべてデフォルト(文字位置や文字方向は自動認識)。

SmartOCR01.jpgスクリーンショット(クリックで拡大)
左が元画像で右が認識結果。
"一時的に"が"一時的促"になっているが、その他は正しく認識されている。

SmartOCR02.jpgスクリーンショット(クリックで拡大)
メインの文字の"飲めないのに、お中元でビール・・・・・・いくらで売れる?"は正しく認識されている。
右の"今も、誰かがトクしてる。"とか"オークション"という文字は認識できていない。
あと、傾いた"お中元"という文字や、スロットが回ってるところを、わけの分からん文字として誤認識している。

あと、他にも10枚ぐらい試した。


まとめ
・割と認識率はよいようだ。
・小さい文字は認識しにくい。
・やっぱ、漢字は誤認識がどうしても起こるようだ。
・背景と文字のコントラストが低いと文字として認識できない時がる。
・背景の周波数が激しい箇所が、わけの分からん文字として誤認識する。
・フォントが特殊だと誤認識しやすい。


これだけのものをフリーで提供しているのはすごい。
オープンソースで開発されている OCR があるようだが、どれも日本語に対応していないし。

SDK を販売していたそうだが、今は手に入らないのが悔やまれる(いくらで売ってたのかは知らないけど)。
他の 日本語対応OCRソフト の SDK は、くそ高い(20万円以上とか)ので手が出ない。
個人で OCR 組み込んだプログラム作るのは無理ってことかー?!

トラックバック(0)

このブログ記事を参照しているブログ一覧: [メモ] SmartOCR Lite Edition

このブログ記事に対するトラックバックURL: http://moro-tyo.sakura.ne.jp/mt/mt-tb.cgi/10

コメントする

このブログ記事について

このページは、moro-tyoが2006年7月13日 23:56に書いたブログ記事です。

ひとつ前のブログ記事は「[メモ] サポートベクターマシン(SVM)」です。

次のブログ記事は「[メモ] System::String^ → char*, wchar_t*, LPSTR, LPWSTR への変換 (C++/CLI)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

プロフィール

profile.jpg

モローチョ(moro-tyo)

Webエンジニアの見習い。ほとんど学生。

詳しいプロフィール

このblogのはてブ

旧blogのはてブ

Powered by Movable Type 4.1