こんにちは、M田です。
NTT西日本様が販売しています「おまかせAI-OCR」について今まで3回まとめさせていただきました。
「おまかせAI-OCR」の文字認識を試してみました~活字の認識編~
「おまかせAI-OCR」の文字認識を試してみました~手書き文字の認識編~
前回は「手書き文字の認識」について、私が作成した悪筆の手書き会計票をサンプルとしてテストを行いました。テストした結果、次のような感想を持ちました。
- 手書き文字(数字以外)の認識は優秀
- 一方、数字の認識については読取り誤りが目立つ
このテストで使用した会計票は喫茶店のメニューを想定していたものだったので、認識対象に「カタカナ」が多く含まれている特徴がありました。
そこで今回は、「ひらがな」「漢字」も含めた「手書き請求書の文字認識」をテストしてみました。「文字種が混在する手書き文字の読取り」がテストの主目的です。
またまた今回も私には恥ずかしさMaxな内容となっております。
テストの結果
前回もお断りしましたが今回も念のためにお断りしておきます。テスト結果はあくまでも限定された状況での結果のため、「おまかせAI-OCR」の絶対的評価ではありません。読取り精度をはじめとするシステムの機能の参考になれば幸いです。
簡単に結果をまとめますと次のような結果となります。
- サンプルの請求書での認識正解率は約97%。
- 数字の読取りに手書き会計票と同じような誤りがあった。
- 文字の誤認識は手書き会計票と同じくソースがひどいためと思われる。
今回の認識正解率97%ですが、前回と同様、「読取り項目が空欄」も1項目とカウントしております。
厳密に「記載のある項目だけ」に注視すると、認識正解率は約94%となりました。
今回のテストでは数字の読取りに誤りが少なかったので、厳密な検証でも高い正解率となりました。
今回のサンプルを紹介します
以下は今回の検証に使用したサンプルとその設定です。会計票と同じく某100均ショップで購入した請求書に、私が手書きしました。架空の小規模DIYショップが起こした請求書を想定しています。
はい、再び恥ずかしい下手な字です。私、この字で何度も手書き領収書や請求書を発行したことがあります。受け取った先方の方々や税理士の先生方に、さぞ迷惑をおかけしたかと…穴があれば入りたいです。
読取り項目は上の図の薄いブルーの色のついている箇所です。「月日」「品名」「数量」「単価」「金額」の部分は12分割しました。読取り条件は「指定なし(すべての文字)」としています。このあたりは前回と同じ設定です。
この読取り設定をつかって、計6枚の手書き請求書を読取りました。
読み取り結果を見てみよう
読み取り後の「エントリー」画面から、「正解」「誤り」のサンプルを作成しました。感想・考察とともに紹介します。
「金額」欄・「単価」欄の読取り
金額表記に使用される「¥」「,」「-」も正しく読み取っています。正解です。
金額表記によくある桁区切りの線がありますが、数字部分だけ読取れています。
単価については正解と誤りがありました。この誤りの原因は想像もつきません。「1」はどこから来たのか?
桁区切りの「,」があれば大丈夫なのでしょうか?
「数量」欄の読取り
これは「3」の上の部分を「2」、下の部分を「7」と読み取ったんでしょうか? 誤りです。
「1」を読取れなかったようです。誤りです。
赤丸部分の「ちょろっ」のせいで「1」を「7」と判断したのでしょうか? 誤りです。
以上、金額・単価・数量など、主に数字で構成される項目の読取り結果のサンプルを紹介しました。
「品名」欄の読取り
前回同様、手書き文字による「品名」欄の読取り結果を見ていきましょう。正誤あわせて印象的だったものをピックアップしてみました。
漢字の文字幅とカタカナの文字幅がだいぶ違うのですが、正確に読取れています。
漢字部分は問題ないのですが数字が読取れていません。
ところで「品名」欄に最初から印字されている青字の「1」は読取っていません。これは「おまかせAI-OCR」が桁区切り線と同様に無視しているからでしょうか?
弊社の他スタッフに後から指摘されて気づいたのですが、「必要なところを読取っている」という点では結果オーライです。数字部分も読取る必要があるなら、設定を変更するなど別の手を考えなくてはなりません。
「字」がよく読取れたなと思いました。
ひらがな+漢字+カタカナです。「紙」と「ト」をちゃんと読み取ることが出ました。
「上」のような画数の少ない漢字の方が難しいのかなと思いました。ここでは正しく読取れています。
ここでは数字も正しく読取れています。「mm」はよく読取れたと思います。
以下、他の正解例をまとめて紹介します。
次に誤りの例もまとめて紹介します。
「リ」→「ク」。おしいと思います。我ながらこれを誤りとするのは心苦しいです。
「土」→「さ」。実はこの読取り誤りが、本テストの唯一の「漢字」の読取り誤りでした。
「バ」→「パ」です。これも惜しい。これは責められないと思いますが誤りとしました。
以上、漢字・カナ・ひらがな混じりの品名の読取り結果の紹介でした。
結果の集計
今回テストした条件と結果は次のとおりです。
- 伝票1枚あたりの項目数:66
- 読取り枚数:6枚
- 読取り全項目数:396(66項目×6枚)
- 「誤り」判定数:9
- 正答率:約97%
今回の請求書にも空欄がありましたので、入力のある欄のみに注目すると次のようになります。同じく読取り枚数6枚の場合です。
- 読取り全項目数:146
- 「誤り」判定数:9
- 正答率:約94%
「誤り」の内訳は次のとおりです。
- 数字に関する読取り間違い、抜け:5
- 空欄を「1」と検出:1
- 文字の読取り間違い:3
まとめ
今回の「手書き請求書」のテストでは、「文字種が混在する手書き文字の読取り」が主目的でした。結果はご覧の通り、前回同様、文字の認識については「おまかせAI-OCR」の優秀さが再確認できました。私のような悪筆の文字でも読み取ってくれるので心強い限りです。
一方数字に関してはこちらも前回同様、未検出・誤検出がありました。数字に関してはベリファイ時に気をつけなければなりませんね。
「おまかせAI-OCR」のテストを始める前は逆だと思っていました。すなわち、
- 数字に関しては問題なく読み取ってくれるだろうし、誤りも少ないだろう。
- 文字は苦戦するかも。特に手書き文字の認識は期待できないだろう。
と想像していました。しかしながらここ数回のテストを経て逆の結果が得られました。
OCRの読取り精度は、どうやっても100%はめざせないだろうと思います。それでも、「何が間違えやすいか?」の傾向がわかっていると、チェック時に役立ち、全体の精度を向上させることができると思います。
「おまかせAI-OCR」の場合は、どうやら文字よりも数字の読取り結果について気をつけてベリファイしたほうが良いようです。今回の「読取条件の指定」でも「指定なし(すべての文字)」を設定していたので、この設定を変更しても精度が向上するかもしれません。
以上、「おまかせAI-OCR」の「手書き請求書の認識」のテストでした。ここまで読んでいただいてありがとうございました。