RPAと一緒に語られる、OCRとは。

2019.08.23

１．RPAとのシナジーを生む「OCR」

　生産年齢人口が減少するなかで「いかに業務を効率化していくか？」、「働き方改革をどの業務で実現していくのか？」が、各社のここ数年における非常に大きな取り組み事項となっています。そのような環境下、RPAとセットで語られることが多くなってきたのが「OCR（Optical Character Recognition (= 光学文字認識) 」です。

　注文書、申込書、請求書、アンケート、変更届、日報、報告書などなど、種類を挙げればきりがないですが、業種業態を問わず様々な部署で書類を見ながらの入力業務は必ず存在しているのではないでしょうか。

　一方で、商慣習や文化、紙特有の使い勝手の良さから紙文化をゼロにすることは難しいと思われていることも事実です。RPA導入をして直面するハードルがまさにここにあります。
「当初の目的は自動化できたが、業務フローのはじめに発生する入力はなくならない」
「そもそも入力業務の工数ボリュームが大きい」
この課題を解決するのがOCRです。

　OCRは、RPAだけでは自動化が実現できなかった領域＝紙というアナログデータをデジタルデータに変換する領域の自動化を実現することができるソリューションとして注目を集めています。本連載では、「OCRやAI-OCRとはそもそも何か」からスタートし、導入障壁や効果、更には今後どのように発展していくのかを通じてOCRの過去から未来をお伝えしていきたいと考えています。

2．OCRとはそもそも何か？

　OCRとは、書類等に書かれた手書きや印字文字をコンピューター上に表示可能なテキストデータに変換をする装置です。これにより、従来は人手で行われていたデータ入力業務をOCRが代替し、業務の省力化を実現することが可能となります。

　昨今注目度が増してきているOCRですが、歴史を振り返ると世界的には1900年前後から文字認識技術の開発がはじまり1950年頃には既に製品化されています。日本では1960年代に最初の製品化がされ、当時郵政省が郵便事業自動化の一貫で郵便番号を読み取り集配業務の効率化を実現するために活用したところから、省力化の実現はスタートしていたと言われています。それでは50年以上の歴史のなかで、OCRはどのような進化を遂げてきたのでしょうか。

3．OCRからAI-OCRへ

　弊社によるOCRに関するイメージ調査結果では、「読み取り精度が低い」という声が最も多く、この声こそが進化を語るうえでのポイントだと考えます。「読み取り精度が低い」というイメージは従来型OCRによるものが大きく、AIを用いたOCRがこの現状を変えています。ではOCRにおける”AI”とは何でしょうか。

　従来型OCRは、予め定義されたデータベースに基づいた読み取りを行う仕組みであり、データベースにない未知の文字を読むことは難しい、という制約がありました。
具体的には、対応フォントは印字が主であり、且つゴシック、明朝体、メイリオといった指定フォントに限られる、文字サイズや解像度に制限がある、といったものが挙げられます。

　また、手書きについても、一文字ずつ分割をして読み取りを行う性質上、一文字ずつの決められた枠の中に、ある程度決められた形の文字を記入する必要があります。従って、枠がないもの（＝枠の中に何文字入ってくるかわからない未知のもの）を読み取ることは困難でした。これが読み取り精度の低さを印象付けている所以だと考えています。

　これに対し、AI-OCRは、「データベースとのマッチング」ではなく、「深層学習による推論 (=教育されたAIが判断すること)」により、未知のフォントの読み取りが可能となったことでブレイクスルーを起こしました。

　アンケートの様に、１枠１文字という制約が難しいフリーピッチの文章やあらゆる癖の手書き文字も読み取り可能となりました。そして現在は、AI-OCRは次のステージを迎えていると考えています。これについては連載の後半でお伝えできればと思います。

　今回は、OCRの歴史の中でAIを用いたブレイクスルーの側面からAI-OCRについてお伝えしました。
次回は、RPA市場やAI-OCR市場を深堀りし、「AI-OCRブーム」の背景に迫ります。