手書き文字をテキストデータ化!「Paper Searcher」の提供を開始
TISインテックグループのTIS株式会社(本社:東京都新宿区)は、株式会社 Cogent Labs(所在地:東京都渋谷区)のAI-OCRエンジン「Tegaki」を活用したソリューションの提供を共同で推進していくことを発表。第1弾として紙資料をデータ化する「Paper Searcher」の提供を開始した。
■紙の書類をデジタル化!
今回提供が開始された「Paper Searcher」の特徴として、「テキスト領域の自動検知」「高精度なAI-OCRによるテキストデータ化」「辞書機能を活用した補正機能」がある。AI-OCRエンジンに採用されたのが「Tegaki」だ。
1)「テキスト領域の自動検知」
画像上のテキストエリアを自動で検知することが可能。従来のAI-OCRの処理で必要だった読み取り領域指定の事前作業が不要に。
2)「高精度なAI-OCRによるテキストデータ化」
株式会社 Cogent Labsの提供するAI-OCR「Tegaki」をAI-OCRエンジンとして採用。手書き文字を含めた高精度なテキストデータ化を実現する。
3)「辞書機能を活用した補正機能」
業界用語・化学物質名・企業用語といった通常の言語モデルでの補完が難しい用語は、辞書機能に登録することにより補正が可能。
<提供価格>
月額10万円~(税別)
※読み取り帳票の量による従量課金制
「Tegaki」は、手書き書類をスキャンして取り込むだけで、その文字情報を簡単にデータ化して保存ができる手書きOCRサービス。これまで自動認識が難しかった手書き文字を高速・高精度に読み取ることができる。
また、OCRとは、Optical character recognition(光学文字認識)の頭文字で、文字画像をスキャナー等で読み取り、コンピュータが読み取れる文字コードに変換するソフトウェアのこと。紙に記載されている文字の手入力作業を、自動化する事が可能になる。
■業務効率化、人件費削減の課題を背景に
近年、業務効率化や人件費削減を課題として持っている企業が、AI・IoTといったさまざまなソリューションの導入を検討している。AI-OCR技術は、企業での採用が進んでいるようだが、業務フローに効果的に組み込みこむには、事前の帳票振分処理やデータ連携機能など周辺ソリューションとの組み合わせが不可欠だ。 このような課題に対し、TIS株式会社は、AI-OCRエンジンと周辺ソリューションを組み合わせた業務デジタル化ソリューションを提供していく計画のようだ。
■業務をデジタル化!今後の展開
協業企業とともに、AI-OCRサービスと帳票振分処理、補正処理、データ変換、データ連携といった周辺ソリューションを組み合わせた以下のような業務デジタル化ソリューションを展開していく予定だ。
1)受信した帳票を、正確に帳票種類を分類し、振分処理を行い、後続の帳票OCR「Tegaki」に連携する、帳票振分ソリューション(今春提供開始予定)
2)クラウドFAXソリューション「TransFax」と連携し、受信したFAXをデジタル化し、完全なペーパーレスでFAX受付を行うソリューション
3)RPAソリューション「UiPath」を活用し、申請業務での申請書自動デジタル化する。また、AI-OCRクラウドサービスによりテキスト化されたデータを、業務システムへ自動インプットする機能を実現するソリューション
RPAとは、Robotic Process Automation(ロボテック・プロセス・オートメーション)の略称で、仮想知的労働者(Disital Labor)とも呼ばれる。
■まとめ
パソコンでの業務が浸透し、パソコン上で処理する書類が増えたとはいえ、まだまだ手書きで対応している書類があるのも事実だ。業務の負担が少しでも減らせるよう、どのようなサービスが展開されていくか、注目していきたい。