総合情報サイト / AI活用事例・AI導入事例 / AI OCRとは?導入方法と実活用例を徹底解説

AI OCRとは?導入方法と実活用例を徹底解説

OCRという言葉は、文書のペーパレス化促進などにより、一般に浸透してきましたが、なかでも、AIを活用した、「AI OCR」が近年注目を集めています。 AI OCRとはAI技術を活用したOCRの仕組みやサービスのことをいいます。 海外ではICR(Intelligent Character Recognition)ともいわれ、AIの特徴である機械学習やディープラーニング(深層学習)によって、文字の補正結果を学習し、文字認識率を高めることが可能です。 AI技術を用いない一般的なOCRの場合では、シンプルな文字ほど誤認率が高くなるという傾向があります。 これはOCRの文字認識をする過程において、線が交差している箇所を数えることで文字を識別するという特徴によるものです。カタカナの「エ」と工事の「工」などをイメージするとわかりやすいでしょう。 このような、一般的なOCRソフトを用いた場合は誤認しやすい文字の違いも、AI OCRを用いれば、学習を重ねることでどんどん認識しやすくしていくことも可能です。 実際、AI OCRを用いても100%の識別精度まではいきませんが、大きな業務効率化につなげられるというメリットがあります。

  • 目次

    まず「OCR」とは?
    AI技術を活用した「AI OCR」とは?
    AI OCRのビジネスへの活用事例
    AI OCRの導入方法
    プログラミング不要でAI予測モデルが構築できる「MatrixFlow」

  • まず「OCR」とは?

    OCR(Optical Character Recognition/Reader、光学的文字認識)とは、手書きや印刷された文字をイメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術のことを言います。
    OCRがどのように文字認識をするのか、新聞や雑誌などを読み取る活字文書OCRの例を用いてご紹介します。

    1 スキャナで画像取り込み
    まず、新聞・雑誌などの文字情報が載った文書をイメージスキャナで画像として取り込みます。
    この処理は、一般に写真などをスキャナで取り込むことをイメージするとよいでしょう。

    2 レイアウト解析
    新聞・雑誌の多くは、単に文字が同じ並び方で並んでいるだけではなく、段組みがあったりコラムがあったり、また表や図がレイアウトされています。
    このようなレイアウトを認識し、画像と文字領域を分離した上で、取り出した文字を「かたまり」として取り出し、配置位置を解析し、自動的に文字認識を進める順番を決める処理にあたります。

    3 文字の切り出し
    レイアウト解析で検出した文字領域の「かたまり」を、1行1行に分解し、分解された行から、さらに1文字ずつに分解する処理を行います。

    4 文字認識
    1文字ずつ分解した後、その文字が何の文字かを認識する必要があります。
    ここで、後処理がしやすいように、文字を一定の大きさに拡大または縮小しておきます(正規化)。
    そしてその文字が持つ特徴(たて、よこ、斜めのどのような線で構成されているか)を決めます(特徴量抽出)。
    見つけた特徴に合致する文字をデータから探して、候補にします(マッチング)。
    最後に、前後の文字列の候補と、日本語の単語情報と照合するなど、文章としての整合性を確認し、最終的に文字を確定します。

    5 フォーマット出力

    文字認識が終わった後、さらにExcelやWord等で、文字データとして利用できるように元の文書形式で出力できるフォーマットに変換し、ファイル出力します。

  • AI技術を活用した「AI OCR」とは?

    「AI OCR」は、OCRにAI技術を加えた技術で、AIを組み合わせることで、機械学習による文字認識率の向上や、帳票フォーマットの設計をせずに、項目を抽出することが可能になりました。

    とくに日本では、契約書類、依頼書などの申込用紙やアンケート用紙など、各種の文書のデジタル化が遅れており、今日でも紙帳票からの入力が数多くあります。
    これらの入力作業では、活字のOCRによる効率化は徐々に進んできていますが、手書きの認識率はそれほど高くなく、実用化が難しい領域と言われてきました。
    とくに、日本語の漢字やひらがな、カタカナには複雑なパーツが分かれている文字が多いため、OCRによる入力効率化の障壁となっています。
    このようなOCRの現状に、新たにAI技術をかけ合わせることで、以下のようなメリットを享受できます。

    ・ディープラーニング(深層学習)により読み取り精度が継続的に向上
    ディープラーニングを用いることで、誤認識を学習し、文字認識率を継続的に向上可能です。
    また、これを応用すると手書き文字に対応できます。
    従来のOCRは、すでに持っているロジックの範囲内での決められたパターンでのみ文字を識別していました。
    しかし、「AI OCR」では、AIにディープラーニングさせるため、一度文字を読み間違えたとしても、間違えたデータをAIが学習することができるので、文字認識率を継続的に向上することが可能になりました。

    ・フォーマットが異なる帳票に対応可能
    帳票をOCRする場合には、従来の方法では、事前に読取位置や項目の詳細定義を手作業でする必要がありました。
    「AI OCR」では、AIにより読取位置や項目を自動抽出することが可能になるため、紙ベースの資料をスキャンするだけで文字を認識してくれるいわゆる、「設計レス」を実現しました。
    例えば、請求書や納品書、発注書といった様々なフォーマットの帳票であっても、スキャンするだけで項目を抽出できるので、業務効率を大幅に向上させることができます。

    ・業務システムやRPAとの連携でさらに作業効率が向上
    OCRを活用することで、例えば、紙の請求書の情報を会計システムなどの業務システムに入力する作業を効率化することができます。
    ただし、実際に業務システムに入力する際には、請求書に書かれている文字や数字のテキスト情報だけでなく、その情報が何を意味するのかによって対応が異なるため、その関連付けなどを、人間が手作業で行う必要があったり、あらかじめ設定してある決まったフォーマットの帳票にしか対応できなかったりするといった制約がありました。

    「AI OCR」では、読み取った情報が何の項目で、業務システム入力に必要な情報は何であるか、なども自動抽出、自動生成できるので、業務システム入力作業の効率を大幅に向上できます。
    このように、情報の関連付けができるので、「AI OCR」と「RPA(Robotic Process Automation)」と連携することで、業務効率をさらにアップすることが可能です。

    「RPA」とは、今まで人が行っていた業務をソフトウェアロボットにより代替し自動化することを表す言葉です。
    「RPA」と「AI OCR」を連携させることにより、パソコンを使った作業の自動化に加えて、文字データを自動で読み取り、デジタルデータ化することが可能になります。
    これを「AI OCR」と組み合わせれば、紙の帳票からデータを自動抽出し、データ入力・集計・加工・出力といった一連の業務を自動化することが可能となります。

  • AI OCRのビジネスへの活用事例

    AI OCRの導入で実際にどのような業務課題が解決されるのでしょうか?

    大量の紙書類の処理をAI OCRとRPAで自動化|大手都市銀行

    ある大手都市銀行では行員の生産性向上による営業強化のためルーティン業務の見直しに着手しました。
    AI OCRとRPAでネットバンキングの申込書類の処理などを自動化し、業務効率化を実現しています。

    ・課題
    担当者が、銀行内で効率化できる業務はないかと本部各部に調査したところ、各部門から約900の業務が挙がってきました。
    この効率化のため、当時活用が進んできていたRPAが候補にあがりましたが、900業務のうち約半数が紙を介在した業務であったため、そのままではなかなかRPAにはつながりにくい部分がありました。
    RPAで業務を自動化するためにはその情報がデジタル化されていることが、大前提です。
    手入力でのインプット作業に膨大な時間がかかり、対象業務を拡大する上でかなりのボトルネックとなっていました。

    ・効果
    そこで検討し始めたのが、従来より精度が上がってきている手書きAI OCR技術の活用です。
    手書きされた紙を起点とする業務もRPAの対象として諸々の処理を自動化できるようになったことにより、点検済契約書のイメージ化など付随する業務も含め、RPAによる処理の対象とできたことで、処理スピードが上がり、業務量についてもだいぶ削減できる見込みとのこと。
    また、銀行業界では今、RPAやAI OCRへの注目度が高まっており、運用し始めたばかりではあるものの、先行して導入、活用を始められたことは自信にもつながったとのことです。

  • AI OCRの導入方法

    AI OCR導入にあたって、どのような点に留意すればよいのでしょうか?
    次に、導入にあたってのチェックポイントを解説していきます。

    将来的な継続的取り組みを見据えた、読み取り精度の向上
    AI OCRを導入する際の対象文書の読み取り精度のみではなく、これから順次継続的に処理していきたい書類についても、どの精度で読み取りが可能か事前に確認しておきましょう。
    また、今後も対応したい帳票などのレイアウトも、自動で認識してくれるAI OCRであるかどうかで、実際に運用した際、読み取りにかかる工数が大きく異なってくることも念頭に入れる必要があります。

    特定の業務に特化してAI OCRを利用する場合
    あらかじめ「見積書」や「納品書」、「請求書」など、特定の業務と帳票に限定してAI OCRを使う場合には、複雑な事前設定を行わなくても、複数フォーマットの読み取りを簡単に行えるものもあります。

    業務を限定せずにAI OCRを利用する場合
    業務と帳票を限定せずにAI OCRを利用したい場合、事前に帳票のフォーマットやレイアウトについて設定を行うことでさまざまな場面で対応可能です。

    システムのセキュリティの確認
    AI OCRでは、契約書などに代表されるように、機密情報を扱うことも多いと思います。
    ベンダーが、プライバシーマークなどの各種認証を取得しているかなど、必要なセキュリティレベルを満たしているか、十分確認しておく必要があります。

    サポート体制
    システムやソフトウェアの導入が済んでも、導入後にきちんと社内に浸透させなければ、全社的な継続的効果は得られません。
    社内で安定的に運用を行っていくことを考えると、導入時をはじめ、十分なサポートが受けられるかといった観点も検討の際は重視する必要があります。

    他のシステムと連携できるかどうか
    基幹システムなど、すでに社内で導入している他のシステムとスムーズに連携できるかどうかも重要な確認ポイントです。
    システムによっては、書類のアップロードや文字読み取り結果の確認をAPI連携でシームレスに実現できるものもありますので、確認したいポイントです
    またAI OCRとRPAを連携すれば、読み込んだ帳票を任意のシステムに自動登録することも可能となりますので、さらに大幅な業務効率化を目指すのであれば、こちらも視野に入れるとよいでしょう。

  • プログラミング不要でAI予測モデルが構築できる「MatrixFlow」

    企業内にAI専門部署を設立するなど企業全体でAI導入に取り組んでいるところもありますが、実際のところ、企業によってはAI OCRの導入に対してコストをかける余裕がないというところも多いのではないでしょうか。
    社内にプログラミングの技術がないため、AI OCR導入に踏み切れないという企業もあるかもしれません。

    そのような場合、プログラミングの技術がなくてもAIによる在庫管理を導入できるツールであるMatrixFlowのご利用がおすすめです。
    MatrixFlowは、プログラミングの知識がなくてもAIを簡単に作成できるAI活用プラットフォームのため、社内に専門の人材がいなくても現場レベルでAIを導入することが可能になります。

    ■「MatrixFlow」を利用するメリット
    ・開発から内製化までシームレスにMatrixFlowのみで実現可能
    ・開発費・人件費・コミュニケーションコストなどあらゆるコストを大幅に軽減
    ・面倒なメンテナンスは不要、社内の担当者のだれもがいつでも手軽に利用可能

    現在MatrixFlowは、様々な業界・業種のお客様にご利用いただいており、この開発スキームは、業種・業界によらないものである上、お客様と一緒に開発を続けることでその開発ノウハウがブロック、およびその組み合わせのテンプレートとしてプラットフォーム上に蓄積されています。

    また、MatrixFlowには、様々なタイプのすでに構築されたAIのテンプレートのご用意もありますので、お客様の課題にあったテンプレートでぜひ一度AI構築にトライしてみてはいかがでしょうか。

    ぜひ、詳細はお問い合わせください。

関連した事例