「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(10)

この記事が役立ったら、シェアをお願いします。

14)「AI」と「ディープラーニング」による革命(3)
これまでの記事
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(1)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(2)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(3)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(4)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(5)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(6)
で、「IT」、「IoT」、「AI」、「ディープラーニング」に関して執筆して来ました。
そして、
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(7)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(8)
・「IT」、「RPA」、「DX」とは?~専門用語・技術用語の解説~(9)
では、「AI」と「ディープラーニング」がもたらした革命の具体例を紹介しました。
本記事でも、引き続き、「AI」と「ディープラーニング」による革命に関して、執筆します。

前回の記事の「AI」と「ディープラーニング」による革命の具体的な紹介で、私達の目に見えない革命について触れました。
そして、そのような縁の下の力持ちとでも言うべき「AI」と「ディープラーニング」による革命の一つとして、「AIチャットボット」を取り上げました。

さて、「AI」と「ディープラーニング」による革命を、敢えてもう一度振り返ってみます。
1. 「人間のように思考、予測、回答できる」事
2. 「人間のように対話できる」事
この内、「AIチャットボット」は(1も勿論取り入れつつも、より)2の「会話」や「対話」に重きを置いた物でした。
それでは、より1に重きを置いた、即ち「読み取り」や「認識」に関してはどうでしょうか?
本記事では、その具体例を取り上げて、「AI」と「ディープラーニング」による革命についてのシリーズを締めたいと思います。

「人間のように思考、予測、回答できる」事、即ち「読み取り」や「認識」の具体例が、「AI-OCR」です。
まず、そもそも「OCR」とは何かと言うと、Optical Character Recognition(光学文字認識)の略称です。

「文書や画像データやPDFデータから文字情報を読み取って認識して、文字情報を付与して出力してくれる物」
そう説明すると難しく感じる方もいるかもしれませんが、実は今では家庭用のプリンターやスキャナーにも付いているような機能です。
より高度な精度でOCRを行ってくれる専用スキャナーとしては、富士通のScanSnapやCanonのimageFORMULAが有名です。

その歴史は1910年代まで遡り、1930年代には現在のOCRに関する特許が欧米で取得されています。
伝票、帳票、報告書、請求書、契約書、新聞、論文、書籍などなど、私達の生活の中で紙は欠かす事のできない物です。
同時に、「ペーパーレス(化)」での業務効率化や働き方改革が謳われているように、そんな紙から如何に解放されるかも私達にとって非常に重要なテーマと言えるでしょう。
それを可能にする技術が、OCRなのです。

但し、チャットボット同様に、従来のOCRにはどうしても限界がありました。
それは、チャットボット同様にOCRにも特定の規則を教え込み、その規則に合致した場合にはOCRを行うという仕組みだったからです。

具体的には、
・文書のレイアウトの解析:文書の用紙サイズから段組みやコラム、表や図、標題やヘッダー等の文字の固まりまで解析する。
・行の認識:解析した文字の固まりを、1行毎に分解する。
・文字の認識:分解した行を、1文字毎に分解する
・文字情報の付与:分解した1文字毎に、OCRが持つ規則との照らし合わせを行い、合致した文字の候補を文字情報として付与する。
というような方法とフローで、従来のOCRは行われています。

この従来の方法やフローでも、定形フォーマットにおける一般的な活字であれば、現在では極めて高い精度のOCRが可能です。
しかし、例えば非定形フォーマットやフリーフォーマットにおける手書き文字となると、規則と合致させる事が困難になる事は想像がつくかと思います。
非定形フォーマットやフリーフォーマットにおける手書き文字は、同じ文字とは言っても、当然の事ながら文字を書いた個々人によって何もかも異なって来ます。
そして、個々人全ての筆跡の情報等を予め規則としてOCRに教え込むのは、まず不可能な事はお分かり頂けるかと思います。

この状況を打破したブレイクスルーこそ、「AI」と「ディープラーニング」です。
「AI」と「ディープラーニング」の技術革新により、AIチャットボット同様に、現在は「AI-OCR」が開発されています。
「人間のように思考、予測、回答できる」事という恩恵は、OCRに「AI-OCR」という新たな時代をもたらしました。

何故なら、「人間のように思考、予測、回答できる」という事は、規則外の文字が出て来ても新たな規則として「学習」や「推測」ができるという事だからです。
これにより、現在では、非定形フォーマットやフリーフォーマットにおける手書き文字に関しても高い認識精度(99%以上!)で文字情報を付与する事が可能になっています。
文書のレイアウトや書き文字の種類によらず、「AI-OCR」は高精度で読み取りと認識をしてくれる、まさに万能の技術と言っても過言ではありません。

但し、注意すべき事として、「高精度」と言っても100%ではないという点には留意する必要があります。
99%以上の高精度でも、1,000枚当たり約1枚、10,000枚当たり約10枚、100,000枚当たり約100枚……というように、ミスは発生し得るからです。
私達が日次や月次や年次で向き合う紙の量を考えると、このレベルのミスでも回避できるに越した事はない事はご納得頂けるかと思います。

勿論、AI-OCR開発者・開発社も、この点に関しては当然理解しており、AI-OCRは現在でも日進月歩の進化を遂げています。
認識精度は加速度的に上がっており、将来的には、真の「万能の技術」になる日も訪れるかもしれません。

本記事では、縁の下の力持ちとしての「AI」と「ディープラーニング」による革命の具体例として、「AI-OCR」を紹介しました。
文字情報の付与という機能や、プリンターやスキャナーに既に搭載されている物という事で、私達が普段意識する事は中々ないかもしれませんが、このような革命の存在もご認識頂けたかと思います。

以上、4回の記事を通して、「AI」と「ディープラーニング」がもたらした革命の具体例を紹介してきました。
「AI」と「ディープラーニング」が、私達の生活に及ぼした影響の大きさ、その影響範囲の広さ、活用する事の便利さ、十分に感じて頂けたでしょうか?
次の記事では、「AI」と「ディープラーニング」による革命がもたらされた現在、次は何が革命をもたらすのかという事を解説していきます。

The following two tabs change content below.

石井卓巳

株式会社ネクストプレナーズの経営企画室とDX事業部に所属しています。 前職まで大学教員や研究者として勤めていた経験を活かして、現職ではRPAのコンサルタント、エンジニア、講師として勤務しています。 RPAの有資格は、WinActor認定技術者(エキスパート級)やUiPath RPA Developer Advancedなど。
%d人のブロガーが「いいね」をつけました。
       

03-4530-6033)

  • 資料請求
  •          
  • セミナーへのご参加