Google ドライブのOCR機能をご存知でしょうか?OCR(光学文字認識)とは、簡単に言うと「画像上の文字を読み取って、電子テキスト化する機能」のことです。Google ドライブでは、標準でのこの機能を搭載されています。Google ドライブのOCR機能はなんのために存在し、どの程度の精度があるのでしょうか。今回のコラムでは、 Google ドライブのOCR機能について解説します。
Google ドライブは 、Google が提供するオンラインストレージサービスで、 Google アカウントがあれば、誰でも無料で利用することができます。無料版の場合は15GBの容量制限がありますが、有償の契約によっては定額無制限で利用することができます。 Google ドライブの価格の詳細についてはコチラの記事をご参考ください。
Google ドライブ上でOCRされた結果を確認する方法
Google ドライブ上にアップロードしたファイルに対してOCR結果を取得する方法は簡単です。ブラウザから Google ドライブにアクセスし、アップロードしたファイルに対して右クリックを行なってください。コンテキストメニューが表示されたら、[アプリで開く]-[Google ドキュメント]を選択します。これで、OCR結果を確認することができます。
Google ドライブのOCR機能でどこまでできるか試してみる
Google ドライブのOCR機能は非常に便利ですが、一つ気になる点があります。それは、ずばり「文字起こしの精度」です。今回は様々な画像パターンで Google ドライブのOCR機能の精度を試してみようと思います。
ツールで出力した文字列はテキスト化できるのか?
最初に文書編集ソフトで作成した文章をテキスト化してみます。書き途中の本コラム記事を画像し、 Google ドライブにアップロードしてみます。
今回の検証で、 Google ドライブのOCR機能はそれなりに精度が高いことがわかりました。もちろん、画像の解像度や検証で利用した文章が短文だったことも、今回の結果の一因にもなっているかもしれません。しかし、機械学習の精度は学習データが集まれば集まるほど向上するため、今後さらに精度が上がってくることは間違いありません。ただ、 Google ドライブのOCR機能の本質的な凄さは「精度」とは別のところにあると考えています。
Google ドライブでOCRするメリットは精度よりも検索!
Google ドライブのOCR機能が一番力を発揮するのは「検索」です。例えば、ある会議で決定した事項が手書きでホワイトボードにまとめられていたとします。会議後、ホワイトボードに書かれた内容を写真に撮り、 Google ドライブにアップロードします。おそらく、手書きであればそこまで精度は出ないかもしれません。しかし、50%程度の精度だとしても、電子テキスト化された文字列がファイルに対してメタ情報として紐づけられるため、特定のキーワードが一つでもヒットすれば、 Google ドライブから該当の画像を取り出すことができます。 Google ドライブのOCR機能は、機能自体の精度の高さよりも、この検索機能が一番の強みなのではないでしょうか。
Cmosyは Google ドライブのOCR機能を活用し、個人情報をチェックする!
吉積情報株式会社では、Google Workspace (旧 G Suite) の導入サポートの他にも Google ドライブのセキュリティをさらに向上させるためのファイル共有サービス「 Cmosy 」を提供しています。Cmosy を利用することで、Google Workspace のセキュリティレベルを保持した状態で社外にファイルを共有することができます。Cmosy についての詳細はこちらの資料をご覧ください。
さらにCmosyにはセキュアメール便という機能が搭載されており、今回紹介した Google ドライブのOCR機能を活用して、ファイル内に含まれる個人情報を検知し、アラートをあげる仕組みを備えています。Cmosyを利用することで、ユーザーはより安全なメール送信を行うことができます。