光学式文字認識（OCR）とは何ですか？

December 02, 2021
に携帯電話アンドロイド

光学式文字認識（OCR）は、印刷されたデジタルバージョンを作成するソフトウェアを指します。コンピュータが手動で入力または入力することなく読み取ることができる、入力された、または手書きのドキュメント文章。 OCRは通常、スキャンされたドキュメントで使用されます。 PDF フォーマットしますが、画像ファイル内にコンピュータで読み取り可能なバージョンのテキストを作成することもできます。

OCRとは

OCRは、テキスト認識とも呼ばれ、数字、文字、句読点などの文字を変換するソフトウェアテクノロジです（これも印刷または書かれた文書から電子形式へのグリフと呼ばれる）は、コンピューターや他のソフトウェアによってより簡単に認識され、読み取られます。プログラム。一部のOCRプログラムは、ドキュメントがデジタルカメラでスキャンまたは写真撮影されるときにこれを実行し、他のプログラムは、OCRなしで以前にスキャンまたは写真撮影されたドキュメントにこのプロセスを適用できます。 OCRを使用すると、ユーザーはPDFドキュメント内を検索したり、テキストを編集したり、ドキュメントを再フォーマットしたりできます。

歴史的な新聞をOCRプログラムにスキャンする女性 — OCRソフトウェアで歴史的な新聞をスキャンします。
ゲッティイメージズ

OCRは何に使用されますか？

毎日の迅速なスキャンのニーズについては、OCRは大したことではないかもしれません。大量のスキャンを行う場合、PDF内を検索して必要なものを正確に見つけることができると、かなりの時間を節約でき、スキャナープログラムのOCR機能がより重要になります。 OCRが役立つその他の機能は次のとおりです。

自動化されたデータ処理とデータ入力（例：履歴書の求職者追跡システム）。
スキャンした本を検索可能にします。
手書きのスキャンをコンピューターで読み取り可能なテキストに変換します。
視覚障害のあるユーザーを支援するリーダープログラムでドキュメントをより使いやすくします。
歴史的文書や新聞を保存しながら、検索可能にします。
データの抽出と会計プログラムへの転送（例：領収書と請求書）。
で使用するドキュメントのインデックス作成サーチエンジン.
自動速度取締機と信号無視カメラソフトウェアによる運転免許証の認識。
話すことができない人々のための音声合成装置–理論物理学者のスティーブンホーキングは、おそらく音声合成プログラムの最も有名なユーザーです。

なぜOCRを使用するのですか？

写真を撮ってみませんか？ただの画像なので、何も編集したり、テキストを検索したりすることはできません。ドキュメントをスキャンしてOCRを実行するソフトウェアそのファイルを編集して検索できるものに変えることができます。

OCRの歴史

テキスト認識の最も初期の使用は1914年にさかのぼりますが、OCR関連技術の広範な開発と使用が始まりました 1950年代に本格的に、特にデジタルで読み取り可能なフォントに変換しやすい非常に単純化されたフォントを作成しました。文章。これらの簡略化されたフォントの最初のものは、David Shepardによって作成され、一般にOCR-7Bとして知られています。 OCR-7Bは、クレジットカードやデビットカードで使用される標準フォントとして、今日でも金融業界で使用されています。 1960年代に、米国、英国、カナダ、ドイツなど、いくつかの国の郵便サービスがOCRテクノロジーを使用してメールの並べ替えを大幅に高速化し始めました。 OCRは、今でも世界中の郵便サービスのメールを分類するために使用されるコアテクノロジーです。 2000年には、OCRテクノロジーの限界と機能に関する重要な知識を使用して、 CAPTCHAプログラムボットやスパマーを阻止するために使用されます。

数十年にわたって、OCRは、次のような関連技術分野の進歩により、より正確で洗練されたものになりました。人工知能, 機械学習、およびコンピュータビジョン。今日、OCRソフトウェアは、パターン認識、機能検出、およびテキストマイニングを使用して、ドキュメントをこれまでになく高速かつ正確に変換します。

よくある質問

携帯電話やタブレットでドキュメントをスキャンするにはどうすればよいですか？

iOSで、メモアプリを開き、新しいメモを作成します。カメラを開いて、をタップします ドキュメントをスキャンする. Androidでは、Googleドライブを開き、 プラス (+）、次にタップします スキャン に携帯電話でドキュメントをスキャンする.
Adobe AcrobatでOCRを使用するにはどうすればよいですか？

スキャンした画像を含むPDFファイルを開き、を選択します ツール > PDFを編集. Acrobatは自動的にOCRを適用するため、テキストを編集できます。編集する場所を選択して、入力を開始するだけです。
OCRとOMRの違いは何ですか？

光学式マーク認識（OMR）は、紙（通常はバブルシート）のマークを検出するソフトウェアです。 OMRは、試験、調査、アンケート、さらには選挙の結果を処理するために使用されます。 OCRとは異なり、OMRはページ上のマークを解読できませんが、マークが存在することを確認するだけです。