Ce este recunoașterea optică a caracterelor (OCR)?

December 02, 2021
ÎnTelefoane Mobile Android

Recunoașterea optică a caracterelor (OCR) se referă la software care creează o versiune digitală a unui document tipărit, document dactilografiat sau scris de mână pe care computerele îl pot citi fără a fi nevoie să tastați sau să introduceți manual text. OCR este utilizat în general pe documentele scanate în PDF format, dar poate crea și o versiune a textului care poate fi citită de computer într-un fișier imagine.

Ce este OCR

OCR, denumită și recunoașterea textului, este o tehnologie software care transformă caractere precum numere, litere și semne de punctuație (de asemenea numite glife) din documente tipărite sau scrise într-o formă electronică mai ușor de recunoscut și citit de computere și alte programe software programe. Unele programe OCR fac acest lucru pe măsură ce un document este scanat sau fotografiat cu o cameră digitală, iar altele pot aplica acest proces documentelor care au fost scanate sau fotografiate anterior fără OCR. OCR permite utilizatorilor să caute în documente PDF, să editeze text și să reformateze documente.

Femeie care scanează un ziar istoric în programul OCR — Scanarea ziarelor istorice cu software OCR.
Getty Images

Pentru ce este folosit OCR?

Pentru nevoile de scanare rapidă, de zi cu zi, OCR poate să nu fie mare lucru. Dacă efectuați o cantitate mare de scanare, posibilitatea de a căuta în PDF-uri pentru a-l găsi pe cel exact de care aveți nevoie vă poate economisi destul de mult timp și face ca funcționalitatea OCR din programul dvs. de scanare să fie mai importantă. Iată câteva alte lucruri cu care OCR ajută:

Procesarea automată a datelor și introducerea datelor (Exemplu: Sisteme de urmărire a solicitanților de locuri de muncă pentru CV-uri).
Faceți cărțile scanate pot fi căutate.
Conversia scanărilor scrise de mână în text care poate fi citit de computer.
Faceți documentele mai utilizabile de către programele de citire care ajută utilizatorii cu deficiențe de vedere.
Păstrarea documentelor istorice și a ziarelor, făcându-le, de asemenea, căutabile.
Extragerea datelor și transferul în programe de contabilitate (Exemplu: Chitanțe și facturi).
Indexarea documentelor pentru utilizare de către motoare de căutare.
Recunoașterea plăcuțelor de înmatriculare de către o cameră de viteză și un software de cameră cu semafor roșu.
Sintetizatoare de vorbire pentru persoanele care nu pot vorbi – fizicianul teoretician, Stephen Hawking, este poate cel mai cunoscut utilizator al unui program de sintetizator de vorbire.

De ce să folosiți OCR?

De ce să nu faci o poză, nu? Pentru că nu ați putea să editați nimic sau să căutați textul pentru că ar fi doar o imagine. Scanarea documentului și rularea OCR software poate transforma acel fișier în ceva pe care îl puteți edita și să puteți căuta.

Istoria OCR

În timp ce cea mai veche utilizare a recunoașterii textului datează din 1914, dezvoltarea și utilizarea pe scară largă a tehnologiilor legate de OCR a început în mod serios în anii 1950, în special cu crearea de fonturi foarte simplificate, care au fost mai ușor de convertit în lizibile digital text. Primul dintre aceste fonturi simplificate a fost creat de David Shepard și cunoscut sub numele de OCR-7B. OCR-7B este încă utilizat astăzi în industria financiară pentru fontul standard utilizat pe cardurile de credit și cardurile de debit. În anii 1960, serviciile poștale din mai multe țări au început să folosească tehnologia OCR pentru a accelera considerabil sortarea corespondenței, inclusiv în Statele Unite, Marea Britanie, Canada și Germania. OCR este încă tehnologia de bază folosită pentru sortarea corespondenței pentru serviciile poștale din întreaga lume. În 2000, cunoștințele cheie despre limitele și capacitățile tehnologiei OCR au fost folosite pentru a dezvolta programe CAPTCHA folosit pentru a opri roboții și spammerii.

De-a lungul deceniilor, OCR a devenit mai precis și mai sofisticat datorită progreselor în domeniile tehnologice conexe, cum ar fi inteligență artificială, învățare automată, și viziune computerizată. Astăzi, software-ul OCR utilizează recunoașterea modelelor, detectarea caracteristicilor și extragerea textului pentru a transforma documentele mai rapid și mai precis decât oricând.

FAQ

Cum scanez documente cu telefonul sau tableta mea?

Pe iOS, deschideți aplicația Note și creați o notă nouă. Deschideți camera, apoi atingeți Scanați documente. Pe Android, deschideți Google Drive și selectați La care se adauga (+), apoi atingeți Scanează la scanează documentul cu telefonul tău.
Cum folosesc OCR în Adobe Acrobat?

Deschideți un fișier PDF care conține o imagine scanată, apoi selectați Instrumente > Editați PDF. Acrobat va aplica automat OCR, astfel încât să puteți edita textul. Doar selectați unde doriți să faceți modificări și începeți să scrieți.
Care este diferența dintre OCR și OMR?

Optical Mark Recognition (OMR) este un software care detectează semnele pe hârtie, de obicei o foaie cu bule. OMR este folosit pentru a procesa rezultatele examenelor, sondajelor, chestionarelor și chiar alegerilor. Spre deosebire de OCR, OMR nu poate descifra semnele de pe pagină, ci doar verifică dacă semnele sunt acolo.