Mis on optiline märgituvastus (OCR)?
Optiline märgituvastus (OCR) viitab tarkvarale, mis loob digitaalse versiooni trükitud, trükitud või käsitsi kirjutatud dokument, mida arvutid saavad lugeda, ilma et oleks vaja käsitsi tippida või sisestada tekst. OCR-i kasutatakse tavaliselt skannitud dokumentide puhul PDF vormingus, kuid saab luua ka pildifaili tekstist arvutiloetava versiooni.
Mis on OCR
OCR, mida nimetatakse ka tekstituvastuseks, on tarkvaratehnoloogia, mis teisendab selliseid märke nagu numbrid, tähed ja kirjavahemärgid (ka nimetatakse glüüfideks) trükitud või kirjalikest dokumentidest elektroonilisele kujule, mida arvutid ja muu tarkvara hõlpsamini ära tunneb ja loeb programmid. Mõned OCR-programmid teevad seda nii, et dokument skannitakse või pildistatakse digitaalkaameraga, teised saavad seda protsessi rakendada dokumentidele, mida on eelnevalt skannitud või pildistatud ilma OCR-ita. OCR võimaldab kasutajatel PDF-dokumentidest otsida, teksti redigeerida ja dokumente ümber vormindada.
Milleks OCR-i kasutatakse?
Kiire igapäevaste skannimisvajaduste jaoks ei pruugi OCR olla suur asi. Kui skannite palju, saate PDF-failidest otsida, et leida täpselt vajalikku, säästa palju aega ja muudab teie skanneriprogrammi OCR-funktsiooni olulisemaks. Siin on veel mõned asjad, millega OCR aitab:
- Automatiseeritud andmetöötlus ja andmesisestus (Näide: tööotsijate CV jälgimise süsteemid).
- Skännitud raamatute otsitavaks muutmine.
- Käsitsi kirjutatud skaneeringu teisendamine arvutis loetavaks tekstiks.
- Nägemispuudega kasutajaid abistavate lugejaprogrammide abil dokumentide hõlpsamaks muutmine.
- Säilitades ajaloolisi dokumente ja ajalehti, muutes need ka otsitavaks.
- Andmete väljavõtmine ja ülekandmine raamatupidamisprogrammidesse (Näide: Kviitungid ja arved).
- Dokumentide indekseerimine kasutamiseks otsingumootorid.
- Juhi numbrimärkide tuvastamine kiiruskaamera ja punase tule kaamera tarkvara abil.
- Kõnesüntesaatorid inimestele, kes ei oska rääkida – teoreetiline füüsik Stephen Hawking on ehk kõige tuntum kõnesüntesaatori programmi kasutaja.
Miks kasutada OCR-i?
Miks mitte lihtsalt pilti teha, eks? Sest te ei saaks midagi redigeerida ega tekstist otsida, sest see oleks lihtsalt pilt. Dokumendi skannimine ja OCR-i käivitamine tarkvara saab muuta selle faili millekski, mida saate redigeerida ja otsida.
OCR-i ajalugu
Kui tekstituvastuse kõige varasem kasutus sai alguse 1914. aastast, siis OCR-iga seotud tehnoloogiate laialdane arendamine ja kasutamine algas. tõsiselt 1950. aastatel, eriti väga lihtsustatud fontide loomisega, mida oli lihtsam digitaalselt loetavaks teisendada tekst. Esimese nendest lihtsustatud fontidest lõi David Shepard ja seda tuntakse üldiselt kui OCR-7B. OCR-7B on tänapäevalgi finantssektoris kasutusel krediit- ja deebetkaartidel kasutatava standardfondi jaoks. 1960. aastatel hakkasid mitme riigi postiteenused kasutama OCR-tehnoloogiat, et oluliselt kiirendada kirjade sorteerimist, sealhulgas Ameerika Ühendriikides, Suurbritannias, Kanadas ja Saksamaal. OCR on endiselt põhitehnoloogia, mida kasutatakse postiteenuste jaoks kogu maailmas. 2000. aastal kasutati selle väljatöötamiseks põhiteadmisi OCR-tehnoloogia piiride ja võimaluste kohta CAPTCHA programmid kasutatakse robotite ja rämpspostitajate peatamiseks.
Aastakümnete jooksul on OCR muutunud täpsemaks ja keerukamaks tänu edusammudele seotud tehnoloogiavaldkondades, nagu tehisintellekt, masinõpeja arvutinägemine. Tänapäeval kasutab OCR-tarkvara mustrituvastust, funktsioonide tuvastamist ja tekstikaevandamist, et muuta dokumente kiiremini ja täpsemalt kui kunagi varem.
KKK
-
Kuidas telefoni või tahvelarvutiga dokumente skannida?
Avage iOS-is rakendus Märkmed ja looge uus märge. Avage kaamera ja seejärel puudutage Skanni dokumente. Androidis avage Google Drive ja valige Pluss (+), seejärel puudutage Skaneeri juurde skannige dokument telefoniga.
-
Kuidas kasutada OCR-i Adobe Acrobatis?
Avage skannitud pilti sisaldav PDF-fail ja valige seejärel Tööriistad > Redigeeri PDF-i. Acrobat rakendab automaatselt OCR-i, et saaksite teksti redigeerida. Valige lihtsalt koht, kus soovite muudatusi teha, ja alustage tippimist.
-
Mis vahe on OCR-il ja OMR-il?
Optiline märgituvastus (OMR) on tarkvara, mis tuvastab märgid paberil, tavaliselt mullilehel. OMR-i kasutatakse eksamite, uuringute, küsimustike ja isegi valimiste tulemuste töötlemiseks. Erinevalt OCR-ist ei saa OMR lehel olevaid märke dešifreerida, vaid ainult kontrollib, kas märgid on olemas.