Mi az az optikai karakterfelismerés (OCR)?

click fraud protection

Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely egy nyomtatott, gépelt vagy kézzel írt dokumentum, amelyet a számítógépek anélkül is el tudnak olvasni, hogy manuálisan be kellene gépelni vagy be kellene írniuk a szöveg. Az OCR-t általában a beszkennelt dokumentumokon használják PDF formátumban, de egy képfájlon belül a szöveg számítógéppel olvasható változatát is létrehozhatja.

Mi az az OCR

Az OCR, más néven szövegfelismerés, olyan szoftvertechnológia, amely átalakítja a karaktereket, például számokat, betűket és írásjeleket (szintén írott vagy nyomtatott dokumentumokból számítógépek és egyéb szoftverek által könnyebben felismerhető és olvasható elektronikus formába programokat. Egyes OCR-programok ezt úgy teszik meg, hogy egy dokumentumot beolvasnak vagy lefényképeznek digitális fényképezőgéppel, mások pedig alkalmazhatják ezt a folyamatot olyan dokumentumokra, amelyeket korábban OCR nélkül szkennettek vagy fényképeztek. Az OCR lehetővé teszi a felhasználók számára a PDF-dokumentumok közötti keresést, a szöveg szerkesztését és a dokumentumok újraformázását.

Nő történelmi újságot szkennel az OCR programba
Történelmi újságok szkennelése OCR szoftverrel.

 Getty Images

Mire használható az OCR?

A gyors, mindennapi szkennelési igényekhez az OCR talán nem nagy ügy. Ha nagy mennyiségű szkennelést végez, a PDF-fájlokban való kereséssel, hogy megtalálja a pontosan azt, amelyre szüksége van, sok időt takaríthat meg, és fontosabbá teszi a szkennerprogram OCR funkcióit. Íme néhány egyéb dolog, amiben az OCR segít:

  • Automatizált adatfeldolgozás és adatbevitel (Példa: Álláskeresők nyomkövető rendszerei önéletrajzokhoz).
  • A beszkennelt könyvek kereshetővé tétele.
  • Kézzel írt beolvasások konvertálása számítógéppel olvasható szöveggé.
  • A dokumentumok használhatóbbá tétele a látássérült felhasználókat segítő olvasóprogramokkal.
  • Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele.
  • Adatkinyerés és könyvelési programokba való átvitel (Példa: Nyugták és számlák).
  • Dokumentumok indexelése általi használatra kereső motorok.
  • A járművezetői rendszám felismerése sebességmérő és piros lámpás kamera szoftverrel.
  • Beszédszintetizátorok azoknak, akik nem tudnak beszélni – Stephen Hawking elméleti fizikus a beszédszintetizáló programok talán legismertebb felhasználója.

Miért érdemes OCR-t használni?

Miért nem csinálsz egy képet, nem? Mert nem tudna semmit szerkeszteni vagy keresni a szövegben, mert az csak egy kép lenne. A dokumentum beolvasása és az OCR futtatása szoftver szerkeszthetővé és kereshetővé alakíthatja a fájlt.

Az OCR története

Míg a szövegfelismerés legkorábbi használata 1914-re datálható, megkezdődött az OCR-hez kapcsolódó technológiák széles körű fejlesztése és használata. komolyan az 1950-es években, különösen a nagyon leegyszerűsített betűtípusok létrehozásával, amelyek könnyebben konvertálhatók digitálisan olvashatóvá szöveg. Az első ilyen egyszerűsített betűtípust David Shepard hozta létre, és OCR-7B néven ismerték. Az OCR-7B-t ma is használják a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípusokhoz. Az 1960-as években a postai szolgáltatások több országban elkezdték OCR technológiát használni a levélválogatás jelentős felgyorsítására, ideértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot is. Az OCR továbbra is az alapvető technológia, amelyet a postai szolgáltatások számára világszerte használnak a levelek rendezésére. 2000-ben az OCR technológia korlátaival és képességeivel kapcsolatos kulcsfontosságú ismereteket használták fel a fejlesztéshez CAPTCHA programok a robotok és a spammerek megállítására szolgál.

Az évtizedek során az OCR pontosabbá és kifinomultabbá vált a kapcsolódó technológiai területeken, mint pl mesterséges intelligencia, gépi tanulásés számítógépes látás. Manapság az OCR-szoftver mintafelismerést, funkciófelismerést és szövegbányászatot használ a dokumentumok gyorsabb és pontosabb átalakítására, mint valaha.

GYIK

  • Hogyan szkennelhetek be dokumentumokat telefonommal vagy táblagépemmel?

    iOS rendszeren nyissa meg a Notes alkalmazást, és hozzon létre egy új jegyzetet. Nyissa meg a kamerát, majd érintse meg a lehetőséget Dokumentumok szkennelése. Androidon nyissa meg a Google Drive-ot, és válassza ki a Plusz (+), majd érintse meg a lehetőséget Letapogatás nak nek szkennelje be a dokumentumot a telefonjával.

  • Hogyan használhatom az OCR-t az Adobe Acrobatban?

    Nyisson meg egy beolvasott képet tartalmazó PDF-fájlt, majd válassza a lehetőséget Eszközök > PDF szerkesztése. Az Acrobat automatikusan alkalmazza az OCR-t, így Ön szerkesztheti a szöveget. Csak válassza ki, hol szeretné szerkeszteni, és kezdjen el gépelni.

  • Mi a különbség az OCR és az OMR között?

    Az Optical Mark Recognition (OMR) olyan szoftver, amely észleli a nyomokat a papíron, jellemzően egy buboréklapon. Az OMR-t vizsgák, felmérések, kérdőívek, sőt választások eredményeinek feldolgozására használják. Az OCR-től eltérően az OMR nem tudja megfejteni az oldalon lévő jelöléseket, csak ellenőrzi, hogy ott vannak-e a jelölések.