Mi az az optikai karakterfelismerés (OCR)?
Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely egy nyomtatott, gépelt vagy kézzel írt dokumentum, amelyet a számítógépek anélkül is el tudnak olvasni, hogy manuálisan be kellene gépelni vagy be kellene írniuk a szöveg. Az OCR-t általában a beszkennelt dokumentumokon használják PDF formátumban, de egy képfájlon belül a szöveg számítógéppel olvasható változatát is létrehozhatja.
Mi az az OCR
Az OCR, más néven szövegfelismerés, olyan szoftvertechnológia, amely átalakítja a karaktereket, például számokat, betűket és írásjeleket (szintén írott vagy nyomtatott dokumentumokból számítógépek és egyéb szoftverek által könnyebben felismerhető és olvasható elektronikus formába programokat. Egyes OCR-programok ezt úgy teszik meg, hogy egy dokumentumot beolvasnak vagy lefényképeznek digitális fényképezőgéppel, mások pedig alkalmazhatják ezt a folyamatot olyan dokumentumokra, amelyeket korábban OCR nélkül szkennettek vagy fényképeztek. Az OCR lehetővé teszi a felhasználók számára a PDF-dokumentumok közötti keresést, a szöveg szerkesztését és a dokumentumok újraformázását.
Mire használható az OCR?
A gyors, mindennapi szkennelési igényekhez az OCR talán nem nagy ügy. Ha nagy mennyiségű szkennelést végez, a PDF-fájlokban való kereséssel, hogy megtalálja a pontosan azt, amelyre szüksége van, sok időt takaríthat meg, és fontosabbá teszi a szkennerprogram OCR funkcióit. Íme néhány egyéb dolog, amiben az OCR segít:
- Automatizált adatfeldolgozás és adatbevitel (Példa: Álláskeresők nyomkövető rendszerei önéletrajzokhoz).
- A beszkennelt könyvek kereshetővé tétele.
- Kézzel írt beolvasások konvertálása számítógéppel olvasható szöveggé.
- A dokumentumok használhatóbbá tétele a látássérült felhasználókat segítő olvasóprogramokkal.
- Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele.
- Adatkinyerés és könyvelési programokba való átvitel (Példa: Nyugták és számlák).
- Dokumentumok indexelése általi használatra kereső motorok.
- A járművezetői rendszám felismerése sebességmérő és piros lámpás kamera szoftverrel.
- Beszédszintetizátorok azoknak, akik nem tudnak beszélni – Stephen Hawking elméleti fizikus a beszédszintetizáló programok talán legismertebb felhasználója.
Miért érdemes OCR-t használni?
Miért nem csinálsz egy képet, nem? Mert nem tudna semmit szerkeszteni vagy keresni a szövegben, mert az csak egy kép lenne. A dokumentum beolvasása és az OCR futtatása szoftver szerkeszthetővé és kereshetővé alakíthatja a fájlt.
Az OCR története
Míg a szövegfelismerés legkorábbi használata 1914-re datálható, megkezdődött az OCR-hez kapcsolódó technológiák széles körű fejlesztése és használata. komolyan az 1950-es években, különösen a nagyon leegyszerűsített betűtípusok létrehozásával, amelyek könnyebben konvertálhatók digitálisan olvashatóvá szöveg. Az első ilyen egyszerűsített betűtípust David Shepard hozta létre, és OCR-7B néven ismerték. Az OCR-7B-t ma is használják a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípusokhoz. Az 1960-as években a postai szolgáltatások több országban elkezdték OCR technológiát használni a levélválogatás jelentős felgyorsítására, ideértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot is. Az OCR továbbra is az alapvető technológia, amelyet a postai szolgáltatások számára világszerte használnak a levelek rendezésére. 2000-ben az OCR technológia korlátaival és képességeivel kapcsolatos kulcsfontosságú ismereteket használták fel a fejlesztéshez CAPTCHA programok a robotok és a spammerek megállítására szolgál.
Az évtizedek során az OCR pontosabbá és kifinomultabbá vált a kapcsolódó technológiai területeken, mint pl mesterséges intelligencia, gépi tanulásés számítógépes látás. Manapság az OCR-szoftver mintafelismerést, funkciófelismerést és szövegbányászatot használ a dokumentumok gyorsabb és pontosabb átalakítására, mint valaha.
GYIK
-
Hogyan szkennelhetek be dokumentumokat telefonommal vagy táblagépemmel?
iOS rendszeren nyissa meg a Notes alkalmazást, és hozzon létre egy új jegyzetet. Nyissa meg a kamerát, majd érintse meg a lehetőséget Dokumentumok szkennelése. Androidon nyissa meg a Google Drive-ot, és válassza ki a Plusz (+), majd érintse meg a lehetőséget Letapogatás nak nek szkennelje be a dokumentumot a telefonjával.
-
Hogyan használhatom az OCR-t az Adobe Acrobatban?
Nyisson meg egy beolvasott képet tartalmazó PDF-fájlt, majd válassza a lehetőséget Eszközök > PDF szerkesztése. Az Acrobat automatikusan alkalmazza az OCR-t, így Ön szerkesztheti a szöveget. Csak válassza ki, hol szeretné szerkeszteni, és kezdjen el gépelni.
-
Mi a különbség az OCR és az OMR között?
Az Optical Mark Recognition (OMR) olyan szoftver, amely észleli a nyomokat a papíron, jellemzően egy buboréklapon. Az OMR-t vizsgák, felmérések, kérdőívek, sőt választások eredményeinek feldolgozására használják. Az OCR-től eltérően az OMR nem tudja megfejteni az oldalon lévő jelöléseket, csak ellenőrzi, hogy ott vannak-e a jelölések.