Što je optičko prepoznavanje znakova (OCR)?

OCR (prepoznavanje optičkih znakova) odnosi se na softver koji stvara digitalnu verziju tiskanog, upisanom ili rukom pisanom dokumentacijom koju računala može čitati bez potrebe ručnog upisivanja ili unosa teksta. OCR se obično koristi u skeniranim dokumentima u PDF formatu, ali također može stvoriti računalnu verziju teksta unutar slikovne datoteke.

Što je OCR?

OCR, također poznat kao prepoznavanje teksta, softverska je tehnologija koja pretvara znakove poput brojeva, slova i interpunkcijskih znakova (tzv. Glifi) iz tiskanih ili pisanih dokumenata u elektronički oblik lakše prepoznatljiv i čitan pomoću računala i drugih softverskih programa. Neki OCR programi to čine dok se dokument skenira ili fotografira s digitalnom kamerom, a drugi mogu primijeniti taj postupak na dokumente koji su prethodno skenirani ili fotografirani bez OCR-a. OCR omogućuje korisnicima pretraživanje unutar PDF dokumenata, uređivanje teksta i ponovno oblikovanje dokumenata.

Što se OCR koristi za?

Za brze, svakodnevne potrebe za skeniranjem, OCR ne mora biti velik posao. Ako napravite veliku količinu skeniranja, moći ćete pretraživati ​​unutar PDF-ova kako biste pronašli ono što trebate, možete uštedjeti dosta vremena i učiniti važniju OCR funkcionalnost u programu skenera. Evo nekih drugih stvari koje OCR pomaže kod:

Zašto koristiti OCR?

Zašto ne samo uzeti sliku, zar ne? Zato što nećete moći uređivati ​​ništa ili pretraživati ​​tekst jer bi to samo slika. Skeniranje dokumenta i pokretanje OCR softvera mogu pretvoriti tu datoteku u nešto što možete urediti i moći pretraživati.

Povijest OCR-a

Iako je najranija upotreba prepoznavanja teksta do 1914. godine, širenje razvoja i upotrebe OCR-ovih tehnologija započelo je ozbiljno tijekom 1950-ih, posebice stvaranjem vrlo pojednostavljenih fontova koji su lakše pretvoriti u digitalno čitljivi tekst. Prvi od tih pojednostavljenih fontova stvorio je David Shepard i obično poznat kao OCR-7B. OCR-7B je još uvijek u upotrebi u financijskoj industriji za standardni font koji se koristi na kreditnim karticama i debitnim karticama. Šezdesetih godina 20. stoljeća, poštanske usluge u nekoliko zemalja počele su koristiti OCR tehnologiju kako bi uvelike ubrzale sortiranje pošte, uključujući Sjedinjene Države, Veliku Britaniju, Kanadu i Njemačku. OCR je i dalje glavna tehnologija koja se koristi za razvrstavanje pošte za poštanske usluge širom svijeta. Godine 2000. ključno je znanje o ograničenjima i mogućnostima OCR tehnologije korišteno za razvoj CAPTCHA programa koji se koriste za zaustavljanje robota i spameri.

Tijekom desetljeća OCR je postao točniji i sofisticiraniji zbog napredovanja u srodnim područjima tehnologije kao što su umjetna inteligencija , strojno učenje i računalna vizija. Danas, OCR softver koristi prepoznavanje uzoraka, detekciju značajki i tekstualno rudarstvo radi bržeg i preciznijeg pretvaranja dokumenata nego ikad prije.