Šta je optičko prepoznavanje znakova (OCR)?

Optičko prepoznavanje znakova (OCR) odnosi se na softver koji kreira digitalnu verziju štampanog, otkucaja ili rukom pisanog dokumenta koji računari mogu čitati bez potrebe ručnog unosa ili unosa teksta. OCR se generalno koristi na skeniranim dokumentima u PDF formatu, ali takođe može kreirati verziju teksta u okviru datoteke sa slikom u računaru.

Šta je OCR?

OCR, takođe poznat kao prepoznavanje teksta, je softverska tehnologija koja pretvara karaktere kao što su brojevi, slova i interpunkcije (takođe nazvani glifovi) od štampanih ili pisanih dokumenata u elektronski oblik koji se lakše prepoznaje i čitaju računari i drugi softverski programi. Neki OCR programi to rade pošto je dokument skeniran ili fotografisan digitalnom kamerom, a drugi mogu primeniti ovaj proces na dokumente koji su ranije skenirani ili fotografisani bez OCR-a. OCR omogućava korisnicima da pretražuju unutar PDF dokumenata, uređuju tekst i ponovo formatiraju dokumente.

Za šta se koristi OCR?

Za brze i svakodnevne potrebe za skeniranje, OCR možda nije velika stvar. Ako vršite veliku količinu skeniranja, možete pretražiti unutar PDF-a da biste pronašli tačno ono što vam treba, može vam uštedeti dosta vremena i učiniti OCR funkcionalnost u programu skenera važnijim. Evo nekih drugih stvari koje OCR pomaže s:

Zašto koristiti OCR?

Zašto ne samo snimiti sliku, zar ne? Zato što ne biste mogli ništa da uređujete ili pretražujete, jer bi to samo bila slika. Skeniranje dokumenta i pokretanja OCR softvera može pretvoriti tu datoteku u nešto što možete urediti i biti u mogućnosti pretraživati.

Istorija OCR-a

Iako je najranija upotreba prepoznavanja teksta datira do 1914. godine, široko rasprostranjen razvoj i upotreba tehnologija vezanih za OCR započeo je u 1950-tim, posebno sa stvaranjem veoma pojednostavljenih fontova koji su se lakše pretvorili u digitalno čitljiv tekst. Prvi od ovih pojednostavljenih fontova kreirao je David Shepard i poznat kao OCR-7B. OCR-7B se i dalje koristi u finansijskoj industriji za standardni font koji se koristi na kreditnim karticama i debitnim karticama. Šezdesetih godina, poštanske usluge u nekoliko zemalja počele su da koriste OCR tehnologiju kako bi ubrzale razvrstavanje pošte, uključujući SAD, Veliku Britaniju, Kanadu i Nemačku. OCR je i dalje osnovna tehnologija koja se koristi za sortiranje pošte za poštanske usluge širom sveta. Tokom 2000. ključno znanje o granicama i mogućnostima OCR tehnologije koristilo se za razvoj CAPTCHA programa koji su korišćeni za zaustavljanje bota i spamera.

Tokom nekoliko decenija OCR je postao precizniji i sofisticiraniji zbog napredovanja u srodnim tehnološkim oblastima kao što su veštačka inteligencija , mašinsko učenje i računarska vizija. Danas, OCR softver koristi prepoznavanje uzoraka, otkrivanje funkcija i rukovanje tekovinama da brže i tačnije pretvaraju dokumente nego ikada prije.