OCR

Izvor: Vidipedija
Skoči na: orijentacija, traži

Optičko prepoznavanje znakova (engl. Optical Character Recognition, OCR) je tehnika kojom se rukopis, ispisan ili tiskan tekst na nekom mediju pretvara u digitalni tekstualni zapis koji se može obrađivati. Najčešće se koristi za digitaliziranje papirnatih dokumenata putem skenera i posebnog računalnog programa. Prvi sustavi za optičko prepoznavanja teksta bili su nepouzdani i prije upotrebe trebalo ih je upoznati sa slikama svih znakova koji se mogu pojaviti. Tako pripremljen sustav mogao se koristiti samo za prepoznavanje znakova ispisanih određenim pismom. Svako drugo pismo zahtijevalo je novo pripremanje sustava. Prvi takvi sustavi instalirani su sredinom pedesetih godina u SAD, u velikim trgovačkim poduzećima i koristili su se za digitalizaciju potvrda o plaćanju kreditnim karticama. Iz tog vremena potječu i specifična pisma OCR-A i OCR-B kojim se ispisuje broj kreditne kartice i ostali podaci na njoj. Prepoznavanje ispisanog ili tiskanog latiničnog dokumenta danas je gotovo potpuno pouzdano u situacijama kada je moguće dobro skeniranje, primjerice pomoću stolnog skenera. Tipična stopa pouzdanosti u takvim situacijama prelazi 99% dok se stopostotna točnost može postići jedino uz kontrolu čovjeka. Drugi tekstovi – primjerice rukopis, krasopis ili tekst pisan nelatiničnim pismom – i dalje imaju manju stopu pouzdanosti.


Vanjske poveznice