Optikai karakterfelismerés

A Wikipédiából, a szabad lexikonból.

Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.

A felismerési folyamat részei:

  • az írás képének beolvasása (scanning);
  • a képen szereplő szövegblokkok, szövegsorok vizsgálata;
  • a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
  • a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).

Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.