Automaattinen optinen tekstintunnistus (Optical character recognition, OCR) on digitoidun tekstiaineiston tärkein toimenpide. Ilman sitä paperinen asiakirja on vain valokuva, jonka merkitystä tietokone ei ymmärrä. Jotta sanoja asiakirjasta voitaisiin hakea tehokkaasti tietokoneella, pitää digikuva tulkita tietokoneen ymmärtämään muotoon merkki kerrallaan. Parhaimmillaan pääsemme syväopetuilla tekoälyalgoritmeillamme 98 - 99 % tarkkuuteen, siis vain noin 1 % sivun yksittäisistä merkeistä (koneella kirjoitetuista kirjaimista) ei tunnistu oikein.
Hinta alkaen 1000 euroa, vie sinun aikaasi noin 1/2 tuntia.