Jak funguje optické rozpoznávání znaků (OCR)

GettyImages 537511632 5a728f9204d1cf00371fc0ac

Optické rozpoznávání znaků (OCR) označuje software, který vytváří digitální verzi tištěného, strojově psaného nebo ručně psaného dokumentu, který počítače mohou číst bez nutnosti ručně psát nebo zadávat text. OCR se obvykle používá na skenovaných dokumentech ve formátu PDF, ale může také vytvořit počítačově čitelnou verzi textu v obrazovém souboru.

Co je OCR

OCR, také označované jako rozpoznávání textu, je softwarová technologie, která transformuje znaky, jako jsou čísla, písmena a interpunkční znaménka (také nazývané glyfy) z tištěných nebo psaných dokumentů do elektronické podoby, které lze snáze rozpoznat a číst pomocí počítačů a jiných softwarových programů. Některé programy OCR to dělají, protože dokument je skenován nebo fotografován digitálním fotoaparátem a jiné mohou tento proces použít na dokumenty, které byly dříve naskenovány nebo vyfotografovány bez OCR. OCR umožňuje uživatelům prohledávat dokumenty PDF, upravovat text a přeformátovat dokumenty.

Na co se OCR používá?

Pro rychlé každodenní skenování nemusí být OCR velkým problémem. Pokud provádíte velké množství skenování, schopnost vyhledávat v PDF, abyste našli přesně ten, který potřebujete, vám ušetří spoustu času a zvýší důležitost funkce OCR ve vašem programu skeneru. Zde je několik dalších věcí, se kterými OCR pomáhá:

Automatizované zpracování a zadávání údajů (Příklad: Systémy sledování uchazečů o zaměstnání pro obnovení).
Zpřístupnění skenovaných knih.
Převod ručně psaných skenů na text čitelný počítačem.
Zvyšování použitelnosti dokumentů čtenářskými programy, které pomáhají zrakově postiženým uživatelům.
Zachování historických dokumentů a novin a zároveň umožnění jejich prohledávání.
Extrakce a přenos dat do účetních programů (Příklad: Stvrzenky a faktury).
Indexování dokumentů pro použití vyhledávacími stroji.
Rozpoznávání registračních značek řidiče softwarem pro rychlostní radary a červenými světly.
Syntetizátory řeči pro lidi, kteří neumí mluvit – teoretický fyzik Stephen Hawking je možná nejznámějším uživatelem programu syntetizátoru řeči.

Proč používat OCR?

Proč ne jen vyfotit, že? Protože byste nemohli nic upravovat ani prohledávat text, protože by to byl jen obrázek. Naskenování dokumentu a spuštění softwaru OCR může tento soubor proměnit v něco, co můžete upravit a hledat.

Historie OCR

Zatímco nejčasnější použití rozpoznávání textu se datuje do roku 1914, rozsáhlý vývoj a používání technologií souvisejících s OCR začal vážně v padesátých letech minulého století, konkrétně vytvořením velmi zjednodušených písem, která se snadněji převáděly na digitálně čitelný text. První z těchto zjednodušených písem vytvořil David Shepard a běžně se nazývá OCR-7B. OCR-7B se dnes ve finančním průmyslu stále používá pro standardní písmo používané na kreditních kartách a debetních kartách. V 60. letech poštovní služby v několika zemích začaly používat technologii OCR k obrovskému urychlení třídění pošty, včetně Spojených států, Velké Británie, Kanady a Německa. OCR je stále základní technologií používanou k třídění pošty pro poštovní služby po celém světě. V roce 2000 byly klíčové znalosti limitů a schopností technologie OCR použity k vývoji programů CAPTCHA používaných k zastavení robotů a spamerů. V průběhu desetiletí se OCR stal přesnějším a sofistikovanějším díky pokroku v souvisejících technologických oblastech, jako je umělá inteligence, strojové učení a počítačové vidění. Software OCR dnes používá rozpoznávání vzorů, detekci funkcí a těžbu textu k rychlejší a přesnější transformaci dokumentů.