OCR faktur: čtení PDF, skenů a fotek bez ručního opisování
OCR faktur převádí PDF, skeny a fotky na text. Vysvětlujeme, co OCR umí, kde má limit a kdy už je potřeba vytěžování faktur nebo širší zpracování faktur.
OCR faktur je technologie, která převádí obsah faktury z PDF, skenu nebo fotografie na text. Pokud řešíte hlavně OCR faktur, zajímá vás obvykle jedna věc: jak rychle dostat text z dokladu do digitální podoby bez ručního opisování.
V praxi je ale dobré oddělit tři vrstvy. OCR faktur řeší přečtení textu. Vytěžování faktur řeší převod významu textu do polí. Zpracování faktur pak řeší celý provozní tok od přijetí dokladu po export do účetnictví. Tento článek je záměrně zaměřený na první vrstvu: OCR, skenování faktur a čtení PDF.
Co je OCR faktur
OCR znamená optické rozpoznávání znaků. U faktur jde o převod vizuálního dokumentu na text, který lze fulltextově prohledávat, kopírovat nebo dále zpracovat.
Typické vstupy pro OCR faktur:
- nativní PDF,
- sken přijaté faktury,
- fotka z telefonu,
- příloha e-mailu převedená do obrázku.
Nativní PDF bývá nejjednodušší. U skenů a mobilních fotek už do výsledku vstupuje světlo, ostrost, kontrast, natočení stránky nebo kvalita původního tisku.
Co OCR faktur umí a neumí
OCR faktur umí:
- přečíst text z dokumentu,
- vytvořit vyhledatelný archiv,
- urychlit dohledání údajů v PDF,
- připravit podklad pro další automatizaci.
OCR faktur samo o sobě neumí spolehlivě určit, jestli 12 540 Kč znamená základ daně, DPH nebo částku celkem. To už je úloha pro vytěžování dat a validaci polí.
OCR faktur vs vytěžování faktur
Tohle je nejdůležitější rozdíl:
| Vrstva | Co dělá | Typický výstup |
|---|---|---|
| OCR faktur | Přečte text z dokumentu | Řádky a slova |
| Vytěžování faktur | Rozpozná význam hodnot | Dodavatel, datum, DPH, částka |
| Zpracování faktur | Řídí celý workflow | Kontrola, schválení, export |
Pokud řešíte pouze čtení faktury, OCR je správné téma. Pokud potřebujete dostat data do účetních polí, navazuje na to článek Vytěžování faktur. Pokud potřebujete celý proces od příjmu dokladu po export, je to spíš Zpracování faktur.
Kdy OCR faktur stačí
OCR faktur často stačí tehdy, když chcete:
- fulltextově prohledávat archiv,
- rychle zkopírovat údaje z PDF,
- převést sken do čitelného textu,
- sjednotit papírové a elektronické doklady do digitální podoby.
V těchto scénářích ještě nemusíte řešit účetní export ani strukturovaná pole.
Kdy už OCR faktur nestačí
OCR faktur samo o sobě nestačí ve chvíli, kdy:
- chcete předvyplnit účetní pole,
- potřebujete rozlišit základ, DPH a částku celkem,
- exportujete do POHODA XML, ISDOC nebo jiného formátu,
- potřebujete kontrolu nad nejistými hodnotami,
- zpracováváte více firem a více lidí.
Právě tam začíná vytěžování faktur a kontrolované workflow nad dokladem.

OCR faktur je užitečné jako čtení textu. Pro účetnictví ale bývá klíčové až to, co navazuje po OCR: mapování dat do polí a kontrola před exportem.
Co sledovat u PDF, skenů a fotek
U OCR faktur není důležitá jen technologie, ale i kvalita vstupu.
- PDF bývá nejpřesnější, pokud už obsahuje textovou vrstvu.
- Sken je citlivý na rozlišení, šum a kontrast.
- Fotka z telefonu přidává perspektivu, stíny a neostrost.
Čím horší vstup, tím důležitější je pozdější kontrola. OCR může text přečíst, ale nepřesnost se pak projeví v datech, která by bez kontroly neměla odcházet do účetnictví.
Jak OCR zapadá do workflow INVOICO
INVOICO používá OCR jako součást širšího procesu. Cílem není jen převést obrázek na text, ale připravit doklad pro další krok:
- přijmout PDF, sken nebo mobilní fotku,
- přečíst obsah dokladu,
- navrhnout význam hodnot do polí,
- zobrazit zdroj vedle dat,
- teprve po kontrole exportovat dál.
Proto je OCR v INVOICO jen první vrstva. Pokud dnes hledáte „OCR faktur“, je dobré vědět, že pro účetní tým má hodnotu hlavně tehdy, když na něj naváže vytěžování a kontrola.

Čím víc se potřebujete přiblížit účetnímu exportu, tím méně stačí samotné OCR faktur a tím víc dává smysl vytěžování a review.
Rychlá odpověď
OCR faktur převádí PDF, sken nebo fotku na text. To je užitečné pro čtení a archivaci, ale samo o sobě to ještě neřeší převod do účetních polí ani export do účetnictví.
Časté otázky
Co znamená OCR faktur?
OCR faktur znamená převedení textu z PDF, skenu nebo fotografie faktury do digitální textové podoby.
Je OCR faktur stejné jako vytěžování faktur?
Ne. OCR čte text. Vytěžování faktur rozpoznává význam hodnot a přiřazuje je do strukturovaných polí.
Umí OCR faktur připravit data pro účetnictví?
Samotné OCR obvykle nestačí. Pro účetní workflow je potřeba navázat vytěžení polí, kontrolu a exportní logiku.
Kdy OCR faktur dává největší smysl?
Když potřebujete číst PDF a skeny, digitalizovat archiv nebo připravit vstup pro další automatizaci.
Kam pokračovat, když nechci jen čtení textu?
Pokud chcete převádět údaje do polí, pokračujte na Vytěžování faktur. Pokud řešíte celý provoz od přijetí faktury po schválení a export, pokračujte na Zpracování faktur.