Jen upresnim, ze tesseract ma sice deep learning ocr rezim, ale jak vam bude fungovat na hnusne oscanovanych fakturach... schvalne si to zkuste porovnat. :-)
No a hlavne - je sice hezky, ze doklad zOCRkujete, ale to neni to, co potrebujete - vy potrebujete naplnit formular spravnymi udaji a poslat ho do ucetnictvi.
Pro vas mozna rozpoznavani variailnich symbolu uplne killer space tech featura neni, ale pro cloveka, ktery zadava desitky dokladu denne a ma toho tak akorat to je trochu jinak.
Kdyz ta pixla neco blbe nacte, ucetni to po ni stale muze zkontrolovat - pixla sama pozna, co by zkontrolovat chtelo a cim uz si je jista (treba i protoze u tohohle dodavatele uz tohle cislo uctu bylo 5x, tak netreba kontrolovat po seste).
V tom je druha pulka te sluzby - appka, kde hodne rychle zkontroluju, ze je vsechno cajk. Je to vyladene, aby to kontrolovani bylo co nejrychlejsi, ne ze IBAN pracne kontroluju po ctyrcislich pul minuty. Kdyz jsem ucetni, fakturu tam rovnou zauctuju, at ji v celem procesu vidim jen jedinkrat a to tady.
Zdravím,
nasazením různých validací se dá hodně věcěm předejít. Systém je úzce napojen na účetnictví a tak pozná, že je faktura podobná té, která už byla v minulosti. Pokud se nezdá, upozorní na kontrolu. Tímto způsobem lze část udělat zcela automaticky (a máme to v plánu) a případně člověka upozornit na ty, kde něco není jisté.
Co lze zkontrolovat:
- číslo účtu u plátce DPH
- IČ a DIČ proti registru firem. A také kontrola, že už máte firmu zavedenou v účetnictví.
- datumy (datum vystavení nemůže být před DÚZP apod.
- součty v dokladu (opravdu pasuje DPH, s DPH i bez DPH?)
Těch kontrol je hodně a IMHO po několika měsících používání bude možné cca 40% dokladů udělat zcela automaticky. Část se jen zkontroluje a pak malé procento se bude muset opravdu řešit. Ale ty by dlouho řešila účetní i ručně.
Dneska dokáže Rossum naprosto bez chyby vytěžit až 94% dokladů, u zbytku je nějaká chyba. A že by opravdu něco vytěžil, bylo to chybně a nenabídlo to ke kontrole s varováním je opravdu minimum.
AI je hype, ale v tomto případě opravdu funguje.
Úspěšnost 95% ověřena praxí na poměrně velkém vzorku dat.
Po roční spolupráci se blížíme reálnému nasazení.
Ano, opravdu přepisování číselných řad účtů, IBANů, VS, částek,
stačí uklepnutí a může být zle (i když je tu modulo, změna celkové
částky je taky běžným programem odhalena, ale špatný VS a už
si dopisujete a dokládáte výpisy apod...).
EDI a spol. Často je EDI jediný možný způsob importu, např. SAP.
Bohužel zrovna EDI pokulhává za realitou dnešních fin. transakcí
a už například přenesená daň a trojstranný obchod ji rozhodí.
Překvapení? To ano. EDI provideři už na to taky přišli a také začali
se spoluprací. Ostatně nemusí to být jen faktury ze kterých se dají
dolovat relevantní informace.
A teď si představte, že vám protečou přes prsty desítky tisíc faktur
denně (ano, za 24h).
EDI, ISDOC, pak různé propriertární výměny na úrovni partnerů a k tomu to nejhorší, konzervativnost prostředí, ve kterém se účetní vyskytují. Ne, že by toto nebylo fajn, ale jistě je lepší cesta řešit výměnu dat pomocí formátů. Stejně tak se nedá spolehnout na to, že si řešení samo řekne, že je něco špatně. Prostě si to neřekne vždy a tedy je potřeba opět kontrola. Tedy budu potřebovat předlohu a kontrolovat. No a kontrolování je často náročnější, než zadání dat nanovo.
Ale kdo ví, možná budeme překvapeni.
Tomu rozumím. Máme i samoobslužného wizarda (je doklikatelný po samoobslužné registraci v rámci dativery.com), ale jeho UX ještě zlepšujeme, proto zatím nastavujeme propojení s každým zákazníkem individuálně. Chápu, že pro někoho to není, během pár týdnů už na samoobslužnou verzi bude odkaz přímo i z homepage.
hmmm ... a kto bude platiť pokutu daňovému úradu, keď tá pixla dačo blbo načíta ? Neurónovými sietami, hlbokým učením sa oháňa kdekto ... stačí si v googli prekladači zadať preklad z malgaštiny (alebo iného exotickejšieho jazyka) do češtiny/slovenčiny a začnite písať mo mo mo ... a uvidíte v praxi, ako to funguje ...
ai/ml hype mašina jede na šílený obrátky
přejme všem co se na vlně vezou včasný cashout - než bublina praskne.
co se inovatovních technologií týče, tak tesseract 4+ má deep learning ocr režim pokud dobře vidím.
rozpoznávání variabilních symbolů mi nepřijde úplně killer space tech featura...