Ahoj,
pracujem na programe, ktory by mal automaticky najst a pripadne
opravit chyby v dokumentoch rozpoznanych pomocou OCR.
Velmi by mi pomohlo, keby som mala k dispozicii povodne texty ziskane
ako vystup z OCR softwaru, bez opravenych chyb, a tie iste texty s uz
opravenymi chybami. Teda pred obsahovou korekturou a po tejto korekture.
Je nejako mozne sa k takymto dokumentom dostat? Mala by som
zaujem hlavne o cestinu a anglictinu.
Ide o skolsky projekt, v pripade, ze bude nejako rozumne fungovat, dam ho
k dispozicii na internet.
pracujem na programe, ktory by mal automaticky najst a pripadne
opravit chyby v dokumentoch rozpoznanych pomocou OCR.
Velmi by mi pomohlo, keby som mala k dispozicii povodne texty ziskane
ako vystup z OCR softwaru, bez opravenych chyb, a tie iste texty s uz
opravenymi chybami. Teda pred obsahovou korekturou a po tejto korekture.
Je nejako mozne sa k takymto dokumentom dostat? Mala by som
zaujem hlavne o cestinu a anglictinu.
Ide o skolsky projekt, v pripade, ze bude nejako rozumne fungovat, dam ho
k dispozicii na internet.