Extrakce textu z PDF
but.committee | doc. RNDr. Jitka Kreslíková, CSc. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Z hlediska zapojení systému je velmi důležité znát časovou náročnost převodu. Jaká je časová náročnost u převodu pomocí Vašeho systému a jak je na tom ve srovnání s původní verzí systému? Jak je možné, že rychlost převodu je ve vaší implementaci rychlejší u většího souboru, než menšího souboru (v tabulce porovnání)? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Schmidt, Marek | cs |
dc.contributor.author | Kubík, Petr | cs |
dc.contributor.referee | Otrusina, Lubomír | cs |
dc.date.created | 2010 | cs |
dc.description.abstract | Práce se zabývá extrakcí textu z dokumentu PDF, obsahující především vícesloupcový text. Je zde popsána struktura PDF a rozbor získání textu z PDF. Práce se dále zaměřuje na návrh a implementaci algoritmu vylepšujicí extrakci textu. | cs |
dc.description.abstract | Bachelor's thesis is concerned with text extraction from PDF dokument which contains mainly multi-column text. There's a description of PDF structure and analysis of text extraction from PDF document. Thesis is focused on suggestion of algorithm's implementation of improving text extraction. | en |
dc.description.mark | D | cs |
dc.identifier.citation | KUBÍK, P. Extrakce textu z PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010. | cs |
dc.identifier.other | 34842 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/56037 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | poppler | cs |
dc.subject | PDFBox | cs |
dc.subject | pdftotext | cs |
dc.subject | formát PDF | cs |
dc.subject | slovník | cs |
dc.subject | proud | cs |
dc.subject | formátování výstupu | cs |
dc.subject | tok textu | cs |
dc.subject | reprezentace textu | cs |
dc.subject | poppler | en |
dc.subject | PDFBox | en |
dc.subject | pdftotext | en |
dc.subject | format PDF | en |
dc.subject | dictionary | en |
dc.subject | stream | en |
dc.subject | format output | en |
dc.subject | flow text | en |
dc.subject | reprezentation text | en |
dc.title | Extrakce textu z PDF | cs |
dc.title.alternative | PDF Text Extraction | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2010-06-17 | cs |
dcterms.modified | 2020-05-09-23:42:03 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 34842 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 17:46:11 | en |
sync.item.modts | 2025.01.15 20:13:08 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |