Extrakce textu z PDF

but.committeedoc. RNDr. Jitka Kreslíková, CSc. (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Z hlediska zapojení systému je velmi důležité znát časovou náročnost převodu. Jaká je časová náročnost u převodu pomocí Vašeho systému a jak je na tom ve srovnání s původní verzí systému? Jak je možné, že rychlost převodu je ve vaší implementaci rychlejší u většího souboru, než menšího souboru (v tabulce porovnání)?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSchmidt, Marekcs
dc.contributor.authorKubík, Petrcs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.created2010cs
dc.description.abstractPráce se zabývá extrakcí textu z dokumentu PDF, obsahující především vícesloupcový text. Je zde popsána struktura PDF a rozbor získání textu z PDF. Práce se dále zaměřuje na návrh a implementaci algoritmu vylepšujicí extrakci textu.cs
dc.description.abstractBachelor's thesis is concerned with text extraction from PDF dokument which contains mainly multi-column text. There's a description of PDF structure and analysis of text extraction from PDF document. Thesis is focused on suggestion of algorithm's implementation of improving text extraction.en
dc.description.markDcs
dc.identifier.citationKUBÍK, P. Extrakce textu z PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2010.cs
dc.identifier.other34842cs
dc.identifier.urihttp://hdl.handle.net/11012/56037
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectpopplercs
dc.subjectPDFBoxcs
dc.subjectpdftotextcs
dc.subjectformát PDFcs
dc.subjectslovníkcs
dc.subjectproudcs
dc.subjectformátování výstupucs
dc.subjecttok textucs
dc.subjectreprezentace textucs
dc.subjectpoppleren
dc.subjectPDFBoxen
dc.subjectpdftotexten
dc.subjectformat PDFen
dc.subjectdictionaryen
dc.subjectstreamen
dc.subjectformat outputen
dc.subjectflow texten
dc.subjectreprezentation texten
dc.titleExtrakce textu z PDFcs
dc.title.alternativePDF Text Extractionen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2010-06-17cs
dcterms.modified2020-05-09-23:42:03cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid34842en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 17:46:11en
sync.item.modts2025.01.15 20:13:08en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
542 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_34842.html
Size:
1.41 KB
Format:
Hypertext Markup Language
Description:
file review_34842.html
Collections