Extrakce bibliografických informací z textu – Bc. Tomáš Petránek
Bc. Tomáš Petránek
Master's thesis
Extrakce bibliografických informací z textu
Extraction of bibliographic information from plaintext
Abstract:
Moje práce pojednává o existujících technikách extrakce informací z textu. Zvláštní důraz je kladen na hledání dat pomocí vzorů a tvorbu těchto vzorů s využitím regulárních výrazů. Podstatná část se zabývá navrženým systémem pro extrakci bibliografických informací z článků publikovaných v textové podobě. Při implementaci tohoto systému je použit přístup k textu odlišný od přístupů popsaných v úvodu …moreAbstract:
In this work I dealt with some of the existing techniques in the field of information extraction from a text. Special emphasis was placed on the description of a technique that is known as a pattern matching and uses regular expressions. The main chapter of the work deals with the system designed for the extraction of bibliographic information from a plaintext. During the implementation of this system …more
Language used: Czech
Date on which the thesis was submitted / produced: 19. 5. 2006
Identifier:
https://is.muni.cz/th/v2m2e/
Thesis defence
- Date of defence: 29. 6. 2006
- Supervisor: RNDr. Jan Pomikálek, Ph.D.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Applied Informatics / Applied Informatics
Theses on a related topic
-
Automatická extrakce informací z e-mailové korespondence pro češtinu
Jan Rygl -
System for advanced search in metadata from NLP tools
Norbert Bodnár -
Plant Identification supported by Analysis of Image Metadata
Dominika Krejčí -
Automated metadata extraction
Martin Šmíd -
Utilization of NTFS metadata to facilitate digital forensics
Michal Masrna -
Enhancing the FAIRness of Gromacs software: Adding support to extract metadata in JSON/YAML formats
Róbert Randiak -
Metadata overlay for seccerts.org with security analysis tools
Erik Moravec -
User interface for data and metadata management in the EnviLab platform
Dominik Dubovský