Bc. Tomáš Petránek

Master's thesis

Extrakce bibliografických informací z textu

Extraction of bibliographic information from plaintext
Abstract:
Moje práce pojednává o existujících technikách extrakce informací z textu. Zvláštní důraz je kladen na hledání dat pomocí vzorů a tvorbu těchto vzorů s využitím regulárních výrazů. Podstatná část se zabývá navrženým systémem pro extrakci bibliografických informací z článků publikovaných v textové podobě. Při implementaci tohoto systému je použit přístup k textu odlišný od přístupů popsaných v úvodu …more
Abstract:
In this work I dealt with some of the existing techniques in the field of information extraction from a text. Special emphasis was placed on the description of a technique that is known as a pattern matching and uses regular expressions. The main chapter of the work deals with the system designed for the extraction of bibliographic information from a plaintext. During the implementation of this system …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 19. 5. 2006

Thesis defence

  • Date of defence: 29. 6. 2006
  • Supervisor: RNDr. Jan Pomikálek, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky