Bc. Tomáš Petránek

Diplomová práce

Extrakce bibliografických informací z textu

Extraction of bibliographic information from plaintext
Anotace:
Moje práce pojednává o existujících technikách extrakce informací z textu. Zvláštní důraz je kladen na hledání dat pomocí vzorů a tvorbu těchto vzorů s využitím regulárních výrazů. Podstatná část se zabývá navrženým systémem pro extrakci bibliografických informací z článků publikovaných v textové podobě. Při implementaci tohoto systému je použit přístup k textu odlišný od přístupů popsaných v úvodu …více
Abstract:
In this work I dealt with some of the existing techniques in the field of information extraction from a text. Special emphasis was placed on the description of a technique that is known as a pattern matching and uses regular expressions. The main chapter of the work deals with the system designed for the extraction of bibliographic information from a plaintext. During the implementation of this system …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 19. 5. 2006

Obhajoba závěrečné práce

  • Obhajoba proběhla 29. 6. 2006
  • Vedoucí: RNDr. Jan Pomikálek, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky