Martin Labský

Doctoral thesis

Information Extraction from Websites using Extraction Ontologies

Extrakce informací z webových stránek pomoci extrakčních ontologií
Abstract:
S rozvojem Internetu a růstem množství textových dokumentů vzrostla během posledního desetiletí poptávka po nástrojích pro automatickou extrakci informací (IE - information extraction). Úkolem IE je nalézt v analyzovaných dokumentech údaje předem specifikovaného sémantického typu a tyto extrahovat pro potřeby dalších aplikací. Analyzovanými dokumenty mohou přitom být webové stránky, e-maily, dokumenty …more
Abstract:
Automatic information extraction (IE) from various types of text became very popular during the last decade. Owing to information overload, there are many practical applications that can utilize semantically labelled data extracted from textual sources like the Internet, emails, intranet documents and even conventional sources like newspaper and magazines. Applications of IE exist in many areas of …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 30. 9. 2002

Thesis defence

  • Date of defence: 11. 6. 2009
  • Supervisor: Petr Berka
  • Reader: Petr Strossa, Peter Vojtáš, Václav Snášel

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Praze
http://www.vse.cz/vskp/eid/27154

Vysoká škola ekonomická v Praze

Doctoral programme / field:
Aplikovaná informatika / Informatika