Information Extraction from Websites using Extraction Ontologies – Martin Labský
Martin Labský
Doctoral thesis
Information Extraction from Websites using Extraction Ontologies
Extrakce informací z webových stránek pomoci extrakčních ontologií
Abstract:
S rozvojem Internetu a růstem množství textových dokumentů vzrostla během posledního desetiletí poptávka po nástrojích pro automatickou extrakci informací (IE - information extraction). Úkolem IE je nalézt v analyzovaných dokumentech údaje předem specifikovaného sémantického typu a tyto extrahovat pro potřeby dalších aplikací. Analyzovanými dokumenty mohou přitom být webové stránky, e-maily, dokumenty …moreAbstract:
Automatic information extraction (IE) from various types of text became very popular during the last decade. Owing to information overload, there are many practical applications that can utilize semantically labelled data extracted from textual sources like the Internet, emails, intranet documents and even conventional sources like newspaper and magazines. Applications of IE exist in many areas of …more
Language used: English
Date on which the thesis was submitted / produced: 30. 9. 2002
Identifier:
http://www.vse.cz/vskp/eid/27154
Thesis defence
- Date of defence: 11. 6. 2009
- Supervisor: Petr Berka
- Reader: Petr Strossa, Peter Vojtáš, Václav Snášel
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttp://www.vse.cz/vskp/eid/27154
Vysoká škola ekonomická v Praze
Doctoral programme / field:
Aplikovaná informatika / Informatika