Bc. Jiří Materna, Ph.D.

Master's thesis

Automatické určení domény a klíčových slov stránky

Web page classification and keyword extraction
Abstract:
Cílem této práce je navrhnout a otestovat přístup, který umožní automatickou klasifikaci webových stránek do domén a určení klíčových slov stránky. Klasifikace stránek je založena na použití strojového učení. Hlavním problémem je však malý rozsah webových stránek, který užití metod strojového učení znesnadňuje. V práci jsou navrženy dva přístupy, které se snaží tento nedostatek minimalizovat. Prvním …more
Abstract:
The aim of this master thesis is to design and evaluate a method of automatic web page classification and keyword extraction. The classification is based on the machine learning. However, there are some problems with short web pages in the classification. In this thesis we proposed two approaches to eliminate the lack of information. In the first approach we consider a wider context of the web page …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 23. 5. 2008

Thesis defence

  • Date of defence: 1. 7. 2008
  • Supervisor: doc. RNDr. Lubomír Popelínský, Ph.D.
  • Reader: doc. RNDr. Petr Sojka, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / field:
Informatics / Informatics