Bc. Jiří Materna, Ph.D.

Diplomová práce

Automatické určení domény a klíčových slov stránky

Web page classification and keyword extraction
Anotace:
Cílem této práce je navrhnout a otestovat přístup, který umožní automatickou klasifikaci webových stránek do domén a určení klíčových slov stránky. Klasifikace stránek je založena na použití strojového učení. Hlavním problémem je však malý rozsah webových stránek, který užití metod strojového učení znesnadňuje. V práci jsou navrženy dva přístupy, které se snaží tento nedostatek minimalizovat. Prvním …více
Abstract:
The aim of this master thesis is to design and evaluate a method of automatic web page classification and keyword extraction. The classification is based on the machine learning. However, there are some problems with short web pages in the classification. In this thesis we proposed two approaches to eliminate the lack of information. In the first approach we consider a wider context of the web page …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 23. 5. 2008

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 7. 2008
  • Vedoucí: doc. RNDr. Lubomír Popelínský, Ph.D.
  • Oponent: doc. RNDr. Petr Sojka, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Magisterský studijní program / obor:
Informatika / Informatika