Bc. Jan Knotek

Master's thesis

Information extraction from advertisements

Information extraction from advertisements
Abstract:
Úkolem práce bylo navrhnout, implementovat a ověřit metody automatické extrakce vhodných atributů pro doménu portugalských inzerátů týkajících se nabídky a poptávky bytů a domů. Další část práce je věnována hledání vhodných párů nabídkových a poptávkových inzerátů na základě extrahovaných atributů. V části poslední se věnuji možnostem použití stejných algoritmů pro české inzeráty.
Abstract:
The goal of this thesis is to design, implement and verify a system for information extraction from advertisements. For the domain of Portuguese apartment's advertisements, we aimed to choose appropriate attributes for the houses or apartments and extract these attributes by choosing suitable techniques. We designed algorithm which is using the apartment attributes for choosing suitable pairs of offer …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 30. 5. 2011

Thesis defence

  • Date of defence: 27. 6. 2011
  • Supervisor: doc. RNDr. Lubomír Popelínský, Ph.D.
  • Reader: P. Brázdil

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Master programme / field:
Applied Informatics / Applied Informatics

Theses on a related topic