Bc. Michal Kozderka

Master's thesis

Web scraping

Web-scraping tool
Abstract:
Diplomová práce se zabývá získáváním dat z internetu. V rámci práce bylo porovnáno několik nástrojů pro získávání dat z internetu. Po analýze těchto nástrojů byl navržen nový nástroj, který odstraňuje některé nedostatky nástrojů analyzovaných. Nástroj vychází z několika případů užití. Následně byly vybrány technologie pro jeho implementaci. Nakonec byl nástroj naimplementován a otestován na vybraných …more
Abstract:
The topic of the Diploma Thesis is internet data mining. Several web scraping tools were compared and analysed. Based on the results of this process a new tool was designed. It eliminates some of their flaws and can be used in several defined areas. Technologies for its implementation were selected and the tool was afterwards implemented and tested in the defined areas.
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 27. 4. 2016

Thesis defence

  • Date of defence: 30. 5. 2016
  • Supervisor: Ing. Pavel Kříž, Ph.D.
  • Reader: Ing. Zdeněk Mlčoch

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Univerzita Hradec Králové
 
Name
Posted by
Uploaded/Created
Rights
Theses ch403p ch403p/8
2/6/2016
  • Co je jinak přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Co je jinak další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Co je jinak pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Co je nové vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Co je nové rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.
  • Co se chystá

    Připravujeme další vylepšení pro mobilní zařízení.