Bc. Adam Viktora

Bachelor's thesis

Modul stahovače internetu pro získání dynamicky generovaného obsahu webových stránek

A web crawler module for obtaining dynamically generated content of web pages
Anotácia:
Tato bakalářská práce se zabývá problémem získávání užitečného textového obsahu z webových stránek, které generují obsah na straně klienta pomocí jazyka JavaScript. Práce je uskutečněna ve spolupráci s firmou Lexical Computing, která pro účely získávání textů z internetu využívá svůj vlastní crawler Spiderling. Ten však neumí vyhodnocovat skripty jazyka JavaScript. Praktická část spočívala v implementaci …viac
Abstract:
This thesis is about extracting useful text from websites, which generate their content dynamically on a client with JavaScript. This project was done in cooperation with company Lexical Computing, which uses their own web crawler Spiderling for text extraction. However, this crawler cannot interpret JavaScript. Goal of the implementation part was creating a new module for Spiderling crawler, which …viac
 
 
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 15. 12. 2022

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 2. 2023
  • Vedúci: RNDr. Vít Suchomel, Ph.D.
  • Oponent: RNDr. Vojtěch Kovář, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / odbor:
Programming and development / Programming and development