Bc. Adam Viktora

Bakalářská práce

Modul stahovače internetu pro získání dynamicky generovaného obsahu webových stránek

A web crawler module for obtaining dynamically generated content of web pages
Anotace:
Tato bakalářská práce se zabývá problémem získávání užitečného textového obsahu z webových stránek, které generují obsah na straně klienta pomocí jazyka JavaScript. Práce je uskutečněna ve spolupráci s firmou Lexical Computing, která pro účely získávání textů z internetu využívá svůj vlastní crawler Spiderling. Ten však neumí vyhodnocovat skripty jazyka JavaScript. Praktická část spočívala v implementaci …více
Abstract:
This thesis is about extracting useful text from websites, which generate their content dynamically on a client with JavaScript. This project was done in cooperation with company Lexical Computing, which uses their own web crawler Spiderling for text extraction. However, this crawler cannot interpret JavaScript. Goal of the implementation part was creating a new module for Spiderling crawler, which …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 15. 12. 2022

Obhajoba závěrečné práce

  • Obhajoba proběhla 1. 2. 2023
  • Vedoucí: RNDr. Vít Suchomel, Ph.D.
  • Oponent: RNDr. Vojtěch Kovář, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Bakalářský studijní program / obor:
Programování a vývoj aplikací / Programování a vývoj aplikací