Modul stahovače internetu pro získání dynamicky generovaného obsahu webových stránek – Bc. Adam Viktora
Bc. Adam Viktora
Bachelor's thesis
Modul stahovače internetu pro získání dynamicky generovaného obsahu webových stránek
A web crawler module for obtaining dynamically generated content of web pages
Anotácia:
Tato bakalářská práce se zabývá problémem získávání užitečného textového obsahu z webových stránek, které generují obsah na straně klienta pomocí jazyka JavaScript. Práce je uskutečněna ve spolupráci s firmou Lexical Computing, která pro účely získávání textů z internetu využívá svůj vlastní crawler Spiderling. Ten však neumí vyhodnocovat skripty jazyka JavaScript. Praktická část spočívala v implementaci …viacAbstract:
This thesis is about extracting useful text from websites, which generate their content dynamically on a client with JavaScript. This project was done in cooperation with company Lexical Computing, which uses their own web crawler Spiderling for text extraction. However, this crawler cannot interpret JavaScript. Goal of the implementation part was creating a new module for Spiderling crawler, which …viac
Jazyk práce: Czech
Datum vytvoření / odevzdání či podání práce: 15. 12. 2022
Identifikátor:
https://is.muni.cz/th/tsk6n/
Obhajoba závěrečné práce
- Obhajoba proběhla 1. 2. 2023
- Vedúci: RNDr. Vít Suchomel, Ph.D.
- Oponent: RNDr. Vojtěch Kovář, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / odbor:
Programming and development / Programming and development
Práce na příbuzné téma
-
Vývoj webového OPC klienta
Jiří FAIST -
Web scraping
Michal Kozderka -
Analýza písomnej komunikácie v elektronickom obchode pomocou NLP
Veronika Letková -
Better Web Corpora For Corpus Linguistics And NLP
Vít Suchomel -
System for advanced search in metadata from NLP tools
Norbert Bodnár -
Automating configuration of computers in NLP laboratory
František Buš -
Porovnání NLP služeb dostupných na trhu a jejich využití pomocí API
Jan Doležálek -
Porovnání NLP funkcionality self service BI nástrojů
Pavel Chalupa