Embedding dat pro velké jazykové modely – Šimon Nehéz
Šimon Nehéz
Bakalářská práce
Embedding dat pro velké jazykové modely
Embedding Data for Large Language Models
Anotace:
Bakalárska práca sa zaoberá prevodom rôznych súborových formátov do vektorovej podoby pričom hodnotí kvalitu týchto vektorov. Teoretická časť práce opisuje rôzne metódy prevodu textu do vektorovej podoby, zatiaľ čo praktická časť obsahuje zostavenie testovacieho datasetu, vytvorenie prototypu webovej aplikácie na generovanie embeddingov v jazyku Python a vyhodnotenie experimentu. Experiment ukázal …víceAbstract:
The bachelor thesis deals with the conversion of various file formats into vectors while evaluating the quality of these vectors. The theoretical part of the thesis describes multiple methods of converting text to vector representation, while the practical part includes the construction of a test dataset, the creation of a prototype web application for generating embeddings in Python and the evaluation …více
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 10. 5. 2024
Obhajoba závěrečné práce
Citační záznam
Jak správně citovat práci
Nehéz, Šimon. Embedding dat pro velké jazykové modely. Zlín, 2024. bakalářská práce (Bc.). Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Tomáše Bati ve Zlíně, Fakulta aplikované informatikyPlny text prace je k dispozici v elektronicke podobe
Univerzita Tomáše Bati ve Zlíně
Fakulta aplikované informatikyBakalářský studijní program / obor:
Softwarové inženýrství / Softwarové inženýrství
Práce na příbuzné téma
-
Velké jazykové modely pro generování kódu se zaměřením na vestavěné systémy
Matej Vadovič -
Srovnání chatbotů využívající velké jazykové modely
Michal Bojko -
Velké předtrénované jazykové modely v rozpoznávání řeči
Martin Tomašovič -
Webová rozhraní pro práci s velkými jazykovými modely
Martin Timoščuk