Šimon Nehéz

Bakalářská práce

Embedding dat pro velké jazykové modely

Embedding Data for Large Language Models
Anotace:
Bakalárska práca sa zaoberá prevodom rôznych súborových formátov do vektorovej podoby pričom hodnotí kvalitu týchto vektorov. Teoretická časť práce opisuje rôzne metódy prevodu textu do vektorovej podoby, zatiaľ čo praktická časť obsahuje zostavenie testovacieho datasetu, vytvorenie prototypu webovej aplikácie na generovanie embeddingov v jazyku Python a vyhodnotenie experimentu. Experiment ukázal …více
Abstract:
The bachelor thesis deals with the conversion of various file formats into vectors while evaluating the quality of these vectors. The theoretical part of the thesis describes multiple methods of converting text to vector representation, while the practical part includes the construction of a test dataset, the creation of a prototype web application for generating embeddings in Python and the evaluation …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 10. 5. 2024

Obhajoba závěrečné práce

  • Vedoucí: Ing. Jozef Kováč

Citační záznam

Jak správně citovat práci

Nehéz, Šimon. Embedding dat pro velké jazykové modely. Zlín, 2024. bakalářská práce (Bc.). Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Univerzita Tomáše Bati ve Zlíně, Fakulta aplikované informatiky
Plny text prace je k dispozici v elektronicke podobe

Univerzita Tomáše Bati ve Zlíně

Fakulta aplikované informatiky

Bakalářský studijní program / obor:
Softwarové inženýrství / Softwarové inženýrství