Šimon Nehéz

Bachelor's thesis

Embedding dat pro velké jazykové modely

Embedding Data for Large Language Models
Abstract:
Bakalárska práca sa zaoberá prevodom rôznych súborových formátov do vektorovej podoby pričom hodnotí kvalitu týchto vektorov. Teoretická časť práce opisuje rôzne metódy prevodu textu do vektorovej podoby, zatiaľ čo praktická časť obsahuje zostavenie testovacieho datasetu, vytvorenie prototypu webovej aplikácie na generovanie embeddingov v jazyku Python a vyhodnotenie experimentu. Experiment ukázal …more
Abstract:
The bachelor thesis deals with the conversion of various file formats into vectors while evaluating the quality of these vectors. The theoretical part of the thesis describes multiple methods of converting text to vector representation, while the practical part includes the construction of a test dataset, the creation of a prototype web application for generating embeddings in Python and the evaluation …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 10. 5. 2024

Thesis defence

  • Supervisor: Ing. Jozef Kováč

Citation record

The right form of listing the thesis as a source quoted

Nehéz, Šimon. Embedding dat pro velké jazykové modely. Zlín, 2024. bakalářská práce (Bc.). Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Univerzita Tomáše Bati ve Zlíně, Fakulta aplikované informatiky
Plny text prace je k dispozici v elektronicke podobe

Tomas Bata University in Zlín

Faculty of Applied Informatics

Bachelor programme / field:
Software Engineering / Software Engineering