Vojtěch Balek

Bakalářská práce

Large Language Models as a tool for generating high-level features for text documents

Velké jazykové modely jako nástroj pro extrakci rysů z textu
Anotace:
Tato bakalářská práce zkoumá použitelnost velkých jazykových modelů (LLM) pro generování příznaků z textu a hodnotí, zda LLM mohou produkovat interpretovatelné a použitelné příznaky pro úlohy strojového učení. Studie používá dvě označené datové sady: CORD-19 korpus, který se skládá z článků o výzkumu koronavirů s binárními štítky určující vysoký nebo nízký počet citací, a datovou sadu vědeckých článků …více
Abstract:
This bachelor thesis investigates the usability of large language models (LLMs) for feature generation from text, evaluating whether LLMs can produce interpretable and usable features for machine-learning tasks. The study uses two labeled datasets: the CORD-19 corpus, consisting of coronavirus research articles with binary labels for high and low citation count, and a dataset of scientific articles …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 27. 6. 2024

Obhajoba závěrečné práce

  • Obhajoba proběhla 22. 8. 2024
  • Vedoucí: Tomáš Kliegr
  • Oponent: Vojtěch Svátek

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Praze
https://vskp.vse.cz/eid/94318