Large Language Models as a tool for generating high-level features for text documents – Vojtěch Balek
Vojtěch Balek
Bakalářská práce
Large Language Models as a tool for generating high-level features for text documents
Velké jazykové modely jako nástroj pro extrakci rysů z textu
Anotace:
Tato bakalářská práce zkoumá použitelnost velkých jazykových modelů (LLM) pro generování příznaků z textu a hodnotí, zda LLM mohou produkovat interpretovatelné a použitelné příznaky pro úlohy strojového učení. Studie používá dvě označené datové sady: CORD-19 korpus, který se skládá z článků o výzkumu koronavirů s binárními štítky určující vysoký nebo nízký počet citací, a datovou sadu vědeckých článků …víceAbstract:
This bachelor thesis investigates the usability of large language models (LLMs) for feature generation from text, evaluating whether LLMs can produce interpretable and usable features for machine-learning tasks. The study uses two labeled datasets: the CORD-19 corpus, consisting of coronavirus research articles with binary labels for high and low citation count, and a dataset of scientific articles …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 27. 6. 2024
Identifikátor:
https://vskp.vse.cz/eid/94318
Obhajoba závěrečné práce
- Obhajoba proběhla 22. 8. 2024
- Vedoucí: Tomáš Kliegr
- Oponent: Vojtěch Svátek
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Vysoká škola ekonomická v Prazehttps://vskp.vse.cz/eid/94318
Vysoká škola ekonomická v Praze
Bakalářský studijní program:
Data Analytics
Práce na příbuzné téma
-
Embedding dat pro velké jazykové modely
Šimon Nehéz -
Srovnání chatbotů využívající velké jazykové modely
Michal Bojko -
Velké jazykové modely pro generování kódu se zaměřením na vestavěné systémy
Matej Vadovič -
Velké předtrénované jazykové modely v rozpoznávání řeči
Martin Tomašovič -
Webová rozhraní pro práci s velkými jazykovými modely
Martin Timoščuk -
Feature Extraction and Selection for Emotions Detection from EEG Signals Using Python
Simona Češková -
Prosodic feature extraction and singing voice synthesis with an End-to-end Neural network model sequence
Ondřej Kočí -
Visipedia - Embedding-driven Visual Feature Extraction and Learning
Jan Jakeš