Large Language Models as a tool for generating high-level features for text documents – Vojtěch Balek
Vojtěch Balek
Bachelor's thesis
Large Language Models as a tool for generating high-level features for text documents
Velké jazykové modely jako nástroj pro extrakci rysů z textu
Abstract:
Tato bakalářská práce zkoumá použitelnost velkých jazykových modelů (LLM) pro generování příznaků z textu a hodnotí, zda LLM mohou produkovat interpretovatelné a použitelné příznaky pro úlohy strojového učení. Studie používá dvě označené datové sady: CORD-19 korpus, který se skládá z článků o výzkumu koronavirů s binárními štítky určující vysoký nebo nízký počet citací, a datovou sadu vědeckých článků …moreAbstract:
This bachelor thesis investigates the usability of large language models (LLMs) for feature generation from text, evaluating whether LLMs can produce interpretable and usable features for machine-learning tasks. The study uses two labeled datasets: the CORD-19 corpus, consisting of coronavirus research articles with binary labels for high and low citation count, and a dataset of scientific articles …more
Language used: English
Date on which the thesis was submitted / produced: 27. 6. 2024
Identifier:
https://vskp.vse.cz/eid/94318
Thesis defence
- Date of defence: 22. 8. 2024
- Supervisor: Tomáš Kliegr
- Reader: Vojtěch Svátek
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttps://vskp.vse.cz/eid/94318
Vysoká škola ekonomická v Praze
Bachelor programme:
Data Analytics
Theses on a related topic
-
Embedding dat pro velké jazykové modely
Šimon Nehéz -
Srovnání chatbotů využívající velké jazykové modely
Michal Bojko -
Velké jazykové modely pro generování kódu se zaměřením na vestavěné systémy
Matej Vadovič -
Velké předtrénované jazykové modely v rozpoznávání řeči
Martin Tomašovič -
Webová rozhraní pro práci s velkými jazykovými modely
Martin Timoščuk -
Feature Extraction and Selection for Emotions Detection from EEG Signals Using Python
Simona Češková -
Prosodic feature extraction and singing voice synthesis with an End-to-end Neural network model sequence
Ondřej Kočí -
Visipedia - Embedding-driven Visual Feature Extraction and Learning
Jan Jakeš