Přizpůsobení velkých jazykových modelů pro specifickou doménu – Ing. Martin Mlýnek
Ing. Martin Mlýnek
Master's thesis
Přizpůsobení velkých jazykových modelů pro specifickou doménu
Customization of LLM for specific usages
Abstract:
Diplomová práce se zabývá studiem velkých jazykových modelů a cílem bylo vytvořit aplikaci NewsInsight, která zodpovídá na otázku ohledně aktuálních zpráv. Zvolený problém byl vyřešen pomocí metodiky Retrieval Augmented Generation a vytvoření prompt šablony. Při implementaci byla použita JavaScriptová knihovna React a pro komunikaci s velkým jazykovým modelem GPT-4 se využívá aplikačního rámce LangChain …moreAbstract:
The thesis focuses on the study of large language models and the goal was to create an application called NewsInsight, which answers questions about current news. The chosen problem was solved using the Retrieval Augmented Generation methodology and the creation of a prompt template. The implementation used the JavaScript library React, and for communication with the large language model GPT-4, the …more
Language used: Czech
Date on which the thesis was submitted / produced: 21. 5. 2024
Identifier:
https://is.muni.cz/th/pkwvl/
Thesis defence
- Date of defence: 17. 6. 2024
- Supervisor: Mgr. Marek Grác, Ph.D.
- Reader: RNDr. Adam Rambousek, Ph.D.
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / field:
Software Engineering / Design and development of software systems
Theses on a related topic
-
Přizpůsobený transformer model pro efektivní získávání informací z učebnic
John Akowuah Tawiah -
Feasibility Study of a Large Language Model (LLM)
Samuel Seidel -
Přizpůsobený transformer model pro efektivní získávání informací z učebnic
John Akowuah Tawiah -
Using LLM to generate bachelor thesis
Jan Hassman -
Generování bakalářské práce v češtině pomocí LLM
Ondřej Andrla -
Exploring LLM's for inferring relations between cybersecurity constructs
Alexander Jandl -
Aplikácia pre prácu s privátnymi štruktúrovanými dátami za použitia LLM nástrojov
Peter Lichvár -
Large Language Models (LLMs): Examining the quality of generated text with task specific data
Michal Caninec