Improving Arithmetical Reasoning of Language Models – Bc. Marek Kadlčík
Bc. Marek Kadlčík
Master's thesis
Improving Arithmetical Reasoning of Language Models
Improving Arithmetical Reasoning of Language Models
Anotácia:
Práce se zabývá zlepšováním jazykových modelů pro řešení matematických slovních úloh. Nejdříve pročištíme a převedeme existující datové sady, abychom vytvořili Calc-X, standardizovanou sbírku 300 000 matematických příkladu a řešení s postupem. Demonstrujeme, že Calc-X je vhodný pro tréning jazykových modelů, které interagují s kalkulačkou pro počítání mezivýsledků při řešení matematických úloh. Ukazujeme …viacAbstract:
This work focuses on improving language models for solving math word problems. First, we clean and transform existing datasets to create Calc-X, a standardized collection of 300,000 math problems with step-by-step solutions. We demonstrate that Calc-X is suitable for training language models interacting with a calculator to compute intermediate results when solving math problems. We show that such …viac
Jazyk práce: English
Datum vytvoření / odevzdání či podání práce: 21. 5. 2024
Identifikátor:
https://is.muni.cz/th/vd9wm/
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 6. 2024
- Vedúci: Mgr. Michal Štefánik
- Oponent: Ing. Martin Fajčík
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsMaster programme / odbor:
Artificial intelligence and data processing / Machine learning and artificial intelligence
Práce na příbuzné téma
-
Byte Level Language Models
Vít Baisa -
Development of rephrase system using Nature Language Processing models
Ivan Tsvietkov -
Labeled Dataset of Speed Climbing Performances
Veronika Škvarlová -
Geological setting of the south-eastern slopes of Bohemian Massif based on interpretation of petroleum exploration subsurface dataset
Vladimír Opletal -
Analysis of an NHL-game Dataset
Martin Čermák -
Measuring Properties of Metric Dataset Representations
Martin Pajerský -
Synthetic dataset rendering of 3D scans for robust 6D bin pose estimation
Peter Kravár -
Methodology Design for Dataset Quality Assessment
Marek LOVČÍ