Improving Arithmetical Reasoning of Language Models – Bc. Marek Kadlčík
Bc. Marek Kadlčík
Diplomová práce
Improving Arithmetical Reasoning of Language Models
Improving Arithmetical Reasoning of Language Models
Anotace:
Práce se zabývá zlepšováním jazykových modelů pro řešení matematických slovních úloh. Nejdříve pročištíme a převedeme existující datové sady, abychom vytvořili Calc-X, standardizovanou sbírku 300 000 matematických příkladu a řešení s postupem. Demonstrujeme, že Calc-X je vhodný pro tréning jazykových modelů, které interagují s kalkulačkou pro počítání mezivýsledků při řešení matematických úloh. Ukazujeme …víceAbstract:
This work focuses on improving language models for solving math word problems. First, we clean and transform existing datasets to create Calc-X, a standardized collection of 300,000 math problems with step-by-step solutions. We demonstrate that Calc-X is suitable for training language models interacting with a calculator to compute intermediate results when solving math problems. We show that such …více
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 21. 5. 2024
Identifikátor:
https://is.muni.cz/th/vd9wm/
Obhajoba závěrečné práce
- Obhajoba proběhla 21. 6. 2024
- Vedoucí: Mgr. Michal Štefánik
- Oponent: Ing. Martin Fajčík
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Umělá inteligence a zpracování dat / Strojové učení a umělá inteligence
Práce na příbuzné téma
-
Byte Level Language Models
Vít Baisa -
Development of rephrase system using Nature Language Processing models
Ivan Tsvietkov -
Labeled Dataset of Speed Climbing Performances
Veronika Škvarlová -
Analysis of an NHL-game Dataset
Martin Čermák -
Synthetic dataset rendering of 3D scans for robust 6D bin pose estimation
Peter Kravár -
Measuring Properties of Metric Dataset Representations
Martin Pajerský -
Geological setting of the south-eastern slopes of Bohemian Massif based on interpretation of petroleum exploration subsurface dataset
Vladimír Opletal -
Detection of Diabetic Retinopathy using Deep Learning and Transfer Learning Techniques with Oversampling to Address Imbalanced Dataset
Teodora RANĐELOVIĆ