Hodnocení klasifikačních metod na nevyvážených datových souborech – Jan Šimůnek
Jan Šimůnek
Master's thesis
Hodnocení klasifikačních metod na nevyvážených datových souborech
Evaluation of classification methods on imbalanced datasets
Abstract:
Tato diplomová práce se zaměřuje na analýzu výkonnosti různých klasifikačních metod při práci s nevyváženými datovými soubory. Zkoumá vliv technik vyvážení dat, jako jsou SMOTE, undersampling a oversampling, na výkonnost klasifikačních modelů. Hlavním cílem je zjistit, zda tyto techniky skutečně zlepšují predikční schopnosti klasifikačních modelů. Studie se soustředí na tři konkrétní klasifikační metody …moreAbstract:
This thesis focuses on analyzing the performance of different classification methods when dealing with imbalanced datasets. It investigates the effect of data balancing techniques such as SMOTE, undersampling and oversampling on the performance of classification models. The main goal is to determine whether these techniques actually improve the prediction capabilities of classification models. The …more
Language used: Czech
Date on which the thesis was submitted / produced: 27. 6. 2024
Identifier:
https://vskp.vse.cz/eid/94381
Thesis defence
- Date of defence: 2024
- Supervisor: Petra Tomanová
- Reader: Vojtěch Vávra
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- autentizovaným zaměstnancům ze stejné školy/fakulty
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Vysoká škola ekonomická v Prazehttps://vskp.vse.cz/eid/94381
Vysoká škola ekonomická v Praze
Master programme:
Ekonometrie a operační výzkum
Theses on a related topic
-
Logistic regression improvements for credit scoring development
Nikolai Pravdin -
AutoML and Data Preprocessing
Josef Karas -
Data cleaning using machine learning
Ahmed Hassan -
Random Forest. Anomaly detection story
Petr Matonoha -
Software using random forest for risk prediction of heart valve surgery patients
Georg HERMANUTZ -
On Deep Forest Algorithms
Katarína Nocarová -
Map of main forest tree species derived from satellite data
Anton Malyshev -
Využití "random forestů" pro rozpoznávání objektů v obrazech
Petr Ehler