Bc. Roman Havlík

Bakalářská práce

Automatizace validace celních dat pomocí NLP a strojového učení

Automation of Customs Data Validation Using NLP and Machine Learning
Anotace:
Tato bakalářská práce se zaměřuje na automatizaci celní klasifikace zboží pomocí metod strojového učení a zpracování přirozeného jazyka (NLP). Cílem je vytvořit prototyp, který automaticky přiřadí šestimístné HS kódy na základě textových popisů produktů. Práce porovnává tři přístupy: TF–IDF s lineární SVM, embeddingy Word2Vec s klasifikátorem Random Forest a transformerový model SBERT s logistickou …více
Abstract:
This bachelor thesis focuses on automating customs goods classification using machine learning and natural language processing (NLP) methods. The goal is to develop a prototype capable of assigning six-digit HS codes based on textual product descriptions. Three methodologies are compared: TF–IDF combined with linear SVM, Word2Vec embeddings with a Random Forest classifier, and the transformer-based …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 8. 12. 2025

Obhajoba závěrečné práce

  • Obhajoba proběhla 20. 1. 2026
  • Vedoucí: Mgr. Bc. Martin Chvátal, Ph.D.
  • Oponent: Ing. Lukáš Kokrda

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Ekonomicko-správní fakulta

Masarykova univerzita

Ekonomicko-správní fakulta

Bakalářský studijní program / obor:
Analytika byznysových dat / Analytika byznysových dat