Bc. Alina Tsykynovska

Diplomová práce

Machine Learning for Text Anomaly Detection

Machine Learning for Text Anomaly Detection
Anotace:
Tato práce se zaměřuje na výkon algoritmů strojového učení pro detekci anomálií ve dvou různých typech datových sad: numerické (síťové logy) a textové (e-maily). Pro e-mailovou datovou sadu jsou použité tři textové reprezentace: count vectorizer, TF-IDF a word embeddings. Srovnání zahrnuje výsledky napříč těmito reprezentacemi a výsledky napříč datovými sadami.
Abstract:
This thesis focuses on the performance of machine learning algorithms for detecting anomalies across two different types of datasets: numerical (network logs) and textual (emails). Three text representations are assessed for the email dataset: count vectorizer, TF-IDF and word embeddings. The comparison includes the results across these representations and results across datasets.
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 21. 5. 2024

Obhajoba závěrečné práce

  • Obhajoba proběhla 20. 6. 2024
  • Vedoucí: doc. Ing. RNDr. Barbora Bühnová, Ph.D.
  • Oponent: doc. Ing. Radim Burget, Ph.D.

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky