Adam Považanec

Bachelor's thesis

Srovnání metod strojového učení pro rozpoznání citlivých dat

Comparison of machine learning methods for sensitive data identification
Abstract:
Cieľom práce je vyhodnotiť vybrané klasifikačné metódy strojového učenia zamerané na identifikáciu citlivých textových dokumentov. Na začiatku práce je vybratých, opísaných a implementovaných päť klasifikačných algoritmov s možnosťou odmietnutia. Algoritmy sú potom vyhodnotené na troch sadách dokumentov, ktoré boli vytvorené ako súčasť práce. Dôraz je kladený na klasifikačnú schopnosť, rýchlosť a pamäťovú …more
Abstract:
The main aim of this thesis is to evaluate selected machine learning classification methods for identifying confidential text documents. Five text classification algorithms with rejection capability are selected, described and implemented. The algorithms are then evaluated on three document data sets, created as a part of the thesis. The main emphasis is put on the classification performance, speed …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 20. 7. 2020

Thesis defence

  • Date of defence: 23. 9. 2020
  • Supervisor: doc. Mgr. Pavel Rychlý, Ph.D.
  • Reader: RNDr. Vít Suchomel, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky