Dolování informací z textů na základě nízkorozměrných reprezentací – Bc. Riva Nathans, BA
Bc. Riva Nathans, BA
Bachelor's thesis
Dolování informací z textů na základě nízkorozměrných reprezentací
Data mining from texts based on low-dimensional representations
Abstract:
Tato práce srovnává efektivnost různých metod (mutual information, χ-squared, tf-idf) pro výběr klíčových slov z textů pro automatické rozpoznávání témat. Klasifikace proběhla na nizkorozměrných reprezentacích textů z Fisher Speech Corpus použití multinomial Naive Bayes a support vector machines. Nejefektivnější kombinace metod byla mutual information pro výběr rysů s SVM pro klasifikaci: umožnila …moreAbstract:
This thesis compares the effectiveness of several methods (mutual information, χ-squared, tf-idf) for extracting keyword features from text documents for efficient, automatic topic detection. Classification was performed on reduced-dimensional representations of transcripts from the Fisher Speech Corpus using multinomial Naive Bayes classi- fication and support vector machines. The most effective combination …more
Language used: English
Date on which the thesis was submitted / produced: 23. 5. 2016
Identifier:
https://is.muni.cz/th/wrkiu/
Thesis defence
- Date of defence: 15. 2. 2017
- Supervisor: prof. Ing. Pavel Zezula, CSc.
- Reader: RNDr. Petr Eliáš
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Applied Informatics / Applied Informatics
Theses on a related topic
-
Support vector machines a evoluční algoritmy
Martin Ševčík -
Návrh klasifikátoru parametrů udržitelného rozvoje pomocí Support Vector Machine
Petra Špírková -
Localization of mobile devices using machine learning
Aleš Calábek -
Math Information Retrieval for Digital Libraries
Michal Růžička -
Analysis and classification of long terminal repeat (LTR) sequences using machine learning approaches
Jakub Horváth -
Classification of Passersby Using Single-point LiDAR Sensor and Machine Learning
Dominik Klement -
Microwave stroke detection and classification using machine learning algorithms and realistic models of the human head
Tomáš Pokorný -
Brain Imaging in Schizophrenia: Advanced Machine Learning Strategies
Roman Vyškovský