Distributed Systems for Discovering Similar Documents – RNDr. Jan Kasprzak, Ph.D.
RNDr. Jan Kasprzak, Ph.D.
Doctoral thesis
Distributed Systems for Discovering Similar Documents
Distributed Systems for Discovering Similar Documents
Abstract:
S dostupností velkého množství textových dokumentů na Internetu nabývá úloha objevování podobných dokumentů v rámci dané sady dokumentů na důležitosti. Mezi aplikace této úlohy patří algoritmické objevování plagiátorství, odstraňování duplicit z dané množiny dokumentů například pro účely fulltextových vyhledávacích strojů nebo pro účely detekce dokumentů pocházejících ze společného zdroje pro verzovací …moreAbstract:
With the availability of large amount of text documents on the Internet, the task of discovering similar documents inside a given document base becomes more important. The applications include discovering plagiarism by means of machine processing, removing duplicate documents from a given document base for purposes of e.g. full-text search engines or detecting co-derivative or related documents for …more
Language used: English
Date on which the thesis was submitted / produced: 29. 4. 2015
Identifier:
https://is.muni.cz/th/y3h4d/
Thesis defence
- Date of defence: 31. 8. 2015
- Supervisor: doc. Ing. Michal Brandejs, CSc.
- Reader: doc. Ing. Jaroslav Zendulka, CSc., Assoc. Prof. Efstathios Stamatatos
Citation record
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsDoctoral programme / field:
Informatics (4-years) / Computer Systems and Technologies
Theses on a related topic
- No theses on a related topic available.