RNDr. Jan Kasprzak, Ph.D.

Doctoral thesis

Distributed Systems for Discovering Similar Documents

Distributed Systems for Discovering Similar Documents
Abstract:
S dostupností velkého množství textových dokumentů na Internetu nabývá úloha objevování podobných dokumentů v rámci dané sady dokumentů na důležitosti. Mezi aplikace této úlohy patří algoritmické objevování plagiátorství, odstraňování duplicit z dané množiny dokumentů například pro účely fulltextových vyhledávacích strojů nebo pro účely detekce dokumentů pocházejících ze společného zdroje pro verzovací …more
Abstract:
With the availability of large amount of text documents on the Internet, the task of discovering similar documents inside a given document base becomes more important. The applications include discovering plagiarism by means of machine processing, removing duplicate documents from a given document base for purposes of e.g. full-text search engines or detecting co-derivative or related documents for …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 29. 4. 2015

Thesis defence

  • Date of defence: 31. 8. 2015
  • Supervisor: doc. Ing. Michal Brandejs, CSc.
  • Reader: doc. Ing. Jaroslav Zendulka, CSc., Assoc. Prof. Efstathios Stamatatos

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Doctoral programme / field:
Informatics (4-years) / Computer Systems and Technologies

Theses on a related topic

  • No theses on a related topic available.