RNDr. Jan Kasprzak, Ph.D.

Disertační práce

Distributed Systems for Discovering Similar Documents

Distributed Systems for Discovering Similar Documents
Anotace:
S dostupností velkého množství textových dokumentů na Internetu nabývá úloha objevování podobných dokumentů v rámci dané sady dokumentů na důležitosti. Mezi aplikace této úlohy patří algoritmické objevování plagiátorství, odstraňování duplicit z dané množiny dokumentů například pro účely fulltextových vyhledávacích strojů nebo pro účely detekce dokumentů pocházejících ze společného zdroje pro verzovací …více
Abstract:
With the availability of large amount of text documents on the Internet, the task of discovering similar documents inside a given document base becomes more important. The applications include discovering plagiarism by means of machine processing, removing duplicate documents from a given document base for purposes of e.g. full-text search engines or detecting co-derivative or related documents for …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 29. 4. 2015

Obhajoba závěrečné práce

  • Obhajoba proběhla 31. 8. 2015
  • Vedoucí: doc. Ing. Michal Brandejs, CSc.
  • Oponent: doc. Ing. Jaroslav Zendulka, CSc., Assoc. Prof. Efstathios Stamatatos

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Doktorský studijní program / obor:
Informatika (čtyřleté) / Počítačové systémy a technologie

Práce na příbuzné téma

  • Žádné práce na příbuzné téma.