RNDr. Radim Řehůřek, Ph.D.

Disertační práce

Scalability of Semantic Analysis in Natural Language Processing

Scalability of Semantic Analysis in Natural Language Processing
Anotace:
Práce se zabývá dolováním dat z rozsáhlých korpusů. Zaměřuje se na robustní statistické metody, které dokáží automatizovaně vytvořit kompaktní sémantickou reprezentaci volného textu, tj. bez použití metadat či ručního vstupu člověka. První část práce se zabývá škálovatelností metod Latent Semantic Analysis (LSA) a Latent Dirichlet Allocation (LDA). Představuji nové algoritmy pro škálovatelnou tvorbu …více
Abstract:
Data mining applications that work over input of very large scale (web-scale problems) pose challenges that are new and exciting both academically and commercially. Any web-scale algorithm must be robust (dealing gracefully with the inevitable data noise), scalable (capable of efficiently processing large input) and reasonably automated (as human intervention is very costly and often impossible on …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 19. 8. 2011

Obhajoba závěrečné práce

  • Obhajoba proběhla 12. 9. 2011
  • Vedoucí: prof. PhDr. Karel Pala, CSc.
  • Oponent: Dr. Johannes Leveling, Dr. Martin Rajman

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky

Masarykova univerzita

Fakulta informatiky

Doktorský studijní program / obor:
Informatika (čtyřleté) / Informatika