Bc. Martin VÁŇA

Diplomová práce

Incremental News Clustering

Incremental news clustering
Abstract:
The goal was to research model-based clustering methods, notably the Distance Dependent Chinese Restaurant Process (ddCRP), and propose an incremental clustering system which would be capable of maintaining the growing number of topic clusters of news articles coming online from a crawler. LDA, LSA, and doc2vec methods were used to represent a document as a fixed-length numeric vector. Cluster assignments …více
Abstract:
Cílem práce bylo prozkoumat možnosti shlukovacích metod založených na statistických modelech, zejména metodu založenou na Distance Dependent Chinese Restaurant Process (ddCRP), a navrhnout shlukovací systém, který bude schopný udržovat tematické shluky zpravodajských textů, které budou postupně přicházet z crawleru. Metody LDA, LSA a doc2vec byly použity k reprezentaci dokumentu jako číselný vektor …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 17. 5. 2018
Zveřejnit od: 31. 12. 2999

Obhajoba závěrečné práce

  • Vedoucí: Doc. Ing. Josef Steinberger, Ph.D.

Citační záznam

Jak správně citovat práci

VÁŇA, Martin. Incremental News Clustering. Plzeň, 2018. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Plný text práce

Právo: Autor si nepřeje zpřístupnění práce veřejnosti

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd
Vázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Fakulta aplikovaných věd

Magisterský studijní program / obor:
Inženýrská informatika / Softwarové inženýrství