Bc. Michal SEJÁK

Diplomová práce

Summarization of News Articles

Summarization of News Articles
Abstract:
Automatic text summarization is an important NLP task with many applications. Our particular area of focus is summarization of news articles. We introduce a new Czech summarization dataset created from CNA articles. Using this dataset, we trained multiple state-of-the-art approaches for extractive summarization using the BERT and Longformer model architectures and evaluate them using ROUGE-N, ROUGE …více
Abstract:
Automatická sumarizace textu je důležitý úkol z oboru zpracování přirozeného jazyka s mnoha aplikacemi. V této práci se zaměřujeme na sumarizaci novinových článků. V práci představujeme nový sumarizační dataset vytvořený z článků ČTK. Na tomto datasetu jsme natrénovali některé z nejmodernějších modelů pro extraktivní sumarizaci s využitím neuronových sítí BERT a Longformer a zhodnotili je podle metrik …více
 
 
Jazyk práce: angličtina
Datum vytvoření / odevzdání či podání práce: 19. 5. 2022
Zveřejnit od: 31. 12. 2999

Obhajoba závěrečné práce

  • Vedoucí: Ing. Jakub Sido

Citační záznam

Jak správně citovat práci

SEJÁK, Michal. Summarization of News Articles. Plzeň, 2022. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Plný text práce

Právo: Autor si nepřeje zpřístupnění práce veřejnosti

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • Soubory jsou nedostupné.
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd
Vázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/

ZÁPADOČESKÁ UNIVERZITA V PLZNI

Fakulta aplikovaných věd

Magisterský studijní program / obor:
Inženýrská informatika / Softwarové inženýrství