Bc. Michal SEJÁK

Master's thesis

Summarization of News Articles

Summarization of News Articles
Abstract:
Automatic text summarization is an important NLP task with many applications. Our particular area of focus is summarization of news articles. We introduce a new Czech summarization dataset created from CNA articles. Using this dataset, we trained multiple state-of-the-art approaches for extractive summarization using the BERT and Longformer model architectures and evaluate them using ROUGE-N, ROUGE …more
Abstract:
Automatická sumarizace textu je důležitý úkol z oboru zpracování přirozeného jazyka s mnoha aplikacemi. V této práci se zaměřujeme na sumarizaci novinových článků. V práci představujeme nový sumarizační dataset vytvořený z článků ČTK. Na tomto datasetu jsme natrénovali některé z nejmodernějších modelů pro extraktivní sumarizaci s využitím neuronových sítí BERT a Longformer a zhodnotili je podle metrik …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 19. 5. 2022
Accessible from:: 31. 12. 2999

Thesis defence

  • Supervisor: Ing. Jakub Sido

Citation record

The right form of listing the thesis as a source quoted

SEJÁK, Michal. Summarization of News Articles. Plzeň, 2022. diplomová práce (Ing.). ZÁPADOČESKÁ UNIVERZITA V PLZNI. Fakulta aplikovaných věd

Full text of thesis

Accessibility: Autor si nepřeje zpřístupnění práce veřejnosti

Contents of on-line thesis archive
Published in Theses:
  • Soubory jsou nedostupné.
Other ways of accessing the text
Institution archiving the thesis and making it accessible: ZÁPADOČESKÁ UNIVERZITA V PLZNI, Fakulta aplikovaných věd
Vázaný výtisk práce naleznete v Univerzitní knihovně ZČU, více na http://www.knihovna.zcu.cz/kvalifikacni-prace/