Bc. Adam Karásek

Bachelor's thesis

Authorship Identification

Authorship Identification
Abstract:
V posledních letech byla navržena řada moderních modelů pro identifikaci autorství využívajících rozličné techniky reprezentace textu a různé klasifikační algoritmy. Problém nesrovnatelnosti těchto modelů vyplývá z rozdílných datových sad používaných pro jejich vyhodnocení a z odlišných metod předzpracování použitých datových sad. Tato bakalářská práce řeší daný problém implementací tří vybraných modelů …more
Abstract:
Numerous state-of-the-art models for authorship identification utilizing diverse text embedding techniques and classification algorithms have been proposed in recent years. However, the lack of comparability arises from disparate datasets used for evaluation and different preprocessing methods employed in these models. This study addresses the issue by implementing three chosen models, each employing …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 19. 12. 2023

Thesis defence

  • Date of defence: 15. 2. 2024
  • Supervisor: RNDr. Zuzana Nevěřilová, Ph.D.
  • Reader: doc. RNDr. Aleš Horák, Ph.D.

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Informatics

Theses on a related topic