Extrakcia pomenovaných entít z českých textov pomocou zoznamov entít – Bc. Alžbeta Strompová
Bc. Alžbeta Strompová
Diplomová práce
Extrakcia pomenovaných entít z českých textov pomocou zoznamov entít
Named Entity Recognition from Czech Texts using Gazetteers
Abstract:
This work deals with the recognition and extraction of named entities from Czech texts using gazetteers. The thesis describes the generation of gazetteers and the implementation of two approaches to their integration into the model, specifically the enlargement of training data and the expansion of embedding vectors. The results do not show significant improvement with the enlargement of training data …víceAbstract:
Táto práca sa zaoberá rozpoznaním a extrakciou pomenovaných entít z českých textov s využitím zoznamov pomenovaných entít. V práci je popísane generovanie zoznamov pomenovaných entít a implementované dva prístupy ich integrácie do modelu, konkrétne zväčšenie treningových dát a rozšírenie embedding vektorov. Výsledky neukazujú výrazné zlepšenie pri zväčšení tréningových dát. Naopak použitie rozšírených …více
Jazyk práce: slovenština
Datum vytvoření / odevzdání či podání práce: 21. 5. 2024
Identifikátor:
https://is.muni.cz/th/f7viq/
Obhajoba závěrečné práce
- Obhajoba proběhla 19. 6. 2024
- Vedoucí: doc. RNDr. Aleš Horák, Ph.D.
- Oponent: RNDr. Zuzana Nevěřilová, Ph.D.
Citační záznam
Plný text práce
Obsah online archivu závěrečné práce
Zveřejněno v Theses:- světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatikyMasarykova univerzita
Fakulta informatikyMagisterský studijní program / obor:
Umělá inteligence a zpracování dat / Strojové učení a umělá inteligence
Práce na příbuzné téma
-
Doménově-specifická adaptace NER
Bogoljub Jakovcheski -
Finanční analýza společnosti STACHEMA CZ s.r.o. a Lach-Ner, s.r.o.
Lucie Boučková -
Analýza a řízení nákladů ve společnosti Lach-Ner
Lucie Boučková -
Analýza a řízení nákladů ve společnosti Lach-Ner
Lucie Boučková