Bc. Tomáš Houfek
Bachelor's thesis
Data extraction from medical records
Data extraction from medical records
Abstract:
Tato práce se zabývá extrakcí užitečných informací z lékařských zpráv. Cílem práce je schopnost automaticky vyplňovat hlášenku novotvaru pro Národní onkologický registr. Pro implementaci tohoto úkolu jsou použity dva způsoby extrakce informací. Pravidlový přístup, extrakce s pomocí regulárních výrazů a přístup hlubokého učení, konkrétně model rozpoznávání jmenných entit (Named Entity Recognition) založený …moreAbstract:
This thesis focuses on automatically extracting valuable information from medical records. The specific goal of this thesis is to fill the Neoplasm incidence report from the National Oncology Registry automatically. To achieve this, two extraction approaches are used. Rule-based Regular Expression extraction and Deep-learning Medical Named Entity Recognition model based on the Transformer architecture …more
Language used: English
Date on which the thesis was submitted / produced: 19. 5. 2022
Identifier:
https://is.muni.cz/th/w9i47/
Thesis defence
- Date of defence: 1. 7. 2022
- Supervisor: Mgr. Zdenka Dudová, Ph.D.
- Reader: doc. Mgr. Bc. Vít Nováček, PhD
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing
Theses on a related topic
-
Named Entity Recognition in Historical Text Documents
Milan VACEK -
Named entity recognition exploiting sub word information
Patrik Dobrovodský -
Named Entity Recognition and Text Compression
Hong Vu Nguyen -
Pretraining and Evaluation of Czech ALBERT Language Model
Petr Zelina