Bc. Tomáš Houfek

Bachelor's thesis

Data extraction from medical records

Data extraction from medical records
Abstract:
Tato práce se zabývá extrakcí užitečných informací z lékařských zpráv. Cílem práce je schopnost automaticky vyplňovat hlášenku novotvaru pro Národní onkologický registr. Pro implementaci tohoto úkolu jsou použity dva způsoby extrakce informací. Pravidlový přístup, extrakce s pomocí regulárních výrazů a přístup hlubokého učení, konkrétně model rozpoznávání jmenných entit (Named Entity Recognition) založený …more
Abstract:
This thesis focuses on automatically extracting valuable information from medical records. The specific goal of this thesis is to fill the Neoplasm incidence report from the National Oncology Registry automatically. To achieve this, two extraction approaches are used. Rule-based Regular Expression extraction and Deep-learning Medical Named Entity Recognition model based on the Transformer architecture …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 19. 5. 2022

Thesis defence

  • Date of defence: 1. 7. 2022
  • Supervisor: Mgr. Zdenka Dudová, Ph.D.
  • Reader: doc. Mgr. Bc. Vít Nováček, PhD

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Artificial Intelligence and Natural Language Processing