Bc. Jozef Kraus

Bachelor's thesis

Development of Data Deduplication Model for National Oncology Registry

Development of Data Deduplication Model for National Oncology Registry
Abstract:
Odborníci Ústavu zdravotnických informací a statistiky (ÚZIS) musí ručně rozhodnout, zda zachovat nebo vyřadit více záznamů s různými kódy MKN-10 o jednom pacientovi. Tyto záznamy jsou pak centralizovány v Národním onkologickém registru (NOR). V této práci popisuji vývoj modelu strojového učení (binárního klasifikátoru), který se učí ze záznamů expertně označených jako zachované nebo vyřazené pomocí …more
Abstract:
The Institute of Health Information and Statistics (ÚZIS) experts must manually decide whether to preserve or drop multiple records with different ICD-10 codes about one patient. These records are then centralized in the National Oncology Registry (NOR). In this work, I describe the development of a machine-learning model (a binary classifier) that learns from the records expertly labeled as preserved …more
 
 
Language used: English
Date on which the thesis was submitted / produced: 23. 5. 2024

Thesis defence

  • Date of defence: 25. 6. 2024
  • Supervisor: doc. RNDr. Petr Holub, Ph.D.
  • Reader: doc. Mgr. Bc. Vít Nováček, PhD

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky

Masaryk University

Faculty of Informatics

Bachelor programme / field:
Informatics / Informatics

Theses on a related topic