Bc. Jan Halas

Bachelor's thesis

Předzpracování klinických poznámek pomocí standardizace slov a frází na základě podobnosti

Preprocessing of clinical notes by similarity-based word and phrase standardisation
Abstract:
V této práci se zaměřuji na předzpracování klinických poznámek pro účely aplikací strojového učení. Klinické poznámky ukrývají značné množství informací, ale díky jejich nestandardní struktuře, jazyku, formátu a množství chyb a překlepů, je vyžadováno důkladnější předzpracování. Nejprve se věnuji obecným technikám předzpracování textu, kde stručně shrnu poznatky a studie, které se zabývají vlivy těchto …more
Abstract:
In this thesis, I focus on the preprocessing of clinical notes for machine learning applications. Clinical notes hide a considerable amount of information, but due to their non-standard structure, language, format, and many errors and typos, more thorough preprocessing is required. I first discuss general text preprocessing techniques, briefly summarizing findings and studies that address the effects …more
 
 
Language used: Czech
Date on which the thesis was submitted / produced: 18. 5. 2023

Thesis defence

  • Date of defence: 28. 6. 2023
  • Supervisor: doc. Mgr. Bc. Vít Nováček, PhD
  • Reader: Mgr. Petr Zelina

Citation record

Full text of thesis

Contents of on-line thesis archive
Published in Theses:
  • světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatiky