Bc. Jan Halas

Bakalářská práce

Předzpracování klinických poznámek pomocí standardizace slov a frází na základě podobnosti

Preprocessing of clinical notes by similarity-based word and phrase standardisation
Anotace:
V této práci se zaměřuji na předzpracování klinických poznámek pro účely aplikací strojového učení. Klinické poznámky ukrývají značné množství informací, ale díky jejich nestandardní struktuře, jazyku, formátu a množství chyb a překlepů, je vyžadováno důkladnější předzpracování. Nejprve se věnuji obecným technikám předzpracování textu, kde stručně shrnu poznatky a studie, které se zabývají vlivy těchto …více
Abstract:
In this thesis, I focus on the preprocessing of clinical notes for machine learning applications. Clinical notes hide a considerable amount of information, but due to their non-standard structure, language, format, and many errors and typos, more thorough preprocessing is required. I first discuss general text preprocessing techniques, briefly summarizing findings and studies that address the effects …více
 
 
Jazyk práce: čeština
Datum vytvoření / odevzdání či podání práce: 18. 5. 2023

Obhajoba závěrečné práce

  • Obhajoba proběhla 28. 6. 2023
  • Vedoucí: doc. Mgr. Bc. Vít Nováček, PhD
  • Oponent: Mgr. Petr Zelina

Citační záznam

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Jak jinak získat přístup k textu
Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky