Předzpracování klinických poznámek pomocí standardizace slov a frází na základě podobnosti – Bc. Jan Halas
Bc. Jan Halas
Bachelor's thesis
Předzpracování klinických poznámek pomocí standardizace slov a frází na základě podobnosti
Preprocessing of clinical notes by similarity-based word and phrase standardisation
Abstract:
V této práci se zaměřuji na předzpracování klinických poznámek pro účely aplikací strojového učení. Klinické poznámky ukrývají značné množství informací, ale díky jejich nestandardní struktuře, jazyku, formátu a množství chyb a překlepů, je vyžadováno důkladnější předzpracování. Nejprve se věnuji obecným technikám předzpracování textu, kde stručně shrnu poznatky a studie, které se zabývají vlivy těchto …moreAbstract:
In this thesis, I focus on the preprocessing of clinical notes for machine learning applications. Clinical notes hide a considerable amount of information, but due to their non-standard structure, language, format, and many errors and typos, more thorough preprocessing is required. I first discuss general text preprocessing techniques, briefly summarizing findings and studies that address the effects …more
Language used: Czech
Date on which the thesis was submitted / produced: 18. 5. 2023
Identifier:
https://is.muni.cz/th/qw9jb/
Thesis defence
- Date of defence: 28. 6. 2023
- Supervisor: doc. Mgr. Bc. Vít Nováček, PhD
- Reader: Mgr. Petr Zelina
Citation record
ISO 690-compliant citation record:
HALAS, Jan. \textit{Předzpracování klinických poznámek pomocí standardizace slov a frází na základě podobnosti}. Online. Bachelor's thesis. Brno: Masaryk University, Faculty of Informatics. 2023. Available from: https://theses.cz/id/yqc3f5/.
Full text of thesis
Contents of on-line thesis archive
Published in Theses:- světu
Other ways of accessing the text
Institution archiving the thesis and making it accessible: Masarykova univerzita, Fakulta informatikyMasaryk University
Faculty of InformaticsBachelor programme / field:
Informatics / Informatics
Theses on a related topic
-
Analysis of Word Embeddings
Matthias THURNBAUER -
Analýza písomnej komunikácie v elektronickom obchode pomocou NLP
Veronika Letková -
Better Web Corpora For Corpus Linguistics And NLP
Vít Suchomel -
System for advanced search in metadata from NLP tools
Norbert Bodnár -
Automating configuration of computers in NLP laboratory
František Buš -
Porovnání NLP služeb dostupných na trhu a jejich využití pomocí API
Jan Doležálek -
Porovnání NLP funkcionality self service BI nástrojů
Pavel Chalupa -
NLP Technologies and AI for business: applications and methods utilized to reduce costs and workflow improvement
Ekaterina Staroverova