Theses 

Methods and workflows for analysis of high-throughput sequencing data – Mgr. Jan Oppelt, Ph.D.

česky | in English | slovensky

Agenda:
Změnit agendu. Adresa v ISu:

Zpět na vyhledávání

Masarykova univerzita

Přírodovědecká fakulta

Doktorský studijní program / obor:
Biochemie (čtyřleté) / Biomolekulární chemie

Mgr. Jan Oppelt, Ph.D.

Disertační práce

Methods and workflows for analysis of high-throughput sequencing data

Methods and workflows for analysis of high-throughput sequencing data

Anotace: Výrazné snížení nákladů vysoce výkonného sekvencování v posledních několika letech, zpřístupnilo tyto metody široké škále vědců. Chceme-li získat informace skryté v sekvenačních datech, musíme je zpracovat pomocí bioinformatických metod - workflow. Workflow se skládají z mnoha samostatných kroků, počínaje designem experimentu, přes počáteční kontrolou hrubých dat a mnohé kroky kontroly kvality až po konečné vizualizace a výsledky připravené k interpretaci. Aby bylo dosaženo požadovaných výsledků, je třeba tyto postupy pečlivě navrhnout, implementovat a spustit. Dostupné základní pracovní postupy a doporučené postupy obvykle řeší pouze jeden konkrétní experiment a nelze je použít ke zpracování dat nikde jinde. Z tohoto důvodu je třeba vyvíjet pracovní postupy speciálně přizpůsobené jednotlivým experimentům. Tato Ph.D. práce se zabývá problematikou metod a workflow pro analýzu sekvenačních dat z vysoce výkonného sekvencování. V této práci bylo vytvořeno několik pracovních postupů (workflow) pro zpracování těchto dat. Byla navržena a implementována workflow pro analýzu genové exprese a funkční analýzy z RNA-Seq (sekvencování RNA). Tento pracovní postup byl dále rozšířen a vylepšen. Celková analýza od začátku do konce byla použita k prozkoumání bakteriální genového exprese a jejích změn v čase v závislosti na různých vnějších faktorech. Dále byla vyvinuta workflow pro analýzu genomických variant ze spojených (multiplexovaných) vzorků. Tento postup byl dále rozvinut přidáním několika nových kroků, včetně sestavování genomu. Workflow musela být schopna zpracovat vzorky se speciálním návrhem experimentu a kontaminované vzorky.

Abstract: The significant decrease in the cost of high-throughput sequencing during the past few years has made it available for a wider scope of researchers. To extract information hidden in sequencing data, we need to process it using bioinformatics methods - workflows. Workflows consist of many separate steps starting with experimental design, through the initial check of raw data, and various quality control steps, all the way to final visualizations and results ready for interpretation. Workflows need to be carefully designed, implemented and executed. The available basic workflows and best-practices usually tackle only one specific experiment and cannot be used elsewhere. For this reason, workflows specifically tailored to individual experiments need to be developed. This Ph.D. thesis deals with the topic of methods and workflows for analysis of high-throughput sequencing data. Several workflows for NGS data processing were designed. An RNA-Seq (RNA sequencing) workflow for analysis of gene expression and functional analysis was designed and implemented and further extended and improved. The final end-to-end analysis was used to explore bacterial gene expression and changes under various external factors in time. Also, a DNA-Seq (DNA sequencing) workflow for analysis of genomic variants from multiplexed samples was developed. This workflow was later extended by adding several new steps including genome assembly. The workflow is now able to handle special experiment design and contaminated samples.

Keywords: vysoce výkonné sekvenovánı, workflow, metody, analýza, genová exprese, varianty, transkriptom, genom, high-throughput sequencing, methods, analysis, gene expression, variants, transcriptome, genome

Jazyk práce: angličtina

Obhajoba závěrečné práce

  • Obhajoba proběhla 10. 10. 2018
  • Vedoucí: prof. RNDr. Jaroslav Koča, DrSc.
  • Oponent: Mgr. Josef Pasulka, Ph.D., Dr. Attila Gyenesei

Citační záznam

Citace dle ISO 690: LaTeX | HTML | text | BibTeX | Wikipedie

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Složka Odkaz na adresář do lokálního úložiště instituce
Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Přírodovědecká fakulta


Nahoru | Aktuální datum a čas: 23. 4. 2019 20:39, 17. (lichý) týden

Soukromí

Kontakty: theses(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz