Theses 

Quantitative structure-property relationship modeling algorithms, challenges and IT solutions – Mgr. Ondřej Skřehota

česky | in English | slovensky

Agenda:
Změnit agendu. Adresa v ISu:

Zpět na vyhledávání

Mgr. Ondřej Skřehota

Rigorózní práce

Quantitative structure-property relationship modeling algorithms, challenges and IT solutions

Quantitative structure-property relationship modeling algorithms, challenges and IT solutions

Anotace: V současnosti je dostupno mnoho experimentálních a predikovaných dat o 3D strukturách organických molekul a biomolekul. Jednou z klíčových metodik zpracování je Quantitative Structure-Property Relationship (QSPR) modelování. Tato metodologie popisuje molekuly skrze různé numerické hodnoty (zvané deskriptory), které obsahují strukturální charakteristiky molekul. Následně je deskriptorů využíváno k počítání vlastností molekul. QSPR modelování se stalo velmi populárním v chemickém, biologickém a farmaceutickém výzkumu. Hlavním důvodem je, že predikce těchto vlastností je velmi náročná a QSPR modelování poskytuje efektivní způsob odhadu těchto hodnot. Navíc, vstupy pro QSPR modely jsou jsou molekulární struktury, které jsou snadno a volně dostupné pro mnoho molekul. Vzhledem k tomu, že QSPR modelování je velmi mladým oborem, není dostupný žádný obecný softwarový balíček pro automatizaci a zjednodušení procesu tvorby QSPR modelu. Z tohoto důvodu jsme navrhli a vytvořili modulární a snadno rozšiřitelný software nazvaný QSPR Designer, který umožňuje automatizovat proces návrhu QSPR modelu a jeho evaluaci. Tento software dokáže načíst nebo vypočítat strukturální vlastnosti molekul, použít je jako QSPR deskriptory, efektivně navrhout a parametrizovat QSPR modely, předpovědět fyziochemické vlastnosti molekul a vyhodnotit modely. Kvalita a výkon aplikace QSPR Designer byla demonstrována čtyřmi případovými studiemi zabývajícími se predikcí pKa pro sadu 143 fenolových molekul. V první případové studii jsme zpracovali velkou sadu deskriptorů (parciální atomové náboje spočtené za pomoci kvantově-mechanických přístupů) a nalezli podmnožinu sady deskriptorů relevantních pro QSPR modelování. Druhá případová studie byla zaměřena na návrh, evaluaci a porovnání QSPR modelů pro pKa predikci za využití všech 75 postupů výpočtu nábojů. Náš nejlepší model predikoval pKa čtvercovou hodnotou Pearsonova koeficientu R2 0,969. Ve třetí případové studii jsme se pokusili o predikci pKa z empirických nábojů spočtených metodou EEM. Tato metoda je velmi rychlá a byla implementována přímo do aplikace QSPR Designer. Metoda EEM rovněž poskytla slibné výsledky (hodnota R2 0,907. Poslední případová studie se věnuje analýze výkonu QSPR Designeru a ukazuje možnosti QSPR modelingu v reálném čase.

Abstract: Nowadays, a large amount of experimental and predicted data about the 3D structure of organic molecules and biomolecules is available. One of key methodologies for processing these data is Quantitative Structure-Property Relationship (QSPR) modeling. This methodology expresses molecules via various numerical values (called descriptors), which encode the structural characteristics of molecules. Afterwards the descriptors are employed to calculate the physicochemical properties of the molecules. QSPR modeling has become very popular in chemical, biological and pharmaceutical research. The main reason is that the prediction or experimental determination of physicochemical properties (e.g. dissociation constants, partition coefficients, solubility, lipophilicity, biological activity, . . . ) is very challenging and QSPR provides an effective way to estimate these values. Furthermore, the inputs for QSPR models are molecular structures, freely and easily available for plenty of molecules. OSPR modeling is a very novel branch, therefore there is yet no general software package which would help to automate and streamline the process of QSPR model design. For this reason, we designed and developed a modular and easily extensible software, called QSPR Designer, which allows us to automate the process of QSPR model design and evaluation. The software can read or calculate structural properties of molecules, employ them as QSPR descriptors, effectively design and parameterize QSPR models, predict physicochemical properties of molecules and evaluate the models. The quality and performance of QSPR Designer was demonstrated by four case studies on pKa prediction for a set of 143 phenol molecules. In the first case study, we processed a large set of descriptors (partial atomic charges calculated using 75 different quantum mechanical approaches) and found a subset of descriptors relevant for QSPR modeling. The second case study was focused on the design, evaluation, and comparison of QSPR models for pKa prediction using all 75 charge calculation approaches. Our best model predicted the pKa with squared Pearson coefficient R2 of 0.969. In the third case study we tried the pKa prediction from empirical charges, calculated by the Electronegativity Equalization Method (EEM). This method is very fast and is implemented directly in QSPR Designer. The EEM provides also promissing results (R2 of 0.907). Last case study analyzed the performance of QSPR Designer and showed a possibility of real time QSPR modeling.

Keywords: Quantitative structure-property relationship, QSPR models, multiple linear regression, parameterization, molecules, charges, dissociation constant, .NET, web applications

Jazyk práce: angličtina

Obhajoba závěrečné práce

  • Obhajoba proběhla 30. 3. 2011
  • Oponent: Ing. Matej Lexa, Ph.D., Mgr. Jan Žídek, Ph.D.

Citační záznam

Citace dle ISO 690: LaTeX | HTML | text | BibTeX | Wikipedie

Plný text práce

Obsah online archivu závěrečné práce
Zveřejněno v Theses:
  • světu
Složka Odkaz na adresář do lokálního úložiště instituce
Jak jinak získat přístup k textu

Instituce archivující a zpřístupňující práci: Masarykova univerzita, Fakulta informatiky


Nahoru | Aktuální datum a čas: 19. 3. 2019 16:42, 12. (sudý) týden

Soukromí

Kontakty: theses(zavináč/atsign)fi(tečka/dot)muni(tečka/dot)cz