Predikce sekundární struktury proteinu pomocí hlubokých neuronových sítí
Protein secondary structure prediction using deep neural networks
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/90584Identifikátory
SIS: 189343
Kolekce
- Kvalifikační práce [11217]
Autor
Vedoucí práce
Oponent práce
Matzner, Filip
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Umělá inteligence
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
7. 9. 2017
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
bioinformatika, protein, sekundární struktura, strojové učení, neuronové sítěKlíčová slova (anglicky)
bioinformatics, protein, secondary structure, machine learning, neural networksZnalost struktury, kterou proteiny zaujímají v prostoru, je klíčovým faktorem při studiu jejich funkce. Experimentální zjištění struktury je ale nákladné a časově náročné, proto jsou velmi populární predikční modely struktury. Nejvýraznějším podproblémem predikce struktury proteinů je predikce lokálního uspořádání sou- sedících aminokyselin určeného vodíkovými vazbami, tzv. sekundární struktury proteinů. Tato práce se zaměřuje na využití hlubokých neuronových sítí v pre- dikci sekundární struktury. Na implementovaném predikčním modelu jsou v rámci této práce testovány různé modifikace sítě, především je pak provedeno srovnání LSTM a GRU paměťových buněk. Dále jsou zkoumány nové metody předzpraco- vání proteinů, a to zrychlení klasické metody výpočtu PSSM a zahrnutí predikce terciární struktury mezi vstupy predikčního modelu. V poslední části práce je ověřována použitelnost vyhlazovacích metod pro modely predikující složitější os- mistavové rozdělení sekundárních struktur. 1
Determination of protein structure in space is a crucial part of protein function analysis. But structure determination is an expensive and time consuming pro- cess, therefore structure prediction model raised on popularity. The most notable subproblem of protein structure prediction is prediction of local conformation of the adjacent amino acids, ie. secondary structure. This thesis studies usage of deep neural networks for protein secondary structure prediction. We implemented pre- diction model and different modifications are evaluated. Especially compassion of LSTM and GRU memory cells was done. Furthermore, two new preprocessing me- thods are evaluated. Fast PSSM calculation method was proposed and prediction of tertiary structure was used as input for prediction model. Last part of this thesis examine application of filtering methods for models predicting secondary structure with eight classes. 1