Predikce sekundární struktury proteinu pomocí hlubokých neuronových sítí
Protein secondary structure prediction using deep neural networks
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/90584Identifiers
Study Information System: 189343
Collections
- Kvalifikační práce [11217]
Author
Advisor
Referee
Matzner, Filip
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Artificial Intelligence
Department
Department of Software Engineering
Date of defense
7. 9. 2017
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
bioinformatika, protein, sekundární struktura, strojové učení, neuronové sítěKeywords (English)
bioinformatics, protein, secondary structure, machine learning, neural networksZnalost struktury, kterou proteiny zaujímají v prostoru, je klíčovým faktorem při studiu jejich funkce. Experimentální zjištění struktury je ale nákladné a časově náročné, proto jsou velmi populární predikční modely struktury. Nejvýraznějším podproblémem predikce struktury proteinů je predikce lokálního uspořádání sou- sedících aminokyselin určeného vodíkovými vazbami, tzv. sekundární struktury proteinů. Tato práce se zaměřuje na využití hlubokých neuronových sítí v pre- dikci sekundární struktury. Na implementovaném predikčním modelu jsou v rámci této práce testovány různé modifikace sítě, především je pak provedeno srovnání LSTM a GRU paměťových buněk. Dále jsou zkoumány nové metody předzpraco- vání proteinů, a to zrychlení klasické metody výpočtu PSSM a zahrnutí predikce terciární struktury mezi vstupy predikčního modelu. V poslední části práce je ověřována použitelnost vyhlazovacích metod pro modely predikující složitější os- mistavové rozdělení sekundárních struktur. 1
Determination of protein structure in space is a crucial part of protein function analysis. But structure determination is an expensive and time consuming pro- cess, therefore structure prediction model raised on popularity. The most notable subproblem of protein structure prediction is prediction of local conformation of the adjacent amino acids, ie. secondary structure. This thesis studies usage of deep neural networks for protein secondary structure prediction. We implemented pre- diction model and different modifications are evaluated. Especially compassion of LSTM and GRU memory cells was done. Furthermore, two new preprocessing me- thods are evaluated. Fast PSSM calculation method was proposed and prediction of tertiary structure was used as input for prediction model. Last part of this thesis examine application of filtering methods for models predicting secondary structure with eight classes. 1