Detection of Similar Binding Sites in Protein Structure Databases
Detekce podobných vazebných míst v databázích proteinových struktur
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/191299Identifikátory
SIS: 267048
Kolekce
- Kvalifikační práce [20088]
Autor
Vedoucí práce
Oponent práce
Galgonek, Jakub
Fakulta / součást
Přírodovědecká fakulta
Obor
Bioinformatika
Katedra / ústav / klinika
Katedra buněčné biologie
Datum obhajoby
19. 6. 2024
Nakladatel
Univerzita Karlova, Přírodovědecká fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
protein-ligandové interakce, vazebná místa, podobnost, databázovévyhledáváníKlíčová slova (anglicky)
protein-ligand interaction, binding site, similarity, database searchingVyhodnocování podobnosti protein-ligand vazebných míst je důležité v mnoha oblastech, jako je výzkum nových využití stávajících léčiv nebo evoluční studie. Nejmodernější současné přístupy dosahují dobrých výsledků, ale pracují pouze s definovanými vazebnými místy, což není možné v nepředzpracovaných pro- teinových databázích. Pokud tato místa nejsou známá, je nejprve nutné prohledat proteinové struktury nástroji pro jejich predikci. To významně navyšuje cenu velkých databází podobných vazebných míst. Tato práce se zaměřuje na popis stávajících metod pro hodnocení podobnosti protein-ligand vazebných míst a zkoumá možnosti rychlého vyhledávání podobných míst ve velkých databázích příbuzných struktur. Je zde navržena jednoduchá metoda umožňující rychlejší než lineární vyhledávání bez nutnosti predikce potenciálních vazebných míst. Předběžné výsledky naznačují, že tento přístup je hoden další pozornosti, ačkoliv je stále zapotřebí více vhledu do dané problematiky.
The evaluation of protein-ligand binding site similarity is crucial in many fields, from drug repurposing trials to evolutionary studies. Current state-of-the- art methods achieve good results on the benchmarking datasets. However, the current approaches operate over pairs of binding sites and are not applicable for searching databases of unprocessed protein structures. In cases when the binding sites are unknown, they have to be firstly located by using binding site prediction algorithms. That significantly increases the upfront costs of creating large databases of similar binding sites. This work covers the current methods for assessing binding site similarity and explores the possibility of fast searching of large databases of related structures by presenting a simple method that allows faster than linear search without the need for identification of the precise locations of the putative binding sites. The proposed approach shows promising preliminary results that merit further investigation, although more insight is still needed.