Detection of Similar Binding Sites in Protein Structure Databases
Detekce podobných vazebných míst v databázích proteinových struktur
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/191299Identifiers
Study Information System: 267048
Collections
- Kvalifikační práce [20088]
Author
Advisor
Referee
Galgonek, Jakub
Faculty / Institute
Faculty of Science
Discipline
Bioinformatics
Department
Department of Cell Biology
Date of defense
19. 6. 2024
Publisher
Univerzita Karlova, Přírodovědecká fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
protein-ligandové interakce, vazebná místa, podobnost, databázovévyhledáváníKeywords (English)
protein-ligand interaction, binding site, similarity, database searchingVyhodnocování podobnosti protein-ligand vazebných míst je důležité v mnoha oblastech, jako je výzkum nových využití stávajících léčiv nebo evoluční studie. Nejmodernější současné přístupy dosahují dobrých výsledků, ale pracují pouze s definovanými vazebnými místy, což není možné v nepředzpracovaných pro- teinových databázích. Pokud tato místa nejsou známá, je nejprve nutné prohledat proteinové struktury nástroji pro jejich predikci. To významně navyšuje cenu velkých databází podobných vazebných míst. Tato práce se zaměřuje na popis stávajících metod pro hodnocení podobnosti protein-ligand vazebných míst a zkoumá možnosti rychlého vyhledávání podobných míst ve velkých databázích příbuzných struktur. Je zde navržena jednoduchá metoda umožňující rychlejší než lineární vyhledávání bez nutnosti predikce potenciálních vazebných míst. Předběžné výsledky naznačují, že tento přístup je hoden další pozornosti, ačkoliv je stále zapotřebí více vhledu do dané problematiky.
The evaluation of protein-ligand binding site similarity is crucial in many fields, from drug repurposing trials to evolutionary studies. Current state-of-the- art methods achieve good results on the benchmarking datasets. However, the current approaches operate over pairs of binding sites and are not applicable for searching databases of unprocessed protein structures. In cases when the binding sites are unknown, they have to be firstly located by using binding site prediction algorithms. That significantly increases the upfront costs of creating large databases of similar binding sites. This work covers the current methods for assessing binding site similarity and explores the possibility of fast searching of large databases of related structures by presenting a simple method that allows faster than linear search without the need for identification of the precise locations of the putative binding sites. The proposed approach shows promising preliminary results that merit further investigation, although more insight is still needed.