Detection of Similar Binding Sites in Protein Structure Databases

Telčer, Jakub

Detekce podobných vazebných míst v databázích proteinových struktur

bakalářská práce (OBHÁJENO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (231.9Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/191299

Identifikátory

SIS: 267048

Oponent práce

Galgonek, Jakub

Fakulta / součást

Přírodovědecká fakulta

Obor

Bioinformatika

Katedra / ústav / klinika

Katedra buněčné biologie

Datum obhajoby

19. 6. 2024

Nakladatel

Univerzita Karlova, Přírodovědecká fakulta

Jazyk

Angličtina

Známka

Výborně

Klíčová slova (česky)

protein-ligandové interakce, vazebná místa, podobnost, databázovévyhledávání

Klíčová slova (anglicky)

protein-ligand interaction, binding site, similarity, database searching

Vyhodnocování podobnosti protein-ligand vazebných míst je důležité v mnoha oblastech, jako je výzkum nových využití stávajících léčiv nebo evoluční studie. Nejmodernější současné přístupy dosahují dobrých výsledků, ale pracují pouze s definovanými vazebnými místy, což není možné v nepředzpracovaných pro- teinových databázích. Pokud tato místa nejsou známá, je nejprve nutné prohledat proteinové struktury nástroji pro jejich predikci. To významně navyšuje cenu velkých databází podobných vazebných míst. Tato práce se zaměřuje na popis stávajících metod pro hodnocení podobnosti protein-ligand vazebných míst a zkoumá možnosti rychlého vyhledávání podobných míst ve velkých databázích příbuzných struktur. Je zde navržena jednoduchá metoda umožňující rychlejší než lineární vyhledávání bez nutnosti predikce potenciálních vazebných míst. Předběžné výsledky naznačují, že tento přístup je hoden další pozornosti, ačkoliv je stále zapotřebí více vhledu do dané problematiky.

Abstrakt (anglicky)

The evaluation of protein-ligand binding site similarity is crucial in many fields, from drug repurposing trials to evolutionary studies. Current state-of-the- art methods achieve good results on the benchmarking datasets. However, the current approaches operate over pairs of binding sites and are not applicable for searching databases of unprocessed protein structures. In cases when the binding sites are unknown, they have to be firstly located by using binding site prediction algorithms. That significantly increases the upfront costs of creating large databases of similar binding sites. This work covers the current methods for assessing binding site similarity and explores the possibility of fast searching of large databases of related structures by presenting a simple method that allows faster than linear search without the need for identification of the precise locations of the putative binding sites. The proposed approach shows promising preliminary results that merit further investigation, although more insight is still needed.

Citace dokumentu

Metadata

Zobrazit celý záznam