dc.contributor.advisor | Hoksza, David | |
dc.creator | Brabec, Matyáš | |
dc.date.accessioned | 2024-11-28T17:20:40Z | |
dc.date.available | 2024-11-28T17:20:40Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/190729 | |
dc.description.abstract | Interakce proteinů s různými molekulami jsou klíčové pro jejich funkci a následně pro celkové fungování organismů. Studium těchto interakcí je důležité v mnoha vědních obo- rech, včetně medicíny, kde má zásadní význam pro vývoj léků. Klíčovým typem těchto interakcí je vazba mezi proteinem a ligandem a významným cílem bioinformatiky je vy- vinout spolehlivé modely pro predikci těchto vazebných míst. Nedávný nárůst databazí proteinových struktur v kombinaci s výkonem moderních GPU umožnil vývoj mnoha modelů strojového učení. Zejména protein language modely, inspirované svými protějšky ve zpracování přirozeného jazyka, se úspěšně uplatňují v napříč bioinformatikou. V této práci jsme použili model proteinového jazyka pro predikci vazebných míst a snažili jsme se zvýšit jeho výkonnost začleněním různých trojrozměrných vlastností proteinů. 1 | cs_CZ |
dc.description.abstract | Protein interactions with various molecules are crucial for their function and, con- sequently, for the overall functioning of organisms. Studying these interactions is im- portant across many scientific fields, including medicine, where it is essential for drug development. Protein-ligand binding is a key type of these interactions, and a significant goal in bioinformatics is to develop reliable models for binding site prediction. The re- cent surge in the collection of protein structures, combined with the immense power of modern GPUs, has allowed the development of many machine-learning models. Notably protein language models, inspired by their counterparts in natural language processing, have been successfully applied throughout bioinformatics. In this thesis, we fine-tuned a protein language model for binding site prediction and sought to enhance its performance by incorporating various three-dimensional features of proteins. 1 | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | bioinforamtics|protein sequence|protein structure|machine learning | en_US |
dc.subject | bioinformatika|proteinová sekvence|proteinová struktura|strojové učení | cs_CZ |
dc.title | Využití kombinovaných sekvenčních a strukturních vlastností pro predikci protein-ligand vazebných míst | cs_CZ |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-06-11 | |
dc.description.department | Department of Software Engineering | en_US |
dc.description.department | Katedra softwarového inženýrství | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 267838 | |
dc.title.translated | Using combined sequence and structural features to predict protein-ligand binding sites | en_US |
dc.contributor.referee | Škoda, Petr | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Computer Science - Software and Data Engineering | en_US |
thesis.degree.discipline | Informatika - Softwarové a datové inženýrství | cs_CZ |
thesis.degree.program | Computer Science - Software and Data Engineering | en_US |
thesis.degree.program | Informatika - Softwarové a datové inženýrství | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwarového inženýrství | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software Engineering | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika - Softwarové a datové inženýrství | cs_CZ |
uk.degree-discipline.en | Computer Science - Software and Data Engineering | en_US |
uk.degree-program.cs | Informatika - Softwarové a datové inženýrství | cs_CZ |
uk.degree-program.en | Computer Science - Software and Data Engineering | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Interakce proteinů s různými molekulami jsou klíčové pro jejich funkci a následně pro celkové fungování organismů. Studium těchto interakcí je důležité v mnoha vědních obo- rech, včetně medicíny, kde má zásadní význam pro vývoj léků. Klíčovým typem těchto interakcí je vazba mezi proteinem a ligandem a významným cílem bioinformatiky je vy- vinout spolehlivé modely pro predikci těchto vazebných míst. Nedávný nárůst databazí proteinových struktur v kombinaci s výkonem moderních GPU umožnil vývoj mnoha modelů strojového učení. Zejména protein language modely, inspirované svými protějšky ve zpracování přirozeného jazyka, se úspěšně uplatňují v napříč bioinformatikou. V této práci jsme použili model proteinového jazyka pro predikci vazebných míst a snažili jsme se zvýšit jeho výkonnost začleněním různých trojrozměrných vlastností proteinů. 1 | cs_CZ |
uk.abstract.en | Protein interactions with various molecules are crucial for their function and, con- sequently, for the overall functioning of organisms. Studying these interactions is im- portant across many scientific fields, including medicine, where it is essential for drug development. Protein-ligand binding is a key type of these interactions, and a significant goal in bioinformatics is to develop reliable models for binding site prediction. The re- cent surge in the collection of protein structures, combined with the immense power of modern GPUs, has allowed the development of many machine-learning models. Notably protein language models, inspired by their counterparts in natural language processing, have been successfully applied throughout bioinformatics. In this thesis, we fine-tuned a protein language model for binding site prediction and sought to enhance its performance by incorporating various three-dimensional features of proteins. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrství | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |