Zobrazit minimální záznam

Mining nových terpen syntáz z rozsáhlých databází
dc.contributor.advisorPluskal, Tomáš
dc.creatorČalounová, Tereza
dc.date.accessioned2024-11-28T11:53:10Z
dc.date.available2024-11-28T11:53:10Z
dc.date.issued2024
dc.identifier.urihttp://hdl.handle.net/20.500.11956/190195
dc.description.abstractTerpeny a terpenoidy představují největší a strukturně nejrozmanitější skupinu přírodních látek s využitím v mnoha oborech, včetně farmaceutického průmyslu. Tyto molekuly jsou v přírodě syntetizovány enzymy známými jako terpen syntázy. V této práci byla provedena bioinformatická analýza kurátorované databáze obsahující všech 1125 experimentálně charakterizovaných terpen syntáz se zaměřením na identifikaci vzorců v délkách sekvencí a doménových architekturách těchto enzymů napříč různými říšemi života. Na základě poznatků této analýzy byl proveden sekvenčně založený mining s cílem identifikovat možné nové terpen syntázy. S využitím téměř 5,5 miliard proteinových sekvencí z různých rozsáhlých sekvenčních databází vedl mining k identifikaci více než 600 tisíc potenciálních terpen syntáz. Tyto potenciální terpen syntázy pocházejí převážně z bakterií a metagenomů, tedy ze zdrojů, které byly historicky méně zkoumány. Výsledný dataset, doplněný fylogenetickým stromem, sítí sekvenční podobnosti a dvěma skóre prioritizace, nabízí cenný zdroj pro objevování nových terpenů. Klíčová slova: terpen syntáza, TPS, mining, Pfam, SUPERFAMILY, doména, terpencs_CZ
dc.description.abstractTerpenes and terpenoids represent the largest and most structurally diverse group of natural products, with applications across many fields, including the pharmaceutical industry. These molecules are synthesized in nature by enzymes known as terpene synthases. This thesis conducted a bioinformatic analysis of a curated database containing all 1125 experimentally characterized terpene synthases, focusing on identifying patterns in sequence lengths and domain architectures of these enzymes across different kingdoms of life. Based on this analysis's knowledge, sequence-guided mining was conducted to identify possible new terpene synthases. Using nearly 5.5 billion protein sequences from various large-scale sequence repositories, the mining resulted in the identification of more than 600 thousand putative terpene synthases. These putative terpene synthases mainly originate from Bacteria and metagenomes, sources that had historically been less explored. The resulting dataset, accompanied by a phylogenetic tree, sequence similarity network, and two prioritization scores, offers a valuable resource for the discovery of novel terpenes. Keywords: terpene synthase, TPS, mining, Pfam, SUPERFAMILY, domain, terpeneen_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Přírodovědecká fakultacs_CZ
dc.subjectterpene synthaseen_US
dc.subjectminingen_US
dc.subjectdatabaseen_US
dc.subjectPfamen_US
dc.subjectSupfamen_US
dc.subjectdomainen_US
dc.subjectterpeneen_US
dc.subjectterpen syntázacs_CZ
dc.subjectminingcs_CZ
dc.subjectdatabázecs_CZ
dc.subjectPfamcs_CZ
dc.subjectSupfamcs_CZ
dc.subjectdoménacs_CZ
dc.subjectterpencs_CZ
dc.titleMining novel terpene synthases from large-scale repositoriesen_US
dc.typediplomová prácecs_CZ
dcterms.created2024
dcterms.dateAccepted2024-06-04
dc.description.departmentDepartment of Cell Biologyen_US
dc.description.departmentKatedra buněčné biologiecs_CZ
dc.description.facultyPřírodovědecká fakultacs_CZ
dc.description.facultyFaculty of Scienceen_US
dc.identifier.repId253476
dc.title.translatedMining nových terpen syntáz z rozsáhlých databázícs_CZ
dc.contributor.refereeŠtáfková, Jitka
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineBioinformaticsen_US
thesis.degree.disciplineBioinformatikacs_CZ
thesis.degree.programBioinformaticsen_US
thesis.degree.programBioinformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csPřírodovědecká fakulta::Katedra buněčné biologiecs_CZ
uk.taxonomy.organization-enFaculty of Science::Department of Cell Biologyen_US
uk.faculty-name.csPřírodovědecká fakultacs_CZ
uk.faculty-name.enFaculty of Scienceen_US
uk.faculty-abbr.csPřFcs_CZ
uk.degree-discipline.csBioinformatikacs_CZ
uk.degree-discipline.enBioinformaticsen_US
uk.degree-program.csBioinformatikacs_CZ
uk.degree-program.enBioinformaticsen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTerpeny a terpenoidy představují největší a strukturně nejrozmanitější skupinu přírodních látek s využitím v mnoha oborech, včetně farmaceutického průmyslu. Tyto molekuly jsou v přírodě syntetizovány enzymy známými jako terpen syntázy. V této práci byla provedena bioinformatická analýza kurátorované databáze obsahující všech 1125 experimentálně charakterizovaných terpen syntáz se zaměřením na identifikaci vzorců v délkách sekvencí a doménových architekturách těchto enzymů napříč různými říšemi života. Na základě poznatků této analýzy byl proveden sekvenčně založený mining s cílem identifikovat možné nové terpen syntázy. S využitím téměř 5,5 miliard proteinových sekvencí z různých rozsáhlých sekvenčních databází vedl mining k identifikaci více než 600 tisíc potenciálních terpen syntáz. Tyto potenciální terpen syntázy pocházejí převážně z bakterií a metagenomů, tedy ze zdrojů, které byly historicky méně zkoumány. Výsledný dataset, doplněný fylogenetickým stromem, sítí sekvenční podobnosti a dvěma skóre prioritizace, nabízí cenný zdroj pro objevování nových terpenů. Klíčová slova: terpen syntáza, TPS, mining, Pfam, SUPERFAMILY, doména, terpencs_CZ
uk.abstract.enTerpenes and terpenoids represent the largest and most structurally diverse group of natural products, with applications across many fields, including the pharmaceutical industry. These molecules are synthesized in nature by enzymes known as terpene synthases. This thesis conducted a bioinformatic analysis of a curated database containing all 1125 experimentally characterized terpene synthases, focusing on identifying patterns in sequence lengths and domain architectures of these enzymes across different kingdoms of life. Based on this analysis's knowledge, sequence-guided mining was conducted to identify possible new terpene synthases. Using nearly 5.5 billion protein sequences from various large-scale sequence repositories, the mining resulted in the identification of more than 600 thousand putative terpene synthases. These putative terpene synthases mainly originate from Bacteria and metagenomes, sources that had historically been less explored. The resulting dataset, accompanied by a phylogenetic tree, sequence similarity network, and two prioritization scores, offers a valuable resource for the discovery of novel terpenes. Keywords: terpene synthase, TPS, mining, Pfam, SUPERFAMILY, domain, terpeneen_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Přírodovědecká fakulta, Katedra buněčné biologiecs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV