Evolutionary Algorithms for Multi-Stage Transcriptomic Data Analysis
Evoluční algoritmy pro analýzu multi-stage transkriptomických dat
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/193428Identifikátory
SIS: 269204
Kolekce
- Kvalifikační práce [11216]
Autor
Vedoucí práce
Konzultant práce
Drost, Hajk-Georg
Oponent práce
Kolář, Michal
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika - Umělá inteligence
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
10. 9. 2024
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
vyvojová transkriptomika|genomická fylogenetická stratigrafie|evoluční algorithmy|vícekriteriální optimalizaceKlíčová slova (anglicky)
developmental transcriptomics|genomic phylostratigraphy|evolution- ary algorithms|multi-objective optimizationIdentifikace genů, které se podílejí na vývoji jedince, je problém, kde experimentální a in-silico metody často selhávají. V této práci se na vývoj díváme z pohledu multifázových transkriptomických dat a genomické fylogenetické stratigrafie a snažíme se identifikovat malou sadu genů, které formují pattern indexu věku transkriptomu (TAI) napříč vývo- jovými stádii. Za tímto účelem jsme vyvinuli genetický algoritmus GATAI založený na více kriteriální optimalizaci a modelu ostrovů. Analýzou identifikovaných sad genů ukazu- jeme, že náš algoritmus skutečně dokázal identifikovat geny zapojené do vývoje. Dále jsme náš genetický algoritmus zobecnili tak, aby byl schopen vybrat minimální podmnožinu libovolné sady prvků a optimalizovat uživatelsky definovanou sadu fitness funkcí.
Uncovering genes that are involved in development has proven to be a problem, where experimental and in-silico methods often fall short. In this work, we look at development from the perspective of multi-stage transcriptomic data and genomic phylostratigraphy and try to identify a small set of genes that shape the transcriptome age index (TAI) pattern over the developmental stages. For this purpose, we develop a multi-objective island model genetic algorithm GATAI. By exploring the identified gene sets, we show that our algorithm was indeed able to identify genes involved in development. We further generalize our genetic algorithm, to be able to select a minimal subset of a any set of elements, optimizing user defined set of fitness functions.