Evolutionary Algorithms for Multi-Stage Transcriptomic Data Analysis
Evoluční algoritmy pro analýzu multi-stage transkriptomických dat
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/193428Identifiers
Study Information System: 269204
Collections
- Kvalifikační práce [11216]
Author
Advisor
Consultant
Drost, Hajk-Georg
Referee
Kolář, Michal
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science - Artificial Intelligence
Department
Department of Theoretical Computer Science and Mathematical Logic
Date of defense
10. 9. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Excellent
Keywords (Czech)
vyvojová transkriptomika|genomická fylogenetická stratigrafie|evoluční algorithmy|vícekriteriální optimalizaceKeywords (English)
developmental transcriptomics|genomic phylostratigraphy|evolution- ary algorithms|multi-objective optimizationIdentifikace genů, které se podílejí na vývoji jedince, je problém, kde experimentální a in-silico metody často selhávají. V této práci se na vývoj díváme z pohledu multifázových transkriptomických dat a genomické fylogenetické stratigrafie a snažíme se identifikovat malou sadu genů, které formují pattern indexu věku transkriptomu (TAI) napříč vývo- jovými stádii. Za tímto účelem jsme vyvinuli genetický algoritmus GATAI založený na více kriteriální optimalizaci a modelu ostrovů. Analýzou identifikovaných sad genů ukazu- jeme, že náš algoritmus skutečně dokázal identifikovat geny zapojené do vývoje. Dále jsme náš genetický algoritmus zobecnili tak, aby byl schopen vybrat minimální podmnožinu libovolné sady prvků a optimalizovat uživatelsky definovanou sadu fitness funkcí.
Uncovering genes that are involved in development has proven to be a problem, where experimental and in-silico methods often fall short. In this work, we look at development from the perspective of multi-stage transcriptomic data and genomic phylostratigraphy and try to identify a small set of genes that shape the transcriptome age index (TAI) pattern over the developmental stages. For this purpose, we develop a multi-objective island model genetic algorithm GATAI. By exploring the identified gene sets, we show that our algorithm was indeed able to identify genes involved in development. We further generalize our genetic algorithm, to be able to select a minimal subset of a any set of elements, optimizing user defined set of fitness functions.