Multiple sequence alignment pomocí genetických algoritmů
Multiple sequence alignment using genetic algorithms
diplomová práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/39812/thumbnail.png?sequence=8&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/39812Identifikátory
SIS: 111584
Kolekce
- Kvalifikační práce [11266]
Autor
Vedoucí práce
Oponent práce
Pešková, Klára
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Teoretická informatika
Katedra / ústav / klinika
Katedra softwaru a výuky informatiky
Datum obhajoby
21. 5. 2012
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Klíčová slova (česky)
sequence alignment, genetický algoritmus, motifKlíčová slova (anglicky)
sequence alignment, genetic algorithm, motifNázev práce: Multiple sequence alignment pomocí genetických algoritmů Autor: Zdeněk Pátek Katedra: Kabinet software a výuky informatiky Vedoucí diplomové práce: RNDr. František Mráz, CSc. Abstrakt: Tato práce se zabývá problémem multiple sequence alignment (MSA). Obsahuje návrh metody MSAMS, která umožňuje vyhledat motify v biologických sekvencích, rozštěpit sekvence do bloků podle těchto motifů, vyřešit MSA na blocích a nakonec složit globální alignment ze zarovnaných bloků a nalezených motifů. Hledání motifů i řešení MSA se provádí pomocí genetických algoritmů. Práce dále popisuje implementaci metody MSAMS ve stejnojmenném programu, nastavení jeho parametrů, testování na databázi BAliBASE a porovnání s programem ClustalW. Experimentální výsledky ukázaly, že MSAMS dokáže najít lepší alignmenty než ClustalW. Klíčová slova: multiple sequence alignment, hledání motifů, genetické algoritmy, ClustalW
Title: Multiple sequence alignment using genetic algorithms Author: Zdeněk Pátek Department: Department of Software and Computer Science Education Supervisor: RNDr. František Mráz, CSc. Abstract: The thesis adresses the problem of multiple sequence alignment (MSA). It contains the specication of the proposed method MSAMS that allows to find motifs in biological sequences, to split sequences to blocks using the motifs, to solve MSA on the blocks and nally to assemble the global alignment from the aligned blocks and motifs. Motif search and MSA are both solved using genetic algorithms. The thesis describes the implementation of the method, conguration of its settings, benchmarking on the BAliBASE database and comparison to the ClustalW program. Experimental results showed that MSAMS can discover better alignments than ClustalW. Keywords: multiple sequence alignment, motif nding, genetic algorithms, ClustalW