Zobrazit minimální záznam

dc.contributor.advisorDuintjer Tebbens, Erik Jurjen
dc.creatorAthanasiadis, Savvas
dc.date.accessioned2017-05-27T13:02:08Z
dc.date.available2017-05-27T13:02:08Z
dc.date.issued2015
dc.identifier.urihttp://hdl.handle.net/20.500.11956/70410
dc.description.abstractUniverzita Karlova v Praze Farmaceutická fakulta v Hradci Králové Katedra biofyziky a fyzikální chemie Kandidát: Savvas Athanasiadis Školitel: Jurjen Duintjer Tebbens Název diplomové práce: The small sample size problem in gene expression tasks Práce se zabývá klasifikací genů do nádorových typů na základě je- jich genových expresí. Počet proměnných (aminokyselin), které mají být zk- oumány, je typicky velmi vysoký (v tisících), zatímco je drahé a časově náročné analyzovat velký počet genů; obvykle maximálně desítky z nich jsou k dispozici. Kombinace malého počtu vzorku s velkým počtem proměnných činí standardní metody statistické klasifikace nevhodnými. Práce se zaměřuje na modifikaci klasické metody klasifikace, Fisherova lineární diskriminační analýza, pro případ, kde počet vzorků je menší než počet proměnných. Navrhuje zlepšenou strategii pro testování této modi- fikace a to metodou křížové validace typu leave-one-out. Pomocí aktualizace zúčastněných kovariančních matic s maticemi nízké hodností, lze dosáhnout řádové snížení výpočetních nákladů v metodě křížové validace. Požadavky na paměť jsou též sníženy.cs_CZ
dc.description.abstractCharles University in Prague Faculty of Pharmacy in Hradec Králové Department of Biophysics and Physical Chemistry Candidate: Savvas Athanasiadis Supervisor: Jurjen Duintjer Tebbens Title of diploma thesis: The small sample size problem in gene expression tasks The thesis addresses classification of genes to tumor types based on their gene expression signatures. The number of variables (amino-acids) to be inves- tigated is typically very high (in the thousands) while it is expensive and time- consuming to analyze a high number of genes; usually at most tens of them are available. The combination of a small sample size with a large number of variables makes standard statistical classification methods inappropriate. The thesis focuses on a modification of a standard classification method, Fisher's linear discriminant analysis, for the case where the number of samples is smaller than the number of variables. It proposes an improved strategy to test this modified method with leave-one-out cross validation. Using so- called low rank updates of the involved covariance matrices, the computational costs of the cross validation process can be reduced by an order of magnitude. Memory demands are reduced as well.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Farmaceutická fakulta v Hradci Královécs_CZ
dc.titleThe small sample size problem in gene expression tasksen_US
dc.typediplomová prácecs_CZ
dcterms.created2015
dcterms.dateAccepted2015-06-02
dc.description.departmentDepartment of Biophysics and Physical Chemistryen_US
dc.description.departmentKatedra biofyziky a fyzikální chemiecs_CZ
dc.description.facultyFarmaceutická fakulta v Hradci Královécs_CZ
dc.description.facultyFaculty of Pharmacy in Hradec Královéen_US
dc.identifier.repId141476
dc.contributor.refereeKalina, Jan
dc.identifier.aleph002003714
thesis.degree.nameMgr.
thesis.degree.levelmagisterskécs_CZ
thesis.degree.disciplineFarmaciecs_CZ
thesis.degree.disciplinePharmacyen_US
thesis.degree.programFarmaciecs_CZ
thesis.degree.programPharmacyen_US
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csFarmaceutická fakulta v Hradci Králové::Katedra biofyziky a fyzikální chemiecs_CZ
uk.taxonomy.organization-enFaculty of Pharmacy in Hradec Králové::Department of Biophysics and Physical Chemistryen_US
uk.faculty-name.csFarmaceutická fakulta v Hradci Královécs_CZ
uk.faculty-name.enFaculty of Pharmacy in Hradec Královéen_US
uk.faculty-abbr.csFaFcs_CZ
uk.degree-discipline.csFarmaciecs_CZ
uk.degree-discipline.enPharmacyen_US
uk.degree-program.csFarmaciecs_CZ
uk.degree-program.enPharmacyen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csUniverzita Karlova v Praze Farmaceutická fakulta v Hradci Králové Katedra biofyziky a fyzikální chemie Kandidát: Savvas Athanasiadis Školitel: Jurjen Duintjer Tebbens Název diplomové práce: The small sample size problem in gene expression tasks Práce se zabývá klasifikací genů do nádorových typů na základě je- jich genových expresí. Počet proměnných (aminokyselin), které mají být zk- oumány, je typicky velmi vysoký (v tisících), zatímco je drahé a časově náročné analyzovat velký počet genů; obvykle maximálně desítky z nich jsou k dispozici. Kombinace malého počtu vzorku s velkým počtem proměnných činí standardní metody statistické klasifikace nevhodnými. Práce se zaměřuje na modifikaci klasické metody klasifikace, Fisherova lineární diskriminační analýza, pro případ, kde počet vzorků je menší než počet proměnných. Navrhuje zlepšenou strategii pro testování této modi- fikace a to metodou křížové validace typu leave-one-out. Pomocí aktualizace zúčastněných kovariančních matic s maticemi nízké hodností, lze dosáhnout řádové snížení výpočetních nákladů v metodě křížové validace. Požadavky na paměť jsou též sníženy.cs_CZ
uk.abstract.enCharles University in Prague Faculty of Pharmacy in Hradec Králové Department of Biophysics and Physical Chemistry Candidate: Savvas Athanasiadis Supervisor: Jurjen Duintjer Tebbens Title of diploma thesis: The small sample size problem in gene expression tasks The thesis addresses classification of genes to tumor types based on their gene expression signatures. The number of variables (amino-acids) to be inves- tigated is typically very high (in the thousands) while it is expensive and time- consuming to analyze a high number of genes; usually at most tens of them are available. The combination of a small sample size with a large number of variables makes standard statistical classification methods inappropriate. The thesis focuses on a modification of a standard classification method, Fisher's linear discriminant analysis, for the case where the number of samples is smaller than the number of variables. It proposes an improved strategy to test this modified method with leave-one-out cross validation. Using so- called low rank updates of the involved covariance matrices, the computational costs of the cross validation process can be reduced by an order of magnitude. Memory demands are reduced as well.en_US
uk.file-availabilityV
uk.publication.placeHradec Královécs_CZ
uk.grantorUniverzita Karlova, Farmaceutická fakulta v Hradci Králové, Katedra biofyziky a fyzikální chemiecs_CZ
dc.identifier.lisID990020037140106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV