dc.contributor.advisor | Duintjer Tebbens, Erik Jurjen | |
dc.creator | Athanasiadis, Savvas | |
dc.date.accessioned | 2017-05-27T13:02:08Z | |
dc.date.available | 2017-05-27T13:02:08Z | |
dc.date.issued | 2015 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/70410 | |
dc.description.abstract | Univerzita Karlova v Praze Farmaceutická fakulta v Hradci Králové Katedra biofyziky a fyzikální chemie Kandidát: Savvas Athanasiadis Školitel: Jurjen Duintjer Tebbens Název diplomové práce: The small sample size problem in gene expression tasks Práce se zabývá klasifikací genů do nádorových typů na základě je- jich genových expresí. Počet proměnných (aminokyselin), které mají být zk- oumány, je typicky velmi vysoký (v tisících), zatímco je drahé a časově náročné analyzovat velký počet genů; obvykle maximálně desítky z nich jsou k dispozici. Kombinace malého počtu vzorku s velkým počtem proměnných činí standardní metody statistické klasifikace nevhodnými. Práce se zaměřuje na modifikaci klasické metody klasifikace, Fisherova lineární diskriminační analýza, pro případ, kde počet vzorků je menší než počet proměnných. Navrhuje zlepšenou strategii pro testování této modi- fikace a to metodou křížové validace typu leave-one-out. Pomocí aktualizace zúčastněných kovariančních matic s maticemi nízké hodností, lze dosáhnout řádové snížení výpočetních nákladů v metodě křížové validace. Požadavky na paměť jsou též sníženy. | cs_CZ |
dc.description.abstract | Charles University in Prague Faculty of Pharmacy in Hradec Králové Department of Biophysics and Physical Chemistry Candidate: Savvas Athanasiadis Supervisor: Jurjen Duintjer Tebbens Title of diploma thesis: The small sample size problem in gene expression tasks The thesis addresses classification of genes to tumor types based on their gene expression signatures. The number of variables (amino-acids) to be inves- tigated is typically very high (in the thousands) while it is expensive and time- consuming to analyze a high number of genes; usually at most tens of them are available. The combination of a small sample size with a large number of variables makes standard statistical classification methods inappropriate. The thesis focuses on a modification of a standard classification method, Fisher's linear discriminant analysis, for the case where the number of samples is smaller than the number of variables. It proposes an improved strategy to test this modified method with leave-one-out cross validation. Using so- called low rank updates of the involved covariance matrices, the computational costs of the cross validation process can be reduced by an order of magnitude. Memory demands are reduced as well. | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Farmaceutická fakulta v Hradci Králové | cs_CZ |
dc.title | The small sample size problem in gene expression tasks | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2015 | |
dcterms.dateAccepted | 2015-06-02 | |
dc.description.department | Department of Biophysics and Physical Chemistry | en_US |
dc.description.department | Katedra biofyziky a fyzikální chemie | cs_CZ |
dc.description.faculty | Farmaceutická fakulta v Hradci Králové | cs_CZ |
dc.description.faculty | Faculty of Pharmacy in Hradec Králové | en_US |
dc.identifier.repId | 141476 | |
dc.contributor.referee | Kalina, Jan | |
dc.identifier.aleph | 002003714 | |
thesis.degree.name | Mgr. | |
thesis.degree.level | magisterské | cs_CZ |
thesis.degree.discipline | Farmacie | cs_CZ |
thesis.degree.discipline | Pharmacy | en_US |
thesis.degree.program | Farmacie | cs_CZ |
thesis.degree.program | Pharmacy | en_US |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Farmaceutická fakulta v Hradci Králové::Katedra biofyziky a fyzikální chemie | cs_CZ |
uk.taxonomy.organization-en | Faculty of Pharmacy in Hradec Králové::Department of Biophysics and Physical Chemistry | en_US |
uk.faculty-name.cs | Farmaceutická fakulta v Hradci Králové | cs_CZ |
uk.faculty-name.en | Faculty of Pharmacy in Hradec Králové | en_US |
uk.faculty-abbr.cs | FaF | cs_CZ |
uk.degree-discipline.cs | Farmacie | cs_CZ |
uk.degree-discipline.en | Pharmacy | en_US |
uk.degree-program.cs | Farmacie | cs_CZ |
uk.degree-program.en | Pharmacy | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Univerzita Karlova v Praze Farmaceutická fakulta v Hradci Králové Katedra biofyziky a fyzikální chemie Kandidát: Savvas Athanasiadis Školitel: Jurjen Duintjer Tebbens Název diplomové práce: The small sample size problem in gene expression tasks Práce se zabývá klasifikací genů do nádorových typů na základě je- jich genových expresí. Počet proměnných (aminokyselin), které mají být zk- oumány, je typicky velmi vysoký (v tisících), zatímco je drahé a časově náročné analyzovat velký počet genů; obvykle maximálně desítky z nich jsou k dispozici. Kombinace malého počtu vzorku s velkým počtem proměnných činí standardní metody statistické klasifikace nevhodnými. Práce se zaměřuje na modifikaci klasické metody klasifikace, Fisherova lineární diskriminační analýza, pro případ, kde počet vzorků je menší než počet proměnných. Navrhuje zlepšenou strategii pro testování této modi- fikace a to metodou křížové validace typu leave-one-out. Pomocí aktualizace zúčastněných kovariančních matic s maticemi nízké hodností, lze dosáhnout řádové snížení výpočetních nákladů v metodě křížové validace. Požadavky na paměť jsou též sníženy. | cs_CZ |
uk.abstract.en | Charles University in Prague Faculty of Pharmacy in Hradec Králové Department of Biophysics and Physical Chemistry Candidate: Savvas Athanasiadis Supervisor: Jurjen Duintjer Tebbens Title of diploma thesis: The small sample size problem in gene expression tasks The thesis addresses classification of genes to tumor types based on their gene expression signatures. The number of variables (amino-acids) to be inves- tigated is typically very high (in the thousands) while it is expensive and time- consuming to analyze a high number of genes; usually at most tens of them are available. The combination of a small sample size with a large number of variables makes standard statistical classification methods inappropriate. The thesis focuses on a modification of a standard classification method, Fisher's linear discriminant analysis, for the case where the number of samples is smaller than the number of variables. It proposes an improved strategy to test this modified method with leave-one-out cross validation. Using so- called low rank updates of the involved covariance matrices, the computational costs of the cross validation process can be reduced by an order of magnitude. Memory demands are reduced as well. | en_US |
uk.file-availability | V | |
uk.publication.place | Hradec Králové | cs_CZ |
uk.grantor | Univerzita Karlova, Farmaceutická fakulta v Hradci Králové, Katedra biofyziky a fyzikální chemie | cs_CZ |
dc.identifier.lisID | 990020037140106986 | |