dc.contributor.advisor | Novák, Václav | |
dc.creator | Dubovský, Jakub | |
dc.date.accessioned | 2017-04-20T13:24:40Z | |
dc.date.available | 2017-04-20T13:24:40Z | |
dc.date.issued | 2009 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/26828 | |
dc.description.abstract | Hľadanie užitočných kombinácií rysov a šablón rysov je netriviálna úloha. Kombinácie sú však hodnotným nástrojom pri zvyšovaní úspešnosti strojového učenia. V tejto práci je navrhovaný postup, ktorý by sám hľadal užitočné kombinácie kategoriálnych rysov a ich šablón. Proces hľadania bol zverený metódam simulovaného žíhania a upravenému genetickému algoritmu. Súčasťou je návrh funkcie, ktorá hodnotí kvalitu kategoriálnej šablóny. Kombinujú sa samostatne šablóny, rysy a tiež obe spoločne. Najlepšie zlepšenia nájdené navrhnutým postupom sú približne 0.1 percentného bodu. Pokusy prebiehali na dvoch datasetoch. Navrhnutý postup je teda potrebné testovať na ďalších dátach, aby sa overila všeobecná použiteľnosť. Pokusy však naznačujú, že by sa mohlo jednať o základ použiteľného algoritmu. Súčasťou práce je jednoduchá aplikácia, ktorá bola navrhnutá a používaná na vykonávanie experimentov. | cs_CZ |
dc.description.abstract | Searching for useful combinations of features and feature templates is not a simple task. Though combination is valuable tool for increasing accuracy of machine learning. This paper tries to suggest an algorithm for automatic search for useful combinations of categorical features and their templates. An attempt to use simulated annealing and modified genetic algorithm for search process is studied. Construction of evaluation function for assessing categorical feature template is present as well. Features and feature templates are combined separately and together. The best increase of accuracy reached by suggested procedures on datasets used is around 0.1 percentage points. Experiments were made just on two datasets. Thus further testing of algorithm on other datasets is needed to verify its usefulness in general. However experiments indicate that it can be considered as a base of usable algorithm. Simple command-line application is part of work. It was developed and used for experimentation. | en_US |
dc.language | Čeština | cs_CZ |
dc.language.iso | cs_CZ | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.title | Automatické kombinace rysů a šablon rysů | cs_CZ |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2009 | |
dcterms.dateAccepted | 2009-09-14 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 62809 | |
dc.title.translated | Automatic combinations of feature templates | en_US |
dc.contributor.referee | Vidová Hladká, Barbora | |
dc.identifier.aleph | 001222727 | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Obecná informatika | cs_CZ |
thesis.degree.discipline | General Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
thesis.degree.program | Computer Science | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Obecná informatika | cs_CZ |
uk.degree-discipline.en | General Computer Science | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Velmi dobře | cs_CZ |
thesis.grade.en | Very good | en_US |
uk.abstract.cs | Hľadanie užitočných kombinácií rysov a šablón rysov je netriviálna úloha. Kombinácie sú však hodnotným nástrojom pri zvyšovaní úspešnosti strojového učenia. V tejto práci je navrhovaný postup, ktorý by sám hľadal užitočné kombinácie kategoriálnych rysov a ich šablón. Proces hľadania bol zverený metódam simulovaného žíhania a upravenému genetickému algoritmu. Súčasťou je návrh funkcie, ktorá hodnotí kvalitu kategoriálnej šablóny. Kombinujú sa samostatne šablóny, rysy a tiež obe spoločne. Najlepšie zlepšenia nájdené navrhnutým postupom sú približne 0.1 percentného bodu. Pokusy prebiehali na dvoch datasetoch. Navrhnutý postup je teda potrebné testovať na ďalších dátach, aby sa overila všeobecná použiteľnosť. Pokusy však naznačujú, že by sa mohlo jednať o základ použiteľného algoritmu. Súčasťou práce je jednoduchá aplikácia, ktorá bola navrhnutá a používaná na vykonávanie experimentov. | cs_CZ |
uk.abstract.en | Searching for useful combinations of features and feature templates is not a simple task. Though combination is valuable tool for increasing accuracy of machine learning. This paper tries to suggest an algorithm for automatic search for useful combinations of categorical features and their templates. An attempt to use simulated annealing and modified genetic algorithm for search process is studied. Construction of evaluation function for assessing categorical feature template is present as well. Features and feature templates are combined separately and together. The best increase of accuracy reached by suggested procedures on datasets used is around 0.1 percentage points. Experiments were made just on two datasets. Thus further testing of algorithm on other datasets is needed to verify its usefulness in general. However experiments indicate that it can be considered as a base of usable algorithm. Simple command-line application is part of work. It was developed and used for experimentation. | en_US |
uk.file-availability | V | |
uk.publication.place | Praha | cs_CZ |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
dc.identifier.lisID | 990012227270106986 | |