dc.contributor.advisor | Hajič, Jan | |
dc.creator | Backo, Patrik | |
dc.date.accessioned | 2024-11-28T13:59:06Z | |
dc.date.available | 2024-11-28T13:59:06Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/192871 | |
dc.description.abstract | V této práci jsme navrhli nástroj pro interaktivní generování vzorků pro jednotlivé údery bicích nástrojů (one-shot samples) pomocí variačních autoenkodérů (VAE), v kontextu produkce elektronické hudby. Prozkoumali jsme reprezentace používané pro úlohu generování zvuku a vybrali dvě nejlépe vyhovující. Dále jsme sesbírali vlastní datovou sadu téměř 16,000 volně dostupných vzorků, které jsme setřídili do 9 kategorií bicích nástrojů. Sérií pokusů jsme pak došli k modelu, který rekonstruuje a generuje vzorky s postačující kvalitou, ačkoliv stále obsahují jeden šumový artefakt. Na základě pokusů s PCA a konvexními kombinacemi jsme zjistili, že natrénovaný latentní prostor má interpretovatelnou a tedy ovladatelnou topologii. | cs_CZ |
dc.description.abstract | In this thesis, we designed an interactive generative tool based on the Variational Autoencoder (VAE) to synthesise new and interesting drum one-shot samples for electronic music production. We researched audio representations used in audio generation tasks and selected two that suited our settings the best. Furthermore, we created our own dataset of almost 16,000 freely available samples organised into 9 drum categories. Through a series of experiments, we were able to achieve a model that was reconstructing and generating quality samples; however, they contained a specific noise artefact we could not get rid of. Based on the results of PCA and convex combinations methods we found out that the latent space has "meaningful" properties. | en_US |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | machine learning|music generation|electronic music | en_US |
dc.subject | strojové učení|generování hudby|elektronická hudba | cs_CZ |
dc.title | Generating Drum Kit Samples using Machine Learning | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-09-05 | |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 261624 | |
dc.title.translated | Generování vzorků bicích souprav pomocí strojového učení | cs_CZ |
dc.contributor.referee | Helcl, Jindřich | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Computer Science with specialisation in Artificial Intelligence | en_US |
thesis.degree.discipline | Informatika se specializací Umělá inteligence | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika se specializací Umělá inteligence | cs_CZ |
uk.degree-discipline.en | Computer Science with specialisation in Artificial Intelligence | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | V této práci jsme navrhli nástroj pro interaktivní generování vzorků pro jednotlivé údery bicích nástrojů (one-shot samples) pomocí variačních autoenkodérů (VAE), v kontextu produkce elektronické hudby. Prozkoumali jsme reprezentace používané pro úlohu generování zvuku a vybrali dvě nejlépe vyhovující. Dále jsme sesbírali vlastní datovou sadu téměř 16,000 volně dostupných vzorků, které jsme setřídili do 9 kategorií bicích nástrojů. Sérií pokusů jsme pak došli k modelu, který rekonstruuje a generuje vzorky s postačující kvalitou, ačkoliv stále obsahují jeden šumový artefakt. Na základě pokusů s PCA a konvexními kombinacemi jsme zjistili, že natrénovaný latentní prostor má interpretovatelnou a tedy ovladatelnou topologii. | cs_CZ |
uk.abstract.en | In this thesis, we designed an interactive generative tool based on the Variational Autoencoder (VAE) to synthesise new and interesting drum one-shot samples for electronic music production. We researched audio representations used in audio generation tasks and selected two that suited our settings the best. Furthermore, we created our own dataset of almost 16,000 freely available samples organised into 9 drum categories. Through a series of experiments, we were able to achieve a model that was reconstructing and generating quality samples; however, they contained a specific noise artefact we could not get rid of. Based on the results of PCA and convex combinations methods we found out that the latent space has "meaningful" properties. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |