Zobrazit minimální záznam

Generování vzorků bicích souprav pomocí strojového učení
dc.contributor.advisorHajič, Jan
dc.creatorBacko, Patrik
dc.date.accessioned2024-11-28T13:59:06Z
dc.date.available2024-11-28T13:59:06Z
dc.date.issued2024
dc.identifier.urihttp://hdl.handle.net/20.500.11956/192871
dc.description.abstractV této práci jsme navrhli nástroj pro interaktivní generování vzorků pro jednotlivé údery bicích nástrojů (one-shot samples) pomocí variačních autoenkodérů (VAE), v kontextu produkce elektronické hudby. Prozkoumali jsme reprezentace používané pro úlohu generování zvuku a vybrali dvě nejlépe vyhovující. Dále jsme sesbírali vlastní datovou sadu téměř 16,000 volně dostupných vzorků, které jsme setřídili do 9 kategorií bicích nástrojů. Sérií pokusů jsme pak došli k modelu, který rekonstruuje a generuje vzorky s postačující kvalitou, ačkoliv stále obsahují jeden šumový artefakt. Na základě pokusů s PCA a konvexními kombinacemi jsme zjistili, že natrénovaný latentní prostor má interpretovatelnou a tedy ovladatelnou topologii.cs_CZ
dc.description.abstractIn this thesis, we designed an interactive generative tool based on the Variational Autoencoder (VAE) to synthesise new and interesting drum one-shot samples for electronic music production. We researched audio representations used in audio generation tasks and selected two that suited our settings the best. Furthermore, we created our own dataset of almost 16,000 freely available samples organised into 9 drum categories. Through a series of experiments, we were able to achieve a model that was reconstructing and generating quality samples; however, they contained a specific noise artefact we could not get rid of. Based on the results of PCA and convex combinations methods we found out that the latent space has "meaningful" properties.en_US
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectmachine learning|music generation|electronic musicen_US
dc.subjectstrojové učení|generování hudby|elektronická hudbacs_CZ
dc.titleGenerating Drum Kit Samples using Machine Learningen_US
dc.typebakalářská prácecs_CZ
dcterms.created2024
dcterms.dateAccepted2024-09-05
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId261624
dc.title.translatedGenerování vzorků bicích souprav pomocí strojového učenícs_CZ
dc.contributor.refereeHelcl, Jindřich
thesis.degree.nameBc.
thesis.degree.levelbakalářskécs_CZ
thesis.degree.disciplineComputer Science with specialisation in Artificial Intelligenceen_US
thesis.degree.disciplineInformatika se specializací Umělá inteligencecs_CZ
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csInformatika se specializací Umělá inteligencecs_CZ
uk.degree-discipline.enComputer Science with specialisation in Artificial Intelligenceen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csV této práci jsme navrhli nástroj pro interaktivní generování vzorků pro jednotlivé údery bicích nástrojů (one-shot samples) pomocí variačních autoenkodérů (VAE), v kontextu produkce elektronické hudby. Prozkoumali jsme reprezentace používané pro úlohu generování zvuku a vybrali dvě nejlépe vyhovující. Dále jsme sesbírali vlastní datovou sadu téměř 16,000 volně dostupných vzorků, které jsme setřídili do 9 kategorií bicích nástrojů. Sérií pokusů jsme pak došli k modelu, který rekonstruuje a generuje vzorky s postačující kvalitou, ačkoliv stále obsahují jeden šumový artefakt. Na základě pokusů s PCA a konvexními kombinacemi jsme zjistili, že natrénovaný latentní prostor má interpretovatelnou a tedy ovladatelnou topologii.cs_CZ
uk.abstract.enIn this thesis, we designed an interactive generative tool based on the Variational Autoencoder (VAE) to synthesise new and interesting drum one-shot samples for electronic music production. We researched audio representations used in audio generation tasks and selected two that suited our settings the best. Furthermore, we created our own dataset of almost 16,000 freely available samples organised into 9 drum categories. Through a series of experiments, we were able to achieve a model that was reconstructing and generating quality samples; however, they contained a specific noise artefact we could not get rid of. Based on the results of PCA and convex combinations methods we found out that the latent space has "meaningful" properties.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV