Postprocessing syntetických notopisů v kontextu jejich rozpoznávání
Postprocessing of Synthetic Sheet Music in the Context of Optical Music Recognition
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/192815Identifikátory
SIS: 269412
Kolekce
- Kvalifikační práce [11244]
Autor
Vedoucí práce
Oponent práce
Hajič, Jan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Umělá inteligence
Katedra / ústav / klinika
Ústav formální a aplikované lingvistiky
Datum obhajoby
5. 9. 2024
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Velmi dobře
Klíčová slova (česky)
optické rozpoznávání notopisů|syntéza dat|hluboké učeníKlíčová slova (anglicky)
optical music recognition|data synthesis|deep learningTato práce se zaměřuje na vylepšení metod syntézy trénovacích dat pro úlohu Optical Music Recognition (OMR). Práce se soustředí na vytváření realistických barevných a degradovaných obrázků not (postprocessing). Tato degradovaná data vznikají ze syntetických čistě černo-bílých obrázků. Po aplikaci postprocessingových metod notopisy věrně napodobují fyzické dokumenty, čímž zlepšují kvalitu trénovacích dat pro OMR modely. Navržené postprocessingové metody byly testovány na úloze object detection, neboli na rozpoznávání jednotlivých typů různých hudebních symbolů. Experimenty prokázaly, že všechny navržené metody pozitivně ovlivňují výsledný OMR model, přičemž největší přínos má generování syntetického pozadí notopisů.
This work focuses on improving training data synthesis methods for the Optical Music Recognition (OMR) task. The study concentrates on creating realistic, colored, and degraded images of musical scores (postprocessing). These degraded data are generated from synthetic, purely black-and-white images. After applying postprocessing methods, the musical scores closely mimic physical documents, thereby enhancing the quality of training data for OMR models. The proposed postprocessing methods were tested on object detection tasks, specifically recognizing various types of musical symbols. Experiments demonstrated that all proposed methods positively impact the resulting OMR model, with the greatest benefit coming from the generation of synthetic backgrounds for musical scores.