Postprocessing syntetických notopisů v kontextu jejich rozpoznávání
Postprocessing of Synthetic Sheet Music in the Context of Optical Music Recognition
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/192815Identifiers
Study Information System: 269412
Collections
- Kvalifikační práce [11244]
Author
Advisor
Referee
Hajič, Jan
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science with specialisation in Artificial Intelligence
Department
Institute of Formal and Applied Linguistics
Date of defense
5. 9. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Keywords (Czech)
optické rozpoznávání notopisů|syntéza dat|hluboké učeníKeywords (English)
optical music recognition|data synthesis|deep learningTato práce se zaměřuje na vylepšení metod syntézy trénovacích dat pro úlohu Optical Music Recognition (OMR). Práce se soustředí na vytváření realistických barevných a degradovaných obrázků not (postprocessing). Tato degradovaná data vznikají ze syntetických čistě černo-bílých obrázků. Po aplikaci postprocessingových metod notopisy věrně napodobují fyzické dokumenty, čímž zlepšují kvalitu trénovacích dat pro OMR modely. Navržené postprocessingové metody byly testovány na úloze object detection, neboli na rozpoznávání jednotlivých typů různých hudebních symbolů. Experimenty prokázaly, že všechny navržené metody pozitivně ovlivňují výsledný OMR model, přičemž největší přínos má generování syntetického pozadí notopisů.
This work focuses on improving training data synthesis methods for the Optical Music Recognition (OMR) task. The study concentrates on creating realistic, colored, and degraded images of musical scores (postprocessing). These degraded data are generated from synthetic, purely black-and-white images. After applying postprocessing methods, the musical scores closely mimic physical documents, thereby enhancing the quality of training data for OMR models. The proposed postprocessing methods were tested on object detection tasks, specifically recognizing various types of musical symbols. Experiments demonstrated that all proposed methods positively impact the resulting OMR model, with the greatest benefit coming from the generation of synthetic backgrounds for musical scores.