Podpora rozpoznávání matematických vzorců v rámci OCR systému
Optical Formula Recognition support as a part of the OCR system
Podpora rozpoznávání matematických vzorců v rámci OCR systému
diplomová práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/49221/thumbnail.png?sequence=8&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/49221Identifikátory
SIS: 104939
Kolekce
- Kvalifikační práce [11267]
Autor
Vedoucí práce
Oponent práce
Vácha, Pavel
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
5. 9. 2011
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Slovenština
Známka
Výborně
Klíčová slova (česky)
rozpoznávanie matematických vzorcov, rozpoznávanie symbolov, podporné vektory, Kohonenova mapaKlíčová slova (anglicky)
mathematical formula recognition, symbol recognition, support vector machines, Kohonen's mapCieľom tejto práce je implementovať prevod naskenovaného matematického vzorca do editovateľnej podoby vo forme TEX súboru ako doplnok fungujúceho OCR systému. V práci sa venujeme podrobnej analýze tohto problému, jeho rozloženiu na niekoľko menších častí, ako rozpoznanie symbolov a rozpoznanie štruktúry vzorcu, ich riešeniu a taktiež popisujeme rôzne spôsoby riešenia. Úspešnosť našich implementácií týchto častí overujeme na nami vytvorenej databáze symbolov a vzorcov. Podstatnou časťou práce je aj vytvorenie sady komplexných aplikácií s prepracovaným grafickým rozhraním, ktoré umožnia jednoduché prispôsobenie konverzie potrebám užívateľa. Obrázky obsahujúce vzorce môžu obsahovať jemný šum spôsobený nekvalitou skeneru.
The aim of this work is to implement a conversion from the scanned math formula to the editable form as a TEX file as an extension of the working OCR system. In this work we closely analyze this problem, its division into several smaller parts, such as math symbol recognition and a recognition of structure of math formulas, and their solutions together with a description of various solutions. We test our implementations using our database of symbols and math formulas. An important part of the work is also a creation of a set of complex applications with a sophisticated graphical user interface, which allow easy accommodation of conversion to the user's needs. During the conversion we work with images, which may contain insignificant noise caused by a scanner of lower quality.