Paralelní XML parsing
Parallel XML parsing
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/26957Identifiers
Study Information System: 49328
Collections
- Kvalifikační práce [11266]
Author
Advisor
Referee
Bednárek, David
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software Systems
Department
Department of Software Engineering
Date of defense
2. 2. 2010
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Excellent
Předložená práce popisuje analýzu a postup konstrukce paralelního parseru využívajícího potenciálu vícejádrových procesorů (CPU). Paralelismus je založen na rozdělení XML dokumentu v libovolných místech na části, které jsou následně zpracovány jednotlivými jádry CPU. Součástí práce je také implementace popsaného algoritmu. Kvalita algoritmu byla experimentálně testována na stroji s 16 jádry. Testy potvrzují výbornou škálovatelnost navrženého algoritmu. V závěru práce je navrženo rozšíření algoritmu pro zpracovaní dokumentů s XML jmennými prostory.
This thesis describes an analysis and a method of construction of a parallel parser exploiting an advantage of multi-core CPU. The parallelism is based on splitting of an XML document on arbitrary parts, which are then parsed by the cores of CPU. A part of this work is also implementation of the algorithm. Further, the quality of the algorithm was experimentally tested on a computer with 16 cores in its CPUs. The tests con rmed excellent scalability of the algorithm. At the end, an enhancement of the algorithm on parsing XML documents with XML namespaces is also suggested.