CSV file validator according to the CSV on the Web W3C recommendations
Validátor CSV souborů dle W3C doporučení CSV on the Web
diploma thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/188510Identifiers
Study Information System: 200083
Collections
- Kvalifikační práce [11326]
Author
Advisor
Referee
Svoboda, Martin
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Computer Science - Software and Data Engineering
Department
Department of Software Engineering
Date of defense
14. 2. 2024
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
English
Grade
Good
Keywords (Czech)
CSV|JSON-LD|W3C|web|validátor|OTAVAKeywords (English)
CSV|JSON-LD|W3C|web|validator|OTAVAFormát comma-separated values (CSV) je populárním formátem pro tabulková data na webu. Tento formát ukládá tabulky dat velmi jednoduchým textovým způsobem, ale ukládá jen hodnoty tabulky bez jejich významu a struktury. Uživatelé tabulky musí odstranit nejednoznačnost a hádat přesný význam dat. Standard CSV on the Web poskytuje doporučení pro metadata o CSV tabulkách na webu. Metadata mohou pop- sat CSV tabulku, její strukturu a význam jejích hodnot v JSON-LD formátu. Tento standard umožňuje tvůrci tabulky odstranit nejednoznačnost, zvýšit jistotu a vytvořit důvěru. Máme CSV tabulky spolu s jejich metadatovými popisy v JSON-LD a každá tabulka by se měla shodovat se svým konkrétním popisem. V této práci vyvíjíme validátor CSV souborů. Tento validátor je počítačový program, který zkontroluje, zda se tabulky skutečně shodují se svými popisy. Validátor přečte tabulku s jejím popisem, porovná je a vyhledá nesrovnalosti. Tento text popisuje proces vývoje a jeho výsledek.
The comma-separated values (CSV) format is a popular format for tabular data on the web. It stores tables of data in a very simple textual way, but it stores only the values of the table without their meaning and structure. Users of a table must remove the ambiguity and guess the exact meaning of data. The standard called CSV on the Web provides recommendations for metadata about CSV tables on the web. The metadata can describe a CSV table, its structure, and the meaning of its values in the JSON-LD format. The standard allows a creator of a table to remove ambiguity, increase certainty, and create confidence. There are CSV tables together with their JSON-LD metadata descriptions, and each table should match its particular description. In this thesis, we develop a CSV file validator. The validator is a computer program which checks whether tables actually match their metadata descriptions. It reads a table with its description, compares them, and searches for discrepancies. This text describes the development process and its result.