Porovnávání cen v internetových obchodech
Comparing Prices in Internet Shops
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/14851/thumbnail.png?sequence=7&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/14851Identifiers
Study Information System: 50855
Collections
- Kvalifikační práce [11264]
Author
Advisor
Referee
Semecký, Jiří
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Software systems
Department
Institute of Formal and Applied Linguistics
Date of defense
26. 5. 2008
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Very good
Tato práce se zabývá problémy systémů pro porovnávání cen v internetových obchodech. Zaměřuje se na metody automatické extrakce dat z webových stránek a metody klasifikace takto získaných dat. Je navrženo a implementováno několik algoritmů pro řešení těchto úloh. Navržen je i nový algoritmus automatické extrakce dat založený na metodách strojového učení s učitelem. Implementované metody jsou vyzkoušeny na testovacích datech a jsou nalezeny vhodné parametry použitých algoritmů.
This work deals with problems of comparison shopping engines. It focuses on methods for automatic data extraction from web pages and methods for classification of the extracted data. Several algorithms for solving these problems are proposed and implemented. Also a new algorithm for automatic data extraction based on supervised machine learning techniques is proposed. Implemented methods are evaluated on a test data set and suitable parameters for the tested algorithms are found.