Dolování dat z webu
Webmining
diplomová práce (OBHÁJENO)
![Náhled dokumentu](/bitstream/handle/20.500.11956/9947/thumbnail.png?sequence=7&isAllowed=y)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/9947Identifikátory
SIS: 41193
Kolekce
- Kvalifikační práce [11264]
Autor
Vedoucí práce
Oponent práce
Húsek, Dušan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Softwarové systémy
Katedra / ústav / klinika
Katedra softwarového inženýrství
Datum obhajoby
21. 5. 2007
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Čeština
Známka
Výborně
Tato práce se soustředí na zmapování současných poznatků v oblasti dolování dat z webu s důrazem na shlukování dokumentů. Nejpodrobněji je zkoumán algoritmus projektivního shlukování DOC, je uvedena jeho modifikace pro data s váženými dimenzemi. Algoritmus je aplikován při shlukování výsledků webového vyhledávače. Součástí práce je implementace Javovského shlukovacího balíčku s rozhraním pro vyhledávač Google a s nástrojem pro hodnocení kvality frází.
This thesis focuses on mapping latest knowledge in the area of web mining with emphasis on document clustering. Most attention is given to the DOC projective clustering algorithm, a modification is presented for data with weighted dimensions. Algorithm is used for web search engine result clustering. Also, a clustering package with Google interface and phrase evaluation tool is implemented.