Zobrazit minimální záznam

Web Information Extraction
dc.contributor.advisorGalamboš, Leo
dc.creatorPekárek, Filip
dc.date.accessioned2017-04-27T11:15:49Z
dc.date.available2017-04-27T11:15:49Z
dc.date.issued2010
dc.identifier.urihttp://hdl.handle.net/20.500.11956/35916
dc.description.abstractV předložené práci navrhujeme a testujeme nový postup extrakce faktů z webu. Předložená metoda bere v úvahu, včetně DOM stromu webové stránky, také její vizuální podobu. Základem a první částí je extrakce sémantických částí stránky pomocí algoritmu VIPS. Dalším krokem je ověření a případná úprava získaných dat na základě lokálního kontextu. Finální částí je pomocí získaných a případně upravených faktů klasifikovat analyzované webové stránky do předem definovaných kategorií. Určování tříd probíhá prostřednictvím množiny posuzovatelů implementovaných v konfiguraci definovatelnými instancemi neuronových sítí.cs_CZ
dc.description.abstractIn the present work we suggest and test new process of web information extraction. Proposed method consider DOM tree of the web page including it's visual cues. Basic and the rst part is semantic parts extraction of a page using VIPS algorithm. Next step is validation and eventual modication of gained information based on the local context. Final part is classication of analyzing page into predened classes using got facts. Set of critics implemented by congurable instances of neural networks determine the classes.en_US
dc.languageČeštinacs_CZ
dc.language.isocs_CZ
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectwebcs_CZ
dc.subjectextrakcecs_CZ
dc.subjectfaktacs_CZ
dc.subjectvizuálnícs_CZ
dc.subjectDOMcs_CZ
dc.subjectVIPScs_CZ
dc.subjectweben_US
dc.subjectextractionen_US
dc.subjectfactsen_US
dc.subjectvisualen_US
dc.subjectDOMen_US
dc.subjectVIPSen_US
dc.titleExtrakce faktů z Webucs_CZ
dc.typediplomová prácecs_CZ
dcterms.created2010
dcterms.dateAccepted2010-09-06
dc.description.departmentDepartment of Software Engineeringen_US
dc.description.departmentKatedra softwarového inženýrstvícs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.identifier.repId64977
dc.title.translatedWeb Information Extractionen_US
dc.contributor.refereeKopecký, Michal
dc.identifier.aleph001295437
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineSoftware Systemsen_US
thesis.degree.disciplineSoftwarové systémycs_CZ
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Katedra softwarového inženýrstvícs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Department of Software Engineeringen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csSoftwarové systémycs_CZ
uk.degree-discipline.enSoftware Systemsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVelmi dobřecs_CZ
thesis.grade.enVery gooden_US
uk.abstract.csV předložené práci navrhujeme a testujeme nový postup extrakce faktů z webu. Předložená metoda bere v úvahu, včetně DOM stromu webové stránky, také její vizuální podobu. Základem a první částí je extrakce sémantických částí stránky pomocí algoritmu VIPS. Dalším krokem je ověření a případná úprava získaných dat na základě lokálního kontextu. Finální částí je pomocí získaných a případně upravených faktů klasifikovat analyzované webové stránky do předem definovaných kategorií. Určování tříd probíhá prostřednictvím množiny posuzovatelů implementovaných v konfiguraci definovatelnými instancemi neuronových sítí.cs_CZ
uk.abstract.enIn the present work we suggest and test new process of web information extraction. Proposed method consider DOM tree of the web page including it's visual cues. Basic and the rst part is semantic parts extraction of a page using VIPS algorithm. Next step is validation and eventual modication of gained information based on the local context. Final part is classication of analyzing page into predened classes using got facts. Set of critics implemented by congurable instances of neural networks determine the classes.en_US
uk.file-availabilityV
uk.publication.placePrahacs_CZ
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Katedra softwarového inženýrstvícs_CZ
dc.identifier.lisID990012954370106986


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV