Dotazování databází a webu
Query databases and web
diploma thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/9954Identifiers
Study Information System: 43087
Collections
- Kvalifikační práce [11244]
Author
Advisor
Referee
Galamboš, Leo
Faculty / Institute
Faculty of Mathematics and Physics
Discipline
Data Engineering
Department
Department of Software Engineering
Date of defense
21. 5. 2007
Publisher
Univerzita Karlova, Matematicko-fyzikální fakultaLanguage
Czech
Grade
Good
Databáze a web jsou dvě prostředí, kde se nejvíce používá vyhledávání. Navíc v řešení mnoha problémů čerpá jedna skupina vývojářů od druhé. Ve většině projektů ale oba zdroje informací zůstávají stále odděleny a současné čerpání dat z obou je spíše vyjímkou. Tato práce se věnuje zapojení webových vyhledávačů přímo do SQL dotazů. Kromě částečného zmapování prací spojujících obě tématiky se zde věnujeme i technickým aspektům propojení včetně metody asynchronní iterace. Jádro práce však spočívá v realizaci tří funkcí volajících vyhledávač a zároveň vhodných k využití v dotazech. Vybranými funkcemi jsou www_rank, která k výrazu vrací jeho důležitost, dále pak www_near, která ke dvěma výrazům vrací hodnotu znařící míru vzájemné souvislosti, a konečně agregační funkce www_best_address, která k množině výrazů vrátí jejich společný nejlepší odkaz. K tomuto účelu byl vybrán databázový server Oracle 10g a internetový vyhledávač Jyxo.cz.
Databases and web are two environments, where searching is used the most. In addition one group of developers draw on the experience of the other one in solving a lot of problems. In majority of projects, both sources of information stay isolated and synchronous convey from both is rather exception. This dissertation follow integration of internet searchers directly into SQL queries. Besides partly analysing papers connecting both subjects, it describes technical aspects of this connection, including method of asynchronous iteration. The gist of this paper lay in realization of three functions, which call web searcher and at the same are suited for use in DB queries. Selected functions are www_rank, which returns relevancy of phrase, then it is www_near, which returns relative relationship of two phrases and the last one is agregation function www_best_address, which returns the best common link for group of phrases. For this purpose we chose database server Oracle 10g and Jyxo.cz web searcher.