Tematické modelování publikační činnosti České akademie věd a umění v letech 1890-1910
Topic modelling of the publication activities of the Czech Academy of Sciences and Arts in the years 1890-1910
diploma thesis (DEFENDED)
![Document thumbnail](/bitstream/handle/20.500.11956/188370/thumbnail.png?sequence=8&isAllowed=y)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/188370Identifiers
Study Information System: 251025
Collections
- Kvalifikační práce [23779]
Author
Advisor
Referee
Jarolímková, Adéla
Faculty / Institute
Faculty of Arts
Discipline
Information, media and book culture
Department
Institute of Information Studies and Librarianship
Date of defense
29. 1. 2024
Publisher
Univerzita Karlova, Filozofická fakultaLanguage
Czech
Grade
Excellent
Keywords (Czech)
České akademie císaře Františka Josefa pro vědy|slovesnost a umění|tematické modelování|LDA|digital humanitiesKeywords (English)
Czech Academy of Emperor Franz Joseph for Science|Literature and Arts|topic modelling|LDA|digital humanitiesCílem diplomové práce je podat na základě strojové analýzy publikační činnosti České akademie císaře Františka Josefa pro vědy, slovesnost a umění přehled témat, která byla předmětem bádání této instituce v letech 1890-1910. Práce tak doplňuje a rozšiřuje dosavadní stav poznání této problematiky, který se dosud omezoval na analýzy konkrétních publikací, oborů nebo vědních tříd akademie, ale nedovoloval pohled na oblasti zájmu akademie jako celku. Úvodní část práce představuje kontext vzniku České akademie, shrnuje dosavadní stav poznání témat, kterým se její badatelé věnovali a popisuje, jak lze digitalizované tištěné publikace akademie využít pro analýzu pomocí komputačních metod v rámci digitálních humanitních věd. Ve výzkumné části byly za účelem dosažení stanoveného cíle získány z Digitální knihovny Akademie věd ČR digitalizované svazky vědeckého časopisu Rozpravy, který představoval stěžejní publikační platformu všech tří vědeckých tříd České akademie. Získaná data byla upravena pomocí volně dostupných nástrojů a použita jako vstup pro tematické modelování provedené metodou LDA (Latentní Dirichletova alokace). Výsledkem práce je ucelený přehled 35 konkrétních témat, kterým se Česká akademie na počátku svého vzniku věnovala. Jsou popsány počty publikací spadajících do jednotlivých témat a...
The aim of the thesis is to present an overview of topics that were the subject of research of the Czech Academy from 1890 to 1910 using computational analysis of its publications. The work complements and extends the existing state of knowledge in this subject area, which has so far been limited to analyses of specific publications, fields of study or scientific classes of the Academy, but did not allow a view of the areas of interest of the Academy as a whole. The introductory part of the thesis presents the context of the Academy's founding, summarizes the current state of understanding of the topics that Academy scholars have addressed and describes how the Academy's digitized publications can be used for analysis using computational methods within the digital humanities. In the research part, digitized issues of the scholarly journal Rozpravy, which represented the core publication platform of the Czech Academy, were obtained from the Digital Library of the Czech Academy of Sciences. The obtained data were processed using freely available tools and used as input for topic modelling using the LDA (Latent Dirichlet Allocation) method. The result of the thesis is a comprehensive overview of 35 specific topics that the Czech Academy addressed in the first twenty years of its existence. It...