dc.contributor.advisor | Rosa, Rudolf | |
dc.creator | Bujko, Viktor | |
dc.date.accessioned | 2025-02-06T11:37:45Z | |
dc.date.available | 2025-02-06T11:37:45Z | |
dc.date.issued | 2022 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/196376 | |
dc.description.abstract | The reporting of aviation incidents using summary reports is one of the important factors contributing to aviation safety. However, the constantly increasing number of reports and the necessity to process them manually requires the deployment of tools that help to speed up, simplify and automate their analysis. To achieve mentioned goals, in this thesis, we have developed avisaf, a tool that extracts information through named entity recognition and report classification. In the first task, we define our own named entity types and evaluate the success rates of different recognition methods against manually recognized entities. Despite less accurate identification compared to manual recognition, we can use named entities to get some ideas about the report structure. We further represent the structure of the reports using four trained classifiers that assign classes describing various aspects of the incidents. Given the nature and difficulty of the task, we create the classifiers experimentally, by comparing various classification algorithms and several report representations as well as by modifying report distributions to better balance sample classes. 1 | en_US |
dc.description.abstract | Nahlasovanie leteckých incidentov pomocou súhrnných správ - reportov je jedným z dôležitých faktorov majúcich zásluhu na bezpečnosti letectva. Neustále rastúce množ- stvo reportov a nutnosť ich manuálneho spracovania však vyžadujú nasadenie nástrojov, ktoré analýzu pomôžu urýchliť, zjednodušiť a automatizovať. V tejto práci sme na dosia- hnutie spomenutých cieľov vytvorili nástroj avisaf, ktorý prostredníctvom rozpoznávania pomenovaných entít a klasifikácie reportov extrahuje rôzne druhy informácií. V rámci prvej úlohy definujeme vlastné kategórie pomenovaných entít a vyhodnocujeme úspeš- nosti rôznych metód rozpoznávania v porovnaní s manuálne rozpoznanými entitami. Aj napriek menej presnej identifikácii v porovnaní s manuálnym rozpoznávaním dokážeme pomenovanými entitami získať určitú predstavu o štruktúre reportu. Štruktúru reportov ďalej reprezentujeme štyrmi vytvorenými klasifikátormi, ktoré reportom prideľujú prislú- chajúce triedy popisujúce rôzne aspekty incidentov. Vzhľadom na povahu a náročnosť úlohy vytvárame klasifikátory experimentálne, a to porovnaním rôznych klasifikačných algoritmov, rôznych vstupných reprezentácií reportov ako aj modifikáciou ich distribúcie pre lepšie vyváženie vzorových tried. 1 | cs_CZ |
dc.language | Slovenčina | cs_CZ |
dc.language.iso | sk_SK | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | zpracování přirozeného jazyka|extrakce informací|rozpoznávání pojmenovaných entit|klasifikace textu|bezpečnost letectva | cs_CZ |
dc.subject | natural language processing|information extraction|named entity recognition|text classification|aviation safety | en_US |
dc.title | Extrakcia informácií z reportov o leteckých incidentoch | sk_SK |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2022 | |
dcterms.dateAccepted | 2022-09-12 | |
dc.description.department | Ústav formální a aplikované lingvistiky | cs_CZ |
dc.description.department | Institute of Formal and Applied Linguistics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.identifier.repId | 235074 | |
dc.title.translated | Information extraction from aviation incident reports | en_US |
dc.title.translated | Extrakce informací z reportů o leteckých incidentech | cs_CZ |
dc.contributor.referee | Novák, Michal | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Programming and Software Systems | en_US |
thesis.degree.discipline | Programování a softwarové systémy | cs_CZ |
thesis.degree.program | Computer Science | en_US |
thesis.degree.program | Informatika | cs_CZ |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Ústav formální a aplikované lingvistiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Institute of Formal and Applied Linguistics | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Programování a softwarové systémy | cs_CZ |
uk.degree-discipline.en | Programming and Software Systems | en_US |
uk.degree-program.cs | Informatika | cs_CZ |
uk.degree-program.en | Computer Science | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Nahlasovanie leteckých incidentov pomocou súhrnných správ - reportov je jedným z dôležitých faktorov majúcich zásluhu na bezpečnosti letectva. Neustále rastúce množ- stvo reportov a nutnosť ich manuálneho spracovania však vyžadujú nasadenie nástrojov, ktoré analýzu pomôžu urýchliť, zjednodušiť a automatizovať. V tejto práci sme na dosia- hnutie spomenutých cieľov vytvorili nástroj avisaf, ktorý prostredníctvom rozpoznávania pomenovaných entít a klasifikácie reportov extrahuje rôzne druhy informácií. V rámci prvej úlohy definujeme vlastné kategórie pomenovaných entít a vyhodnocujeme úspeš- nosti rôznych metód rozpoznávania v porovnaní s manuálne rozpoznanými entitami. Aj napriek menej presnej identifikácii v porovnaní s manuálnym rozpoznávaním dokážeme pomenovanými entitami získať určitú predstavu o štruktúre reportu. Štruktúru reportov ďalej reprezentujeme štyrmi vytvorenými klasifikátormi, ktoré reportom prideľujú prislú- chajúce triedy popisujúce rôzne aspekty incidentov. Vzhľadom na povahu a náročnosť úlohy vytvárame klasifikátory experimentálne, a to porovnaním rôznych klasifikačných algoritmov, rôznych vstupných reprezentácií reportov ako aj modifikáciou ich distribúcie pre lepšie vyváženie vzorových tried. 1 | cs_CZ |
uk.abstract.en | The reporting of aviation incidents using summary reports is one of the important factors contributing to aviation safety. However, the constantly increasing number of reports and the necessity to process them manually requires the deployment of tools that help to speed up, simplify and automate their analysis. To achieve mentioned goals, in this thesis, we have developed avisaf, a tool that extracts information through named entity recognition and report classification. In the first task, we define our own named entity types and evaluate the success rates of different recognition methods against manually recognized entities. Despite less accurate identification compared to manual recognition, we can use named entities to get some ideas about the report structure. We further represent the structure of the reports using four trained classifiers that assign classes describing various aspects of the incidents. Given the nature and difficulty of the task, we create the classifiers experimentally, by comparing various classification algorithms and several report representations as well as by modifying report distributions to better balance sample classes. 1 | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |