Zobrazit minimální záznam

Information extraction from aviation incident reports
Extrakce informací z reportů o leteckých incidentech
dc.contributor.advisorRosa, Rudolf
dc.creatorBujko, Viktor
dc.date.accessioned2025-02-06T11:37:45Z
dc.date.available2025-02-06T11:37:45Z
dc.date.issued2022
dc.identifier.urihttp://hdl.handle.net/20.500.11956/196376
dc.description.abstractThe reporting of aviation incidents using summary reports is one of the important factors contributing to aviation safety. However, the constantly increasing number of reports and the necessity to process them manually requires the deployment of tools that help to speed up, simplify and automate their analysis. To achieve mentioned goals, in this thesis, we have developed avisaf, a tool that extracts information through named entity recognition and report classification. In the first task, we define our own named entity types and evaluate the success rates of different recognition methods against manually recognized entities. Despite less accurate identification compared to manual recognition, we can use named entities to get some ideas about the report structure. We further represent the structure of the reports using four trained classifiers that assign classes describing various aspects of the incidents. Given the nature and difficulty of the task, we create the classifiers experimentally, by comparing various classification algorithms and several report representations as well as by modifying report distributions to better balance sample classes. 1en_US
dc.description.abstractNahlasovanie leteckých incidentov pomocou súhrnných správ - reportov je jedným z dôležitých faktorov majúcich zásluhu na bezpečnosti letectva. Neustále rastúce množ- stvo reportov a nutnosť ich manuálneho spracovania však vyžadujú nasadenie nástrojov, ktoré analýzu pomôžu urýchliť, zjednodušiť a automatizovať. V tejto práci sme na dosia- hnutie spomenutých cieľov vytvorili nástroj avisaf, ktorý prostredníctvom rozpoznávania pomenovaných entít a klasifikácie reportov extrahuje rôzne druhy informácií. V rámci prvej úlohy definujeme vlastné kategórie pomenovaných entít a vyhodnocujeme úspeš- nosti rôznych metód rozpoznávania v porovnaní s manuálne rozpoznanými entitami. Aj napriek menej presnej identifikácii v porovnaní s manuálnym rozpoznávaním dokážeme pomenovanými entitami získať určitú predstavu o štruktúre reportu. Štruktúru reportov ďalej reprezentujeme štyrmi vytvorenými klasifikátormi, ktoré reportom prideľujú prislú- chajúce triedy popisujúce rôzne aspekty incidentov. Vzhľadom na povahu a náročnosť úlohy vytvárame klasifikátory experimentálne, a to porovnaním rôznych klasifikačných algoritmov, rôznych vstupných reprezentácií reportov ako aj modifikáciou ich distribúcie pre lepšie vyváženie vzorových tried. 1cs_CZ
dc.languageSlovenčinacs_CZ
dc.language.isosk_SK
dc.publisherUniverzita Karlova, Matematicko-fyzikální fakultacs_CZ
dc.subjectzpracování přirozeného jazyka|extrakce informací|rozpoznávání pojmenovaných entit|klasifikace textu|bezpečnost letectvacs_CZ
dc.subjectnatural language processing|information extraction|named entity recognition|text classification|aviation safetyen_US
dc.titleExtrakcia informácií z reportov o leteckých incidentochsk_SK
dc.typebakalářská prácecs_CZ
dcterms.created2022
dcterms.dateAccepted2022-09-12
dc.description.departmentÚstav formální a aplikované lingvistikycs_CZ
dc.description.departmentInstitute of Formal and Applied Linguisticsen_US
dc.description.facultyMatematicko-fyzikální fakultacs_CZ
dc.description.facultyFaculty of Mathematics and Physicsen_US
dc.identifier.repId235074
dc.title.translatedInformation extraction from aviation incident reportsen_US
dc.title.translatedExtrakce informací z reportů o leteckých incidentechcs_CZ
dc.contributor.refereeNovák, Michal
thesis.degree.nameBc.
thesis.degree.levelbakalářskécs_CZ
thesis.degree.disciplineProgramming and Software Systemsen_US
thesis.degree.disciplineProgramování a softwarové systémycs_CZ
thesis.degree.programComputer Scienceen_US
thesis.degree.programInformatikacs_CZ
uk.thesis.typebakalářská prácecs_CZ
uk.taxonomy.organization-csMatematicko-fyzikální fakulta::Ústav formální a aplikované lingvistikycs_CZ
uk.taxonomy.organization-enFaculty of Mathematics and Physics::Institute of Formal and Applied Linguisticsen_US
uk.faculty-name.csMatematicko-fyzikální fakultacs_CZ
uk.faculty-name.enFaculty of Mathematics and Physicsen_US
uk.faculty-abbr.csMFFcs_CZ
uk.degree-discipline.csProgramování a softwarové systémycs_CZ
uk.degree-discipline.enProgramming and Software Systemsen_US
uk.degree-program.csInformatikacs_CZ
uk.degree-program.enComputer Scienceen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csNahlasovanie leteckých incidentov pomocou súhrnných správ - reportov je jedným z dôležitých faktorov majúcich zásluhu na bezpečnosti letectva. Neustále rastúce množ- stvo reportov a nutnosť ich manuálneho spracovania však vyžadujú nasadenie nástrojov, ktoré analýzu pomôžu urýchliť, zjednodušiť a automatizovať. V tejto práci sme na dosia- hnutie spomenutých cieľov vytvorili nástroj avisaf, ktorý prostredníctvom rozpoznávania pomenovaných entít a klasifikácie reportov extrahuje rôzne druhy informácií. V rámci prvej úlohy definujeme vlastné kategórie pomenovaných entít a vyhodnocujeme úspeš- nosti rôznych metód rozpoznávania v porovnaní s manuálne rozpoznanými entitami. Aj napriek menej presnej identifikácii v porovnaní s manuálnym rozpoznávaním dokážeme pomenovanými entitami získať určitú predstavu o štruktúre reportu. Štruktúru reportov ďalej reprezentujeme štyrmi vytvorenými klasifikátormi, ktoré reportom prideľujú prislú- chajúce triedy popisujúce rôzne aspekty incidentov. Vzhľadom na povahu a náročnosť úlohy vytvárame klasifikátory experimentálne, a to porovnaním rôznych klasifikačných algoritmov, rôznych vstupných reprezentácií reportov ako aj modifikáciou ich distribúcie pre lepšie vyváženie vzorových tried. 1cs_CZ
uk.abstract.enThe reporting of aviation incidents using summary reports is one of the important factors contributing to aviation safety. However, the constantly increasing number of reports and the necessity to process them manually requires the deployment of tools that help to speed up, simplify and automate their analysis. To achieve mentioned goals, in this thesis, we have developed avisaf, a tool that extracts information through named entity recognition and report classification. In the first task, we define our own named entity types and evaluate the success rates of different recognition methods against manually recognized entities. Despite less accurate identification compared to manual recognition, we can use named entities to get some ideas about the report structure. We further represent the structure of the reports using four trained classifiers that assign classes describing various aspects of the incidents. Given the nature and difficulty of the task, we create the classifiers experimentally, by comparing various classification algorithms and several report representations as well as by modifying report distributions to better balance sample classes. 1en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Matematicko-fyzikální fakulta, Ústav formální a aplikované lingvistikycs_CZ
thesis.grade.code1
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV