dc.contributor.advisor | Šivic, Josef | |
dc.creator | Cífka, Martin | |
dc.date.accessioned | 2024-04-08T09:50:18Z | |
dc.date.available | 2024-04-08T09:50:18Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/188520 | |
dc.description.abstract | The 6D pose estimation is an important computer vision task with applications in robotics, e.g. for manipulation or grasping, but also in computer graphics and augmented reality. Given an image, the task is to estimate the 3D rotation and 3D translation of the known object with respect to the camera. The task is even more challenging in an uncontrolled environment, e.g. when we do not have proper camera calibration. In that case, the focal length also needs to be estimated with the 6D pose. In this work, we address the issues of methods that work in such uncontrolled environments. First, we focus on FocalPose, a state-of-the-art method for joint estimation of object 6D pose and camera focal length. We review the method and propose several improve- ments. These include (i) re-deriving and improving the 6D pose and focal length update rule, (ii) replacing the model retrieval method, and (iii) changing the distribution of 6D poses and focal lengths used for synthetic training data rendering. These changes lead to improved results compared to the state-of-the-art FocalPose method. Second, to avoid often costly retraining of models for 6D pose estaimation, it is ben- eficial to consider methods with the ability to generalize to novel objects that have not been seen during training. These methods require a 2D... | en_US |
dc.description.abstract | Odhad 6D polohy objektů je důležitou úlohou počítačového vidění s možným vyu- žitím například při robotické manipulaci, ale také v počítačové grafice a augmentované realitě. Cílem je odhadnout polohu známého objektu relativně vůči kameře, tedy 3D rotaci a 3D translaci, ze vstupního obrazu. Tento problém je ještě komplikovanější v ne- kontrolovaném prostředí, například v situacích, kdy neznáme správnou kalibraci kamery. V takovém případě je také nutné odhadnout ohniskovou vzdálenost kamery spolu s 6D polohou objektu. V této práci se věnujeme problémům metod pracujících v takových nekontrolovaných prostředích. V první části se konkrétně zaměřujeme na metodu FocalPose - state-of-the-art me- todu pro odhad 6D polohy objektu a ohniskové vzdálenosti kamery. Tuto metodu nejprve shrnujeme a poté navrhujeme několik vylepšení. Mezi ně patří: (i) odvození a vylepšení vzorce pro aktualizaci 6D polohy a ohniskové vzdálenosti, (ii) nahrazení metody pro vy- hledávání objektů v databázi 3D modelů, a (iii) změna distribuce 6D poloh a ohniskových vzdáleností používaných pro generování syntetických trénovacích dat. Tyto změny vedou k lepším výsledkům v porovnání s metodou FocalPose. Nevýhodou metod pro odhadování 6D poloh objektů je výpočetně velmi náročné tré- nování. Vyhnout se přetrénovávání pro nové objekty je možné s... | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Matematicko-fyzikální fakulta | cs_CZ |
dc.subject | Počítačové vidění|Odhad 6D polohy|Nekalibrovaná kamera|Detekce nových objektů|Vizuální rozpoznávání|Hluboké učení | cs_CZ |
dc.subject | Computer vision|6D pose estimation|Uncalibrated camera|Novel object detection|Visual recognition|Deep learning | en_US |
dc.title | 6D pose estimation of objects in images | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-02-14 | |
dc.description.department | Department of Software and Computer Science Education | en_US |
dc.description.department | Katedra softwaru a výuky informatiky | cs_CZ |
dc.description.faculty | Faculty of Mathematics and Physics | en_US |
dc.description.faculty | Matematicko-fyzikální fakulta | cs_CZ |
dc.identifier.repId | 262953 | |
dc.title.translated | Odhad 6D polohy objektů v obrazech | cs_CZ |
dc.contributor.referee | Šikudová, Elena | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Computer Science - Visual Computing and Game Development | en_US |
thesis.degree.discipline | Informatika - Vizuální výpočty a vývoj počítačových her | cs_CZ |
thesis.degree.program | Computer Science - Visual Computing and Game Development | en_US |
thesis.degree.program | Informatika - Vizuální výpočty a vývoj počítačových her | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Matematicko-fyzikální fakulta::Katedra softwaru a výuky informatiky | cs_CZ |
uk.taxonomy.organization-en | Faculty of Mathematics and Physics::Department of Software and Computer Science Education | en_US |
uk.faculty-name.cs | Matematicko-fyzikální fakulta | cs_CZ |
uk.faculty-name.en | Faculty of Mathematics and Physics | en_US |
uk.faculty-abbr.cs | MFF | cs_CZ |
uk.degree-discipline.cs | Informatika - Vizuální výpočty a vývoj počítačových her | cs_CZ |
uk.degree-discipline.en | Computer Science - Visual Computing and Game Development | en_US |
uk.degree-program.cs | Informatika - Vizuální výpočty a vývoj počítačových her | cs_CZ |
uk.degree-program.en | Computer Science - Visual Computing and Game Development | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Odhad 6D polohy objektů je důležitou úlohou počítačového vidění s možným vyu- žitím například při robotické manipulaci, ale také v počítačové grafice a augmentované realitě. Cílem je odhadnout polohu známého objektu relativně vůči kameře, tedy 3D rotaci a 3D translaci, ze vstupního obrazu. Tento problém je ještě komplikovanější v ne- kontrolovaném prostředí, například v situacích, kdy neznáme správnou kalibraci kamery. V takovém případě je také nutné odhadnout ohniskovou vzdálenost kamery spolu s 6D polohou objektu. V této práci se věnujeme problémům metod pracujících v takových nekontrolovaných prostředích. V první části se konkrétně zaměřujeme na metodu FocalPose - state-of-the-art me- todu pro odhad 6D polohy objektu a ohniskové vzdálenosti kamery. Tuto metodu nejprve shrnujeme a poté navrhujeme několik vylepšení. Mezi ně patří: (i) odvození a vylepšení vzorce pro aktualizaci 6D polohy a ohniskové vzdálenosti, (ii) nahrazení metody pro vy- hledávání objektů v databázi 3D modelů, a (iii) změna distribuce 6D poloh a ohniskových vzdáleností používaných pro generování syntetických trénovacích dat. Tyto změny vedou k lepším výsledkům v porovnání s metodou FocalPose. Nevýhodou metod pro odhadování 6D poloh objektů je výpočetně velmi náročné tré- nování. Vyhnout se přetrénovávání pro nové objekty je možné s... | cs_CZ |
uk.abstract.en | The 6D pose estimation is an important computer vision task with applications in robotics, e.g. for manipulation or grasping, but also in computer graphics and augmented reality. Given an image, the task is to estimate the 3D rotation and 3D translation of the known object with respect to the camera. The task is even more challenging in an uncontrolled environment, e.g. when we do not have proper camera calibration. In that case, the focal length also needs to be estimated with the 6D pose. In this work, we address the issues of methods that work in such uncontrolled environments. First, we focus on FocalPose, a state-of-the-art method for joint estimation of object 6D pose and camera focal length. We review the method and propose several improve- ments. These include (i) re-deriving and improving the 6D pose and focal length update rule, (ii) replacing the model retrieval method, and (iii) changing the distribution of 6D poses and focal lengths used for synthetic training data rendering. These changes lead to improved results compared to the state-of-the-art FocalPose method. Second, to avoid often costly retraining of models for 6D pose estaimation, it is ben- eficial to consider methods with the ability to generalize to novel objects that have not been seen during training. These methods require a 2D... | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Matematicko-fyzikální fakulta, Katedra softwaru a výuky informatiky | cs_CZ |
thesis.grade.code | 1 | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |