Creating Adversarial Examples in Machine Learning

Červíčková, Věra

Vytváření matoucích vzorů ve strojovém učení

rigorózní práce (UZNÁNO)

Zobrazit/otevřít

Záznam o průběhu obhajoby (51.74Kb)

Trvalý odkaz

http://hdl.handle.net/20.500.11956/186967

Identifikátory

SIS: 261030

Fakulta / součást

Matematicko-fyzikální fakulta

Obor

Teoretická informatika

Katedra / ústav / klinika

Katedra teoretické informatiky a matematické logiky

Datum obhajoby

8. 11. 2023

Nakladatel

Univerzita Karlova, Matematicko-fyzikální fakulta

Jazyk

Angličtina

Známka

Uznáno

Klíčová slova (česky)

Nepřátelské vzory|Hluboké učení|Klasifikace obrazu|Evoluční algoritmy

Klíčová slova (anglicky)

Adversarial examples|{Deep Learning}|{Image classification}|{Evolutionary Algorithms

Tato práce zkoumá nepřátelské vzory ve strojovém učení, konkrétně v oboru klasifikace obrazu. Nejmodernější modely hlubokého učení dokáží rozpoznat vzory lépe než člověk. Nicméně pokud k obrazům přidáme vhodně zvolený šum, můžeme výrazně snížit přesnost daných modelů. Tato práce zkoumá různé metody útoků i obran proti nepřátelským vzorům. Jednu ze současným obran jsme si vybrali, abychom navrhli útok, který ji porazí. Náš útok využívá evoluční algoritmy. Výsledky našich experimentů ukazují, že nepřátelské vzory vytvořené evolucí a vzory vytvořené se znalostí gradientu se výrazně liší. V neposlední řadě zkoumáme, jak jsou naše nepřátelské vstupy přenositelné mezi různými neuronovými sítěmi. 1

Abstrakt (anglicky)

This thesis examines adversarial examples in machine learning, specifically in the im- age classification domain. State-of-the-art deep learning models are able to recognize patterns better than humans. However, we can significantly reduce the model's accu- racy by adding imperceptible, yet intentionally harmful noise. This work investigates various methods of creating adversarial images as well as techniques that aim to defend deep learning models against these malicious inputs. We choose one of the contemporary defenses and design an attack that utilizes evolutionary algorithms to deceive it. Our experiments show an interesting difference between adversarial images created by evolu- tion and images created with the knowledge of gradients. Last but not least, we test the transferability of our created samples between various deep learning models. 1

Citace dokumentu

Metadata

Zobrazit celý záznam