Ataques Adversariais e Cibersegurança em Modelos de Machine Learning de IA
Ataques adversariais, especificamente ataques de evasão, são uma técnica que visa enganar modelos de Machine Learning (ML) e Inteligência Artificial (IA) em produção (na fase de inferência). O ataque consiste em criar entradas maliciosas, chamadas “exemplos adversariais”, que são intencionalmente projetadas para causar uma classificação ou predição incorreta por parte do modelo. Este artigo vai ajudar a compreender o problema e os riscos.