A geração de imagens é um processo pelo qual um algoritmo de inteligência artificial cria uma imagem original ou conteúdo visual sem o uso de imagens pré-existentes como referência ou entrada. Isto é conseguido através de uma técnica de aprendizagem profunda chamada redes adversárias generativas (GANs), que consistem em duas redes neurais: um gerador e um discriminador.
A rede geradora é responsável por criar novas imagens aprendendo padrões e recursos de um conjunto de dados de imagens existentes. Ele gera novas imagens manipulando esses padrões e recursos aprendidos, criando essencialmente algo inteiramente novo.
A rede discriminadora, por outro lado, é responsável por determinar se uma imagem é real ou gerada pela rede geradora. Ele aprende o que distingue as imagens reais das geradas, o que ajuda a identificar melhor as imagens falsas criadas pelo gerador.
As duas redes competem entre si, com o gerador tentando criar imagens mais realistas enquanto o discriminador tenta distinguir entre imagens reais e geradas com maior precisão ao longo do tempo, resultando em imagens cada vez mais realistas sendo geradas pela rede ao longo do tempo, como ele aprende a melhor forma de enganar o discriminador, fazendo-o acreditar que são imagens reais, em vez de imagens geradas por ele mesmo ou por outro módulo gerador de rede.