A nova IA da NVIDIA engole palavras, cospe fotos e parece quase mágica - Mundotech
Site Overlay

A nova IA da NVIDIA engole palavras, cospe fotos e parece quase mágica

A nova IA da NVIDIA engole palavras, cospe fotos e parece quase mágica

A NVIDIA tem um sistema de arte generativo que usa IA para transformar palavras em obras de arte visualmente espetaculares. Esta não é a primeira vez que esse tipo de conceito é postulado, ou mesmo produzido. No entanto, é a primeira vez que vimos um sistema desse tipo funcionar com velocidade e precisão incríveis.

Você pode dar uma olhada no OpenAI para ver um projeto chamado DALL · E. Esse é um projeto de geração de imagens baseado em GPT-3, que você pode aprender mais na Cornell University. Você pode começar a fazer interpretações malucas de estilos com o Deep Dream Generator ou aprender sobre algumas das fontes para o projeto de pesquisa da NVIDIA que estamos examinando hoje – veja o artigo Generative Adversarial Networks para aprender sobre GAN!

O NVIDIA Project GauGAN2 se baseia no que os pesquisadores da empresa criaram com o NVIDIA Canvas . Esse aplicativo – em modo Beta no momento – funciona com o primeiro modelo GauGAN. Com a inteligência artificial à sua disposição, qualquer pessoa pode gerar uma obra de arte de aparência relativamente realista com dados que nada mais são do que o necessário para fazer uma pintura a dedo.

Com o GauGAN2, os pesquisadores da NVIDIA expandiram o que é possível com uma entrada simples e interpretação de inteligência artificial de tal entrada. Este modelo usa uma grande variedade de esboços (aproximadamente 10 milhões de imagens de paisagens de alta qualidade), como seu banco de conhecimento visual, e se vale desse banco para decidir o que suas palavras podem significar em uma obra de arte.

Uma única estrutura GAN no GauGAN2 inclui várias modalidades. NVIDIA aponta para texto, segmentação semântica, esboço e estilo. Abaixo, você verá uma demonstração desse novo elemento de entrada de texto em uma interface que é essencialmente uma extensão do NVIDIA Canvas.

A demonstração é muito menos importante do que o que representa. Um smartphone agora pode apagar magicamente os elementos de uma foto. Se você estiver usando um sistema como o Google Fotos, a inteligência artificial já está em sua vida, ficando mais inteligente à medida que você a alimenta com mais imagens capturadas pelo seu telefone.

A próxima onda está aqui, com a demonstração da NVIDIA , nos mostrando como a máquina não sabe apenas identificar os elementos nas fotos, ela sabe como gerar imagens a partir do seu conhecimento das imagens que foi alimentada. A NVIDIA tem um modelo aqui que nos mostra efetivamente que o poder de processamento gráfico e o conjunto certo de códigos podem gerar representações chocantemente confiáveis ​​do que nós, humanos, interpretamos como realidade.

Deixe um comentário