Caros artistas: não tema os geradores de imagens de IA

Em 1992, o a poetisa Anne Carson publicou um pequeno livro intitulado Entrevistas curtas. Esta é uma série de microensaios, que vão de uma frase a um parágrafo, sobre temas aparentemente desconexos: orquídeas, chuva, a mítica vicunha andina. Sua “conversa curta sobre a sensação da decolagem do avião” é o que parece. Seu “Short Talk on Trout” é principalmente sobre os tipos de trutas que aparecem nos haikus. No que passa por introdução do livro, Carson escreve, com uma árdua identificação canadense: “Eu farei qualquer coisa para manter o tédio à distância. É a tarefa de uma vida. Quando ela postou isso, a internet começou a decolar.

Avanço rápido de 30 anos e uma das últimas maneiras de evitar o tédio, pelo menos para mim, é ir para a cama tarde e se divertir com isso. Geração de imagem de IA. Ferramentas como DALL-E 2, Midjourney e Stable Diffusion podem receber instruções de texto para produzir pinturas a óleo substitutas de cães usando chapéus no estilo de Ticiano, ou fotos simuladas de modelos em plasticina de astronautas a cavalo. Quando comecei a brincar com o Stable Diffusion, que é de código aberto e muito divertido, isso me lembrou as palestras de Carson. Voltei para eles para descobrir o porquê. Logo percebi que a semelhança tinha algo a ver com Formato.

Todo mundo diz que o conteúdo é rei, mas o monarca secreto da economia do conteúdo é a forma: restrições, regras, mínimos e máximos. Você cresce na forma de aprendizado. Um ensaio do ensino médio é de cinco parágrafos. As comédias deixam oito minutos na meia hora para os comerciais. As novelas são longas. Os tweets são limitados a 280 caracteres.

O que torna meu tweet, ensaio ou filme de estúdio diferente do seu? As escolhas que cada um de nós faz no formulário. Em uma palavra, nossa estilo. O livro de Carson assume uma forma familiar, a pequena palestra, e a subverte, manipula, até que, como leitor, você começa a se sentir como se estivesse dentro de seu cérebro maravilhoso, percorrendo a história de seu navegador mental, juntando-se a ela em fantasias e hiperlinks. meio… tocas de coelho abandonadas. A geração de imagens é um pouco assim, mas em vez de se comunicar com um único e brilhante cérebro canadense, você se comunica com um gigante cérebro mudo. (Uma maneira menos neurológica de colocar isso: um grande número de objetos de dados agrupados em camadas, ligados em um grau incompreensível, como a arte de parede de fios e pregos de um cortador de vários mastros, mas em chamas com o fluxo de dados. )

Em geral, os humanos gostam de usar o aprendizado de máquina para ajudar os patologistas a refinar uma foto de telefone ou criar um mapa melhor. Mas os geradores de IA incomodam muita gente. Essas ferramentas funcionam digitalizando imagens na Internet, absorvendo a cultura visual que elas contêm digitalizando suas legendas e adicionando ruído visual borbulhante a elas até que pareçam estáticas. Para criar uma nova imagem, a IA começa com uma legenda e um pouco de estática, depois executa o processo de trás para frente, removendo o ruído até aparecer uma imagem que mais ou menos se alinha com a legenda. (É ruim para desenhar mãos, mas eu também sou.)

Parece rude. É nojento ver artistas no banco de dados sendo esquecidos. Parece rude que alguém possa dizer a um computador: “Quero um retrato de Alex Jones no estilo de Frida Kahlo”, e o computador o faria sem julgamento moral. Esses sistemas agregam cenas, territórios, culturas – coisas que as pessoas consideravam “deles”, “suas vidas” e “seus empregos” – em um tarball de código aberto de 4 gigabytes que você pode baixar em um Mac para fazer um pinguim jogando beisebol no estilo de Hayao Miyazaki. As pessoas que podem usar as novas ferramentas terão um novo poder. As pessoas que eram ótimas com ferramentas antigas (pincéis, câmeras, Adobe Illustrator) serão agradecidas por seu serviço e devolvidas à Soylent. É como um cara vestindo Allbirds entrando em uma área residencial onde todo mundo mal estava segurando e dizendo: “Eu amo este lugar, é tão estranho!” Siri, toque minha playlist peculiar. E abra uma garrafa azul na esquina!

Então é claro que as pessoas estão chateados. Sites de arte proíbem trabalhos gerados por IA, pelo menos por enquanto; os serviços de banco de imagens também o recusam. Blogueiros proeminentes que experimentaram a IA ilustrando seus escritos foram repreendidos Twitter e prometi nunca mais fazer isso. As empresas de IA falam muito sobre ética, o que sempre me deixa desconfiado, e algumas palavras são banidas da interface do gerador de imagens, o que é uma pena porque eu queria pedir ao bot para pintar um chalé “peituda” à la Thomas Kinkade. (Você tem que enfrentar seus medos mais profundos.)