Índice:
2025 Autor: John Day | [email protected]. Última modificação: 2025-01-13 06:58
Este é um projeto ambicioso, onde queremos usar algumas das partes mais questionáveis da internet, seções de comentários e salas de chat, para criar arte.
Também queremos tornar o projeto facilmente acessível para que qualquer pessoa possa tentar gerar algumas belas artes de IA. Se você não pode esperar para experimentar, aqui está um link para o projeto.
Suprimentos
- Raspberry Pi
- DeepAI
- Remo.tv
Etapa 1: Projeto de Vídeo
Etapa 2: Remo.tv
A primeira etapa é reunir mensagens de bate-papo e comentários. Com a nossa ideia de torná-lo facilmente acessível, Remo.tv é uma escolha natural. É uma plataforma de streaming de robô que permite conectar todos os tipos de hardware à internet e permitir que qualquer pessoa os controle. Também possui uma funcionalidade de chat e a capacidade de exibir imagens, que é exatamente o que estamos procurando!
Neste caso, o hardware que usaremos é um Raspberry Pi.
Remo.tv tem uma ótima página Github com instruções de configuração.
Uma vez configurado, nosso Raspberry Pi pode começar a receber as mensagens de chat, enviadas via Remo.tv.
Etapa 3: DeepAI
Com a configuração do Remo.tv, podemos avançar na parte artística. Cada comentário que recebemos precisa ser transformado em arte, e para isso usaremos um pouco de magia de inteligência artificial.
Felizmente, existe uma outra plataforma para tornar nossa vida mais fácil, DeepAI. Eles têm todos os tipos de recursos relacionados à IA, mas os que nos interessam são suas APIs.
A primeira API que usamos é Text To Image, tudo o que precisamos fazer é enviar um texto e esperar que a mágica aconteça. Na foto acima você pode ver o resultado de enviar um cachorro com um chapéu engraçado.
Nossa imagem gerada ainda não é arte, então usamos o Fast Style Transfer. Esta API espera uma imagem original, em nosso caso nossa gerada, e um estilo a ser aplicado. Você pode ver o resultado da combinação do nosso cão com um chapéu engraçado e uma pintura clássica de Van Gogh.
Etapa 4: fluxo de dados e código
Com todas as peças separadas concluídas, podemos conectá-las. No desenho, fornecemos uma visão geral do fluxo de dados:
- Uma mensagem de bate-papo chega do Remo.tv ao nosso Raspberry Pi
- Nosso Pi envia esta mensagem para a API Text To Image e recebe uma imagem gerada de volta
- Essa imagem, junto com um estilo de arte selecionado aleatoriamente, é enviada para a API Fast Style Transfer
- Depois de receber a combinação do estilo de arte e da imagem gerada, o Raspberry Pi transmite o resultado para Remo.tv.
Para poder transmitir a imagem gerada para Remo.tv, precisamos escrever algum código personalizado. Felizmente, a adorável comunidade Remo.tv nos ajudou com isso, obrigado pessoal!:)
Para todos os curiosos, o código completo está incluído neste projeto para que você possa começar imediatamente.
Etapa 5: Resultado
Com todo esse trabalho árduo feito, é hora de desfrutar de algumas belas artes!
- Uma banana velha
- Nugget de frango
- Gatos fofos comendo melancia
- Flutuando em uma nuvem
- Solidão
- Meu lugar feliz
- Lugar algum
Aqui está o link para comentar sobre a arte no Remo.tv se você quiser experimentar!