Skip to main content

envIA. Cómo felicitar la navidad con inteligencia artificial.

Hace un par de semanas nos planteamos cómo podíamos felicitar la Navidad a nuestros amigos. Pero queríamos buscar una forma de felicitar que estuviera alineada con lo que somos: una empresa ágil donde la creatividad, la innovación y la tecnología van de la mano. Como somos un poco osados y nos van los retos, nos planteamos desarrollar una herramienta de inteligencia artificial para felicitar la navidad. Fruto de ello, y de la colaboración con Prodigioso Volcán (porque queríamos que la comunicación estuviera a la altura de la IA desarrollada), nace envIA: Crea tu postal inteligente.

envIA: Crea tu postal inteligente es un generador creativo basado en los últimos avances en inteligencia artificial y procesamiento del lenguaje natural. A partir de una foto y un texto, es capaz de generar una postal de felicitación que adapta para la ocasión tanto la foto como el texto.

A alto nivel, está compuesto de dos módulos:

Generación de poesías de felicitación

Cuando el usuario introduce un texto, procesamos el texto con GPT3 para generar un poema de felicitación único, personalizado y sorprendentemente coherente. Por supuesto, si el texto introducido está relacionado con la imagen quedará una postal más coherente, ya que el poema generado estará en consonancia con la imagen.

Adaptación del estilo de una imagen

Adaptar el estilo de la imagen supuso un reto mayor. Seguramente, todos hemos visto recientemente imágenes generadas mediante Stable Diffusion o Midjourney. Aunque los resultados son sorprendentes, el gran inconveniente de estos sistemas de generación de imágenes es que, de serie, suelen tener problemas para respetar la imagen original. Por ejemplo, este fue uno de los primeros resultados que obtuvimos al tratar de utilizar un modelo de difusión (un modelo que convierte una imagen en otra imagen, como el de Stable Diffusion) para “navidificar” una fotografía. En base a esta imagen:

este es el resultado que obtuvimos:

Claro, la imagen resultante es muy navideña… pero las personas que había en la foto ahora son otras, lo cual no parece tener mucho sentido para nuestro propósito. Para evitar esto, hemos añadido un paso previo a la “navidificación”, que consiste en detectar y siluetear las personas que aparecen en la foto, apoyándonos en un modelo de segmentación (llamado MaskFormer). De este modo, primero creamos una máscara que utilizamos en conjunción con la imagen original para decirle al modelo de difusión qué partes de la imagen puede editar, obteniendo un resultado mucho más acertado:

También tuvimos retos no menores a la hora de permitir que el modelo sea usado por un buen número de usuarios, pero esa parte la dejamos para otro post.

Composición final

Una vez contábamos con los componentes imprescindibles de cualquier tarjeta de felicitación (poema y fotografía), ya sólo quedaba… toda la parte que no tiene que ver con inteligencia artificial, pero que es fundamental para que un sistema de inteligencia artificial aporte valor. Es decir, montar una aplicación web que permita al usuario interactuar con el modelo y generar una composición final atractiva. Para ello, contamos con la gran ayuda de nuestros amigos de Prodigioso Volcán, quienes acogieron la idea con gran entusiasmo conforme se la contamos. 

Y, así, en menos de dos semanas nació envIA: crea tu postal inteligente.

¡Crea tu propia postal inteligente aquí!

Otras aplicaciones

La tecnología de inteligencia artificial es una tecnología transversal, que puede utilizarse para generar una felicitación de Navidad o para muchos otros usos. En este caso, la tecnología que hemos utilizado para adaptar una fotografía y generar una postal de felicitación podría utilizarse en otros casos de uso como, por ejemplo:

  • En el sector retail, ¿imaginas la de fotografías que hay que hacer para tener la imagen de una misma prenda en sus diferentes colores? Pues este tipo de modelos podrían eliminar ese coste.
  • A la hora de poner a la venta prendas en un e-commerce, la post-edición de las fotografías es un proceso manual y costoso. El objetivo de este proceso es darle un aspecto más atractivo a la fotografía, pero sin perder su aspecto natural. Por ejemplo, este proceso suponía un cuello de botella para el crecimiento de Micolet y conseguimos automatizarlo mediante tecnología de inteligencia artificial. Con lo que ha evolucionado la tecnología en estos últimos meses, las posibilidades de automatización han aumentado significativamente. De hecho, estamos preparando otra sorpresa en torno a este tema. ¡En breve tendremos noticias!
  • Nos vamos a un sector diferente, el inmobiliario. Aunque es bastante habitual vender las casas sin muebles, presentar la imagen de una habitación amueblada ayuda mucho a que los posibles compradores se hagan una idea de dimensiones y potencial.

Y esto son sólo unas pocas aplicaciones de proceso, en cuanto a que tratan de automatizar un proceso manual existente… pero las posibilidades desde un punto de vista creativo, como por ejemplo para servir de inspiración a diseñadores, son enormes. En este artículo desarrollamos más este caso de uso.

También podemos hablar de otras aplicaciones de la tecnología de procesamiento del lenguaje natural (PLN) que hemos utilizado, como por ejemplo:

  • De cara a generar contenidos (como este), es muy habitual generar texto a partir de un conjunto de unas pocas ideas. El tipo de modelo de PLN que hemos usado para generar la poesía podría ser utilizado para, a partir de un conjunto de ideas, generar un texto completo que pueda ser corregido por un profesional.
  • Se suele decir que la personalización es el Santo Grial del marketing. Imagina un sistema que fuera capaz de personalizar y adaptar los mensajes enviados en redes sociales, o en correos electrónicos, al estilo de cada persona que recibe ese mensaje. Este tipo de adaptación, que sería demasiado costosa de hacer manualmente, podría automatizarse con tecnología de PLN como la que hemos usado para generar las poesías. 

 

¿Qué te ha parecido?

¡Ponte en contacto con nosotros en hello@sciling.com si quieres saber más acerca de las posibles aplicaciones de esta tecnología!

Germán Sanchis

Author Germán Sanchis

More posts by Germán Sanchis