Un experimento con DALL·E

Esta es una entrada un poco diferente. De hecho, no tenía ninguna categoría para ella, así que la he incluido en “Visualización de datos”, donde entra bastante con calzador. En todo caso, conecta con un asunto que, antes o después, tocará a todo el mundo, que quizás afecte primero a quienes trabajan en el campo del marketing y que todo apunta a que será algo que traiga cambios profundos en la forma en la que se genera el contenido en las páginas web: la inteligencia artificial y los nuevos softwares de generación de imágenes mediante inteligencias artificiales.

El campo de la generación de contenidos no parece que vaya a ser, ni de lejos, el final del camino para la inteligencia artificial. Es casi seguro que no será ni la más potente ni la más revolucionaria de sus aplicaciones, pero en el largo camino que queda desde aquí hasta Skynet esta es en la que nos pararemos aquí a raíz de que se acaba de liberar el acceso, ya sin lista de espera a Dall-e (acceso por aquí)

Qué es DALL·E (en breve)

DALL·E es un proyecto de Open IA. Una Inteligencia Artificial Creada para generar imágenes a partir de texto. Aquí el pdf del proyecto original y aquí la explicación de su proyecto por parte de Open AI con una cronología muy detallada de como ha ido evolucionando el proyecto desde que se publicó en Enero de 2021.

Para quien no haya oído hablar nunca de Dall-e y quiera tener un poco más de profundizar sin tener que leerse los papers dejo aquí un video del canal Dot CSV en el que hablan de DALL·E. Dot CSV es un canal muy recomendable, centrado en inteligencia artificial. Por lo general hace un trabajo muy documentado y actualizado. Este, en concreto, está un poco más improvisado. No es una crítica, es el formato que busca en este caso. De hecho es un poco como esos videos de “Reaccionando a” pero en este caso lo que se busca es decir cosas interesantes en lugar de decir constantemente “Bueno, bueno, bueno eso sí que no me lo esperaba”, que también, mire usted, es una forma de opinar.

Probando a DALL·E

La idea es probar cómo funciona DALL·E y hasta qué punto es un recurso fiable para la generación de imágenes. Vamos a ver si nos podemos entender y qué partido le podemos sacar. Empezamos por algo sencillo y le pedimos que nos haga “a very simple red circle”. Esto es lo que nos devuelve 👇🏼

No está mal para empezar. Es verdad que parece que especificar que queremos un círculo muy simple ha querido rizar el rizo y, lo cierto, es que ninguna de las respuestas es tan simple como un simple círculo. Vamos a eliminar la palabra “simple” y ver qué nos devuelve

Parece que el exceso de información no ayuda, pero el defecto tampoco. Evidentemente, no es el tipo de imagen para la que está diseñado ni lo que ha aprendido a hacer, pero vamos a ver si conseguimos encontrar la forma de decirle que lo que queremos es algo tan simple como 🔴. Vamos a probar con “Draw a plain red circle”

Estamos más cerca, pero no llegamos. En todo caso, vemos que se esfuerza. Los tres primeros resultados parecen enfocados en cumplir estrictamente con la orden “draw” y el cuarto lo clava a la con la sencillez, pero no le acaba de apetecer lo del círculo. Vamos a ver si especificamos y le decimos que se ponga a “dibujar un círculo rojo liso totalmente redondo”

Hemos estado muy cerca, pero llega la hora de desistir. Dall·E no está hecho para esto.

Dall·E pintor

Segundo asalto. Dall·e se ha hecho muy famoso porque es capaz de conseguir representaciones con una calidad sorprendente de solicitudes muy imaginativas. Algunos de los ejemplos que tienen en la web de Dall·e son.

En la cuenta de Instagram del proyecto van colgando de tanto en cuando algunas de las obras más logradas de Dall·e. Algunas son bastante impactantes y, la verdad, seguro que sigues a gente mucho peor -sí, te lo digo a ti- así que puedes darle una oportunidad.

A nosotros ahora lo que nos interesa es evaluar la capacidad de Dall·E de reconocer iconos. Está claro que Dalí es mañoso, vamos a ver si, además tiene cultura. Vamos a pedirle que nos pinte un cuadro famoso y ver cómo responde. Para no pasarnos de originales vamos a pedirle que nos dibuje “El caminante” de Friedrich (sí, ese que se utiliza en cualquier libro de poesía romántica que se valore un poco a sí mismo). Este 👇🏼.

Le escribimos a Dall·el nombre del cuadro y nos devuelve esto

No está mal, la verdad. Ha pillado la idea y, para ser justos, no le hemos dicho específicamente que queramos el cuadro, así que vamos con ello, aunque sea burdo. Queremos exactamente esa pintura tal y como la hace ese autor The painting “wanderer above the sea of clouds” by Friedrich

Se resiste a la copia -es más, es probable que se busque que la evite, lo cual sería muy razonable- pero estamos muy muy cerca.

Dall·e como diseñador

Vamos a probar ahora si nos podemos hacer entender con Dall·e hasta el punto de que sustituya, no a un diseñador profesional, pero sí a ese primo que controla Illustrator y que está cansado de que le pidas un logo cada vez que te quieres montar una web. Digamos que, por ejemplo, tenemos una tienda de productos deportivos. Nuestro proyecto está un poco verde, así que no tenemos muy clara la identidad visual que estamos buscando ni nada por el estilo. Solo que queremos “The logo of a shop specialising in sports products.” Dall·e nos devuelve esto.

Vale, no va a ganar ningún premio de diseño, pero no está tan mal. Quizás Dall·e no vaya a ser tu próximo diseñador, pero a lo mejor sí puede ser la próxima herramienta que utilice tu diseñador a la hora de buscar ideas. Vamos a ver si podemos afinar un poco más la búsqueda. Le pedimos que nos dibuje “A green and white logo of a shop specialising in sports products, especially football.”

Dall·E parece que gestiona bien los colores pero ¿qué pasa si le especificamos otro tipo de detalles? ¿Y si le decimos que queremos que nuestro logo utilice una fuente en particular? ¿Y si le decimos el nombre de la tienda? ¿Puede Dall·enfrentarse a las solicitudes del más complaciente de tus clientes?

Pues no. A la petición “A green and white logo for a shop specialising in sporting goods. The shop is called “Un pies pas” and the font of the logo is Verdana.” nos devuelve

Dall·E como retratista

Vamos a comprobar ahora qué puede hacer Google como retratista. Ya que estamos con el tema del fútbol, le vamos a pedir que nos dibuje un retrato de, por ejemplo, Messi. “A portrait of lionel messi”

No va fino, pero tampoco tan desencaminado. El tema nos lleva a pensar también hasta qué punto este tipo de inteligencias artificiales (no esta necesariamente) van a permitir

Dall·E: primeras impresiones

Al final esta entrada no es demasiado ambiciosa. Estamos probando el agua y es demasiado pronto como para llegar a conclusiones, pero al menos sí podemos apuntar algunas impresiones superficiales. La primera Dall·E quizás no sea aún una herramienta perfecta, pero desde luego sí es una herramienta impresionante. Si tenemos en cuenta el tiempo que ha pasado desde que apareció el paper hasta hoy la velocidad a la que evoluciona esta tecnología es más que sorprendente.y nos hace pensar sobre la espectacularidad de los avances de la inteligencia artificial en general. Porque, como decíamos al principio, la generación de imágenes ni siquiera es la punta de lanza de la nueva generación de avances en IA. Los espectaculares avances que se están consiguiendo en areas como el plegado de proteínas o el desarrollo de algoritmos para la resolución de matrices nos obliga a incluir a la Inteligencia Artificial en ese grupo de tecnologías abrumadoras que invocan un futuro con el que no contábamos y que ni siquiera podíamos imaginar, junto a la robótica, la genética y, quien sabe si en qué plazo, la computación cuántica. Es dificil escapar a la sensación vertiginosa de que nos deslizamos al filo de un horizonte de eventos.

Toreto enseña Data Studio

El viejo mundo se muere y el nuevo tarda en aparecer. En ese claroscuro surgen los monstruos

Toretto

Y para acabar, un melocotonazo. No estoy seguro de qué pensaba McRae de este disco. A lo mejor le parecía una cosa demasiado pop para una superdiva del jazz. A lo mejor pasa como con las estatuas griegas, que siempre olvidamos que originamente estaban pintadas y que durante dos mil años noshemos dedicado a adorar ruinas. A lo mejor esto es así pero, joder, qué buena era esta tía.

Miguel Carreira López

Trabajo en análisis web y SEO desde hace diez años. Creo que no hay nada que se pueda decir sobre el tráfico de una página web que no se pueda explicar mejor con un gráfico. Trabajo sobre todo con las herramientas de Google (GSC, Looker, Analytics) pero hay vida más allá. En los ratos libres escribo sobre libros en https://www.enestadocritico.com/