Buenas noticias para los que quieran adentrarse en este mundo tan en boga de las imágenes generadas por IA.


La versión 3 del sofware Paella (entre sus creadores está Pablo Pernías, español residente en Sant Joan d'Alacant) ya está disponible para desgarga en github bajo licencia MIT (equivalente a una licencia Creative Commons BY-SA): https://github.com/dome272/Paella


Está diseñado para principiantes en la generación "texto a imagen" (describes la imagen y el sistema la genera por ti según lo que le hayas enseñado). Una vez que el sistema ha aprendido a crear las imágenes, la configuración del modelo de aprendizaje es minimalista y fácil de entender (menos de 10 pasos). Lo único necesario para configurar y entrenar la IA es escribir no más de 140 líneas de código en Python. Todo el código de muestreo se define sólo en 12 líneas, el resto es para los parámetros del entrenamiento.


El aprendizaje de la IA se realiza mediante nodos de redes neurales, una especie de sistema de "prueba y error" que se autocorrige mediante funciones matemáticas de control de pesos con precisión proporcional al número de muestras. Cuantas más imágenes le muestres, mayor precisión hay entre lo que pides y lo que te da.


Estas imágenes de muestra se llaman "datasets" (conjuntos de datos) y, si no tienes las tuyas propias, puedes acceder a las que hay gratis por internet (por ejemplo en LAION: https://laion.ai/projects/).


Pero, ojo, cuantos más "datasets" uses, más memoria RAM va a necesitar tu IA (que puede llegar a necesitar más de 80 gigabytes), por lo que se recomienda tener hardware con 30 GB de memoria RAM. Hay que decir que esta versión de Paella mejora el tiempo de aprendizaje de la IA de otras aplicaciones actuales, pero aún está en desarrollo, principalmente para resolver la gran demanda de memoria RAM.


Aunque el tiempo de aprendizaje de la IA se ha mejorado, hay que tener paciencia y una buena GPU (por razones obvias, usar la CPU para el tratamiento gráfico sería absurdo). Claro está que no tienes por qué usar únicamente una GPU, puedes entrenar Paella sobre varias GPU o en modo multinodo también.


Para que tengáis una idea, el tiempo de aprendizaje del modelo de muestra del proyecto Paella para obtener estas imágenes de abajo fue de tres semanas.








Aquí tenéis el artículo sobre Paella en PDF (en inglés, me temo) del arxv.org: https://t.co/MJDl4KVd8e
Y aquí la información técnica general: https://huggingface.co/dome272/Paella


Tanto si quieres crear tus propias imágenes generadas por IA o si sólo quieres abordar el asunto desde un punto de vista didáctico, Paella parece ser una muy buena opción a día de hoy.


Un saludo.