La IA aplicada a la fotografía: Herramientas para convertir la inteligencia artificial en una aliada

Hace ya un año desde que escribí en este blog su primer artículo sobre la inteligencia artificial y el impacto que esta iba a tener en el sector de la fotografía, tanto en lo creativo como también en lo profesional. Y es que la IA ha dejado se ser esa recurrente innovación que en el imaginario colectivo ha tenido tantas formas surgidas del cine o de la literatura de ciencia ficción para convertirse en una realidad factible que, hasta hace muy poco, nadie se la esperaba. Y eso, a pesar de que el primer esbozo de una inteligencia artificial se remonta a 1939, cuando el matemático inglés Alan Turing ideó Bombe, la máquina de cálculo con la que fue posible descifrar los códigos nazis Enigma, con tiempo suficiente para anticiparse a los movimientos del Reich durante la Segunda Guerra Mundial.

herramientas-inteligencia-artificial-para-fotografos-portada-arcadina

El primer esbozo de una inteligencia artificial se remonta a 1939, cuando el matemático inglés Alan Turing ideó Bombe, la máquina de cálculo con la que fue posible descifrar los códigos nazis Enigma

Y así, mientras HAL 9000 se rebelaba contra los humanos en 2001, Odisea En El Espacio (Stanley Kubrick, 1968) o el Rick Deckard de Blade Runner (Ridley Scott, 1982) cazaba replicantes dotados de una inteligencia emocional no mucho más desarrollada que la del niño superjuguete de A.I. Artificial Intelligence (Steven Spielberg, 2001), en el mundo real nacía Eliza (1966), el primer programa basado en la idea de las redes neuronales artificiales, un supercomputador llamado Deep Blue derrotaba al campeón del mundo de ajedrez Gary Kaspárov (1996), y AlphaGo (2015) y AlphaZero (2017) daban un paso de gigante, siendo los primeros programas conocidos capaces de aprender por sí mismos.

Todos estos acontecimientos, en su momento, no tuvieron más repercusión en la conciencia colectiva que la de una noticia de relleno en cualquier informativo o la de un documental de La 2 sobre ciencia y tecnología, siempre que uno no acabara echando una cabezadita con la voz de Eduard Punset de fondo. Y a pesar de que todo el conocimiento habido y por haber está a disposición de cualquiera gracias a Internet, la inmensa mayoría de las inteligencias no artificiales parece ser que optamos por usar el hecho tecnológico para pelar la pava en las RRSS, totalmente ajenos al devenir de unos hechos que son la antesala de un cambio de paradigma que, sin duda, lo va a poner todo patas arriba.

herramientas-inteligencia-artificial-para-fotografos-1-arcadina
Bombe: el primer esbozo de una inteligencia artificial.

Y la IA llegó para quedarse…

Ya en 2024, no hay que echar mucho la vista atrás para encontrar una sucesión de eventos, en una línea temporal realmente corta, tras los cuáles, la inteligencia artificial ha dejado de ser un concepto ajeno para el ciudadano de a pie a convertirse en un «algo» lo suficientemente relevante-estimulante-preocupante-rellene usted sobre la línea de puntos…, como para que muchos no podamos quitárnoslo de la cabeza. El golpe en la mesa lo dio OpenAI en 2019, con el lanzamiento de la versión 2 de ChatGPT, una aplicación chatbot de inteligencia artificial, entrenada en su momento a partir de 1.500 millones de parámetros y 8 millones de páginas web y que, con tan solo 4 años de diferencia, cuenta ya con 100 billones de parámetros y un volumen de datos de más de un millón de Gigabytes.

herramientas-inteligencia-artificial-para-fotografos-2-arcadina
Interfaz de la versión gratuita de ChatGPT.

Pero si hubo un momento concreto que puso en guardia a fotógrafos, diseñadores, ilustradores, artistas gráficos y audiovisuales, etcétera, este se produjo en abril de 2022, cuando empezó a circular en medios de comunicación de todo el mundo la imagen de un astronauta montado a caballo paseando por el firmamento. Aquella especie de fotoilustración de aspecto realista, fue generada por DALL-E 2, una inteligencia artificial creada también por OpenAI, capaz de generar contenidos gráficos a partir de una mera explicación en texto, lo que hoy conocemos como prompt. De repente estábamos ante la evidencia de que una IA podía ser creativa y emular cualquier proceso de producción de imágenes con la diferencia de que, lo que para un fotógrafo o ilustrador implicaría horas de trabajo o una gran cantidad de recursos humanos y técnicos, esta era capaz de llegar a un resultado en pocos segundos, sin que la complejidad o no de las instrucciones dadas a través del prompt afectara en absoluto a su velocidad de procesamiento.

Y si esto ya tuvo su impacto, al menos entre quiénes ya empezábamos a ver la inteligencia artificial como algo a tener mucho en cuenta, en julio del mismo año se lanzaba la primera versión beta abierta de la que, sin duda, es la IA que ha hecho saltar la liebre en los sectores audiovisuales y artísticos. Estoy hablando de Midjourney, la inteligencia artificial más avanzada que existe en abierto, en estos momentos, para generar contenidos de imagen a partir de prompts, hasta tal punto que, hoy en día, ya resulta prácticamente imposible diferenciar las imágenes generadas por la IA de las obtenidas con cualquier proceso de creación y producción audiovisual sin IA, con unos resultados tan fascinantes y verosímiles que, sin lugar a dudas, podemos estar ya afirmando, sin pillarnos los dedos en la puerta, que la capacidad de una IA para convertir un briefing en una acabado visual final está cada vez más cerca de superar a la de la propia capacidad humana.

herramientas-inteligencia-artificial-para-fotografos-3-arcadina
Página principal de Midjourney.

Es bastante difícil encontrar un precedente, ni en la revolución industrial ni en las posteriores revoluciones tecnológicas y digitales, de un ritmo de desarrollo tan vertiginoso y que abarque tantas posibilidades, presentes y futuras…

De hecho, parte de la investigación y aprendizaje que muchos de los que empezamos a introducir la IA en nuestros procesos creativos, tras años viviendo la evolución tecnológica, no sin digerir muchas controversias internas, se basa en crear lo inabarcable, o sea, aquello que hasta ahora solo era viable en la imaginación de cada uno e imposible de reproducir por las propias limitaciones de producción en el mundo real.

Y la velocidad a la que va todo esto es abrumadora. De hecho, es bastante difícil encontrar un precedente, ni en la revolución industrial ni en las posteriores revoluciones tecnológicas y digitales, de un ritmo de desarrollo tan vertiginoso y que abarque tantas posibilidades, presentes y futuras, en prácticamente todos los campos que a uno le puedan venir a la mente. Porque nos vamos a centrar en el sector audiovisual, que es el que nos concierne a través del contenido de este blog, pero es realmente abrumador intentar procesar todo lo que ya está sucediendo, y todo lo que está por venir, en otros ámbitos tan dispares como el de la ciencia, la medicina, el periodismo, la música o las finanzas. Y sirva como ejemplo de esa velocidad mi más modesta experiencia: los originales de las siguientes imágenes, los cuales podríamos llamar los RAW de la IA, los creé con Midjourney con un prompt de características textuales muy parecidas, pero con menos de un año de diferencia entre una y la otra; la primera imagen es el resultado que obtuve en enero de 2023; la segunda es de agosto de ese mismo año.

herramientas-inteligencia-artificial-para-fotografos-4-arcadina
Dos imágenes creadas a partir de Midjourney con 8 meses de diferencia.

Si la capacidad de crear acabados realistas -que no reales- a través de la inteligencia artificial ha llegado hasta ese punto en menos de 8 meses y esta sigue evolucionando a al ritmo en que lo está haciendo, es obvio que obtener una respuesta a la pregunta Y a partir de ahora ¿qué? puede ser algo tan complejo como la cuadratura del círculo plasmada simbólicamente en aquella parábola de San Agustín, la Trinidad y el niño que, cubo a cubo, pretendía vaciar toda el agua del mar en un hoyo en la arena.

Un dilema más para el sector fotográfico

Todo avance tecnológico que directamente toca la fibra de cualquier sector productivo nunca está exento de polémica, como tampoco lo está de consecuencias, tanto en lo positivo como en lo negativo. Todos los que nos hemos dedicado a la fotografía, y mucho más aquellos que nos formamos en la era analógica del celuloide y los químicos, también tuvimos nuestros dilemas morales con la irrupción de las cámaras digitales y la democratización del uso de programas de retoque digital como Photoshop. Y ya no hablemos de los móviles y sus, cada vez, más perfeccionadas cámaras incorporadas. No fueron pocas las voces que gritaron al cielo “la fotografía ha muerto”. Pero el caso es que no ha sido así. Ahora se disparan más fotografías que nunca y, a pesar de que un smartphone pueda llevar incorporadas ópticas Leica o Carl Zeiss, las cámaras DSLR siguen evolucionando y copando el mercado, hasta el punto de saturarlo con tanta oferta. La fotografía no ha muerto, lo que pasa es que ha evolucionado, rebasando límites que hace 30 años ni hubiéramos imaginado, lo cual, ha obligado a los creativos, artistas y profesionales de este sector, no solo a incorporar lo digital en sus procesos de producción de imágenes, sino a reinventarse y ampliar sus capacidades para ofrecer algo con qué destacar en medio de este fenómeno que Joan Fontcuberta diseccionó de manera muy inteligente en su ensayo de 2020, La furia de las imágenes: Notas sobre la postfotografía. Y seamos francos, porque nadie puede negar que la evolución tecnológica aplicada a la imagen no solo ha perfeccionado la calidad de los acabados finales, sino que ha supuesto una auténtica revolución creativa, con una diversidad de estilos, propuestas y fusiones visuales asombrosa. Y tampoco ha supuesto la muerte de la fotografía química, la cual ha resurgido en los últimos años como una opción identitaria más dentro de toda esta pluralidad audiovisual que, a pesar de su esencia purista, también se difunde a través de plataformas como Instagram, TikTok, o Facebook, gobernadas todas ellas por algoritmos que funcionan con inteligencia artificial.

Todo avance tecnológico que directamente toca la fibra de cualquier sector productivo nunca está exento de polémica, como tampoco lo está de consecuencias, tanto en lo positivo como en lo negativo. 

En mi caso, llevo más de 30 años creando imágenes a través de la fotografía, el diseño y el vídeo, 10 de los cuáles fueron exclusivamente analógicos. Ya son 20 años como profesional autónomo y 16 con mi propio estudio de comunicación audiovisual. Todo ese recorrido y todo lo que he aprendido a hacer durante el mismo no hubiera sido posible si me hubiera cerrado en banda ante la irrupción de lo digital y de cada avance que ello ha traído consigo. No se trata de abrazar el progreso con los brazos abiertos y ofrecerle un cheque en blanco válido para todo. Dudar, cuestionarse las cosas, ser crítico…, es fundamental porque nos abre las puertas a la investigación personal y también a la profesional, y en el caso de la inteligencia artificial, hay tantos motivos para temerla como los hay para adentrase en ella y explorar todas sus posibilidades, no solo en lo concerniente a la IA generativa, sino también a todo el abanico de herramientas que están surgiendo y que ya están reformulando drásticamente las técnicas de edición y postproducción digital de imágenes. A algunas de estas herramientas, que no van específicamente destinadas a la creación de obra gráfica a través de la IA, vamos a dedicar las siguientes líneas de este post. Porque no todo gira en torno a ChatGPT o Midjourney. La IA, a nivel técnico, también nos va a permitir simplificar los tratamientos de edición y mejorar muchísimo la calidad de nuestras imágenes y sus acabados finales, tanto para uso digital como para impresión, hasta tal punto que, debates que durante años han formado parte de las vicisitudes del sector de la fotografía como ese de, qué tamaño de sensor necesito para obtener imágenes a altísima resolución, quedan aquí zanjados para siempre.

Vamos pues…

Super Resolution, de Adobe

Mal habría quedado el desarrollador por antonomasia de los softwares de edición de imagen y vídeo más usados del mercado si no se hubiera subido al tren de la inteligencia artificial con sus propias propuestas y, cabe decir, que no lo ha hecho nada mal.

A comienzos de 2021, Adobe sorprendió a sus usuarios con una actualización de Adobe Camera Raw que introducía una herramienta novedosa llamada Super Resolution. Esta función dejó a muchos boquiabiertos, incluido quién os habla, marcando un hito en el constante debate sobre la resolución y el tamaño del sensor al considerar la compra de una cámara fotográfica. De repente, la resolución de un archivo RAW dejaba de estar vinculada exclusivamente a la captura en cámara y pasaba a depender de la capacidad de un software que podía incrementar hasta cuatro veces la resolución de la imagen original. Aunque inicialmente se evidenciaron ciertos defectos que requerían ajustes (nada que no pudiera solucionarse con otras herramientas de Camera Raw y Photoshop), con el tiempo, estos aspectos han ido mejorado considerablemente, cuestionando, así, la necesidad de contar con una Full Frame repleta de megapíxeles.

herramientas-inteligencia-artificial-para-fotografos-5-arcadina
Archivo RAW sin procesar abierto en Adobe Camera Raw.

Super Resolution parte de una inteligencia artificial llamada Enhance Details, desarrollada apenas un par de años antes de ser incorporada a Adobe Camera Raw. Esta IA ha sido entrenada con millones de imágenes para comprender los patrones de interpolación y corregir a base de algoritmos los principales errores de pixelación y bandeo de color al interpolar una imagen. En otras palabras, rellena la información faltante en la imagen original con datos «inventados», permitiendo así alcanzar un archivo con muchísima más información que el obtenido por la cámara. La interpolación no es algo nuevo para quienes trabajamos digitalmente con imágenes, pero los resultados, especialmente cuando la diferencia entre el tamaño del archivo original y el archivo resultante era considerable, a menudo dejaban mucho que desear, a pesar de la postproducción realizada. De repente, una IA llegó para resolver uno de los principales desafíos para fotógrafos y creativos digitales, y lo hizo de manera automatizada y rápida. Conforme esta IA sigue entrenándose, los resultados se acercan cada vez más a la perfección de una imagen original capturada con un sensor de altísima resolución.

Si alguien lleva idea de comprarse la cámara con el sensor más potente del mercado para empapelarse las paredes de su casa con fotos del tamaño de una valla publicitaria, le recomiendo que revise bien su workflow, porque esto no ha hecho más que empezar…

Para activar Super Resolution una vez abierto nuestro archivo RAW en Adobe Camera Raw, solo hay que pulsar sobre nuestra imagen con el botón secundario del ratón y desplegar el menú de opciones. A continuación, seleccionamos la opción Mejorar y en el siguiente cuadro activamos el campo Super Resolución, para finalizar pulsando en el botón Mejorar.

herramientas-inteligencia-artificial-para-fotografos-6-arcadina

herramientas-inteligencia-artificial-para-fotografos-7-arcadina

Esto generará un archivo DNG que, dependiendo de la potencia de nuestro equipo informático, tardará más o menos. Una vez generado podemos seleccionar el archivo con el que queremos trabajar, pulsando sobre las miniaturas de la imagen que aparecen en la parte inferior de la pantalla principal de Adobe Camera Raw, siendo la primera la original y la segunda la mejorada.

Para que os hagáis una idea de lo que se consigue con Super Resolution, el RAW original que podéis ver en las capturas de pantalla se corresponde a una fotografía tomada con mi Nikon D750 Full Frame, con un sensor de 24,2 MP y un tamaño de salida de 4016×6016 mm a 300 ppp. Tras el procesado de esta con Super Resolution, el archivo DNG resultante equivale a un archivo de 96,6 MP con un tamaño de salida de 8032×12032 mm a 300 ppp. Este proceso lo podéis realizar tanto antes como después de ajustar el resto de los parámetros de Adobe Camera Raw, ya que el uso de Super Resolution no modifica los ajustes ya existentes en el momento de su ejecución

herramientas-inteligencia-artificial-para-fotografos-8-arcadina

Así que, si alguien lleva idea de comprarse la cámara con el sensor más potente del mercado para empapelarse las paredes de su casa con fotos del tamaño de una valla publicitaria, le recomiendo que revise bien su workflow, porque esto no ha hecho más que empezar…

Generative Fill, también de Adobe

Y ahora sí que os va a estallar la cabeza a quiénes no conozcáis esta herramienta que, durante unos meses, se puso a prueba en una especie de versión beta de Photoshop incluida en Adobe Creative Cloud y que, desde finales del pasado año, ya va incorporada en las últimas versiones de Adobe Photoshop. Se trata de la herramienta Generative Fill que se puede usar con dos variantes: Relleno Generativo y Ampliación Generativa.

Mejor partir de un ejemplo práctico así que, vamos a suponer que tenemos una imagen fotográfica en formato vertical y necesitamos obtener de ella otra en formato horizontal. Hasta ahora, lo único que podíamos hacer era aplicar el formato recortando, únicamente, el contenido de la imagen original, a no ser que fuéramos unos superdotados del retoque digital capaces de rellenar a la perfección el contenido de las zonas vacías derivadas de ampliar el encuadre sin recorte.

herramientas-inteligencia-artificial-para-fotografos-9-arcadina

Pues bien. Ahora, una vez abierta la imagen vertical en Photoshop, vamos a empezar usando la Ampliación Generativa, para lo cual, activaremos la herramienta Recortar en la barra de herramientas. Tras activarla, veremos sus opciones en la barra superior de la ventana principal y, al desplegar el campo Relleno, encontraremos la función Ampliación generativa que es la que debemos seleccionar.

Tras esto, ajustaremos también la proporción para el nuevo formato de recorte, por ejemplo 3:2 (horizontal) y, a continuación, aplicaremos la ampliación que queremos obtener sobre la imagen y pulsaremos enter/intro.

Y aquí empieza la magia. En pantalla aparecerá una pequeña ventana con una pregunta aparentemente sencilla: ¿Qué desea generar?

herramientas-inteligencia-artificial-para-fotografos-10-arcadina
Herramienta Ampliación Generativa activa.

La IA de Generative Fill analizará en poco segundos la imagen original e «inventará» el contenido restante con tal coherencia, que a más de uno se le van a salir los ojos de las órbitas.

Es en ese campo dónde debemos de introducir el prompt, o sea, las instrucciones que debemos darle a la IA para que genere nuevo contenido y rellenar así las zonas vacías del nuevo encuadre. Pero el caso es que la herramienta es tan ‘inteligente’, que podemos prescindir totalmente de introducir ninguna instrucción, razón por la que al lado de la pregunta aparece el texto Opcional y simplemente pulsar el botón Generar. La IA de Generative Fill analizará en poco segundos la imagen original e «inventará» el contenido restante con tal coherencia, que a más de uno se le van a salir los ojos de las órbitas. A mí me pasó la primera vez, me los tuve que coger de encima del teclado y poner de nuevo en las cuencas.

herramientas-inteligencia-artificial-para-fotografos-11-arcadina
Resultado de la aplicación de la herramienta Ampliación Generativa sobre la imagen vertical original.

Pero ¡ojo!, que la cosa no acaba aquí. Como la IA es más chula que un ocho, no solo te va a generar un único contenido, sino que te va a plantear 3 propuestas como mínimo, las cuáles te mostrará en otra ventana, en forma de miniaturas que podrás pulsar para ver cada variante en la imagen principal. Y si ninguna de las propuestas te convence, desde esa misma ventana puedes generar nuevas variantes hasta el infinito y más allá. Con cada clic, la IA te generará 3 propuestas más con lo que puedes correr el peligro de entrar en bucle y que al día siguiente te encuentren petrificado delante del ordenador y con el dedo índice como si estuvieras enviando un telegrama a la vieja usanza.

Y no te olvides de que dispones de la opción para indicarle mediante un prompt, de manera más concreta, qué es lo que quieres que te genere, con lo que, si la plena automatización no te convence, siempre puedes probar a introducir instrucciones más precisas, las cuáles te recomiendo que sean lo más concretas posibles (esto no es Midjourney o ChatGPT) y, por supuesto, en inglés, con lo que si tu nivel no es muy fluido, don’t worry, porque al final de este artículo te contaré alguna cosilla que puedes hacer para subsanar este problema…, también con la IA, por supuesto, que de eso va todo este rollo.

herramientas-inteligencia-artificial-para-fotografos-12-arcadina

Pero Generative Fill también te permite ampliar imágenes con contenido inexistente e incluso introducir nuevos elementos como objetos, cambios de vestuario en incluso eliminar cosas tan molestas como ese dedo que metiste delante de la cámara en el momento de disparar una foto. Y para eso tenemos la opción de trabajar la imagen con el método Relleno Generativo.

En este caso podemos obtener resultados similares a los de Ampliación Generativa, si lo que pretendemos es ampliar el contenido de la imagen original, con lo que podemos partir de nuevo de la herramienta Recortar pero, en este caso, en el campo Relleno simplemente seleccionaremos la opción Fondo (predeterminado) con lo cual, al ampliar el formato según la proporción elegida (vamos a probar de nuevo con la 3:2), lo que obtendrás son zonas vacías alrededor del original únicamente con el color uniforme que tengas seleccionado como color de fondo.

Para usar el Relleno Generativo activaremos la herramienta de selección y seleccionaremos las partes vacías del nuevo encuadre incluyendo en esta, siempre, una pequeña parte del contenido original para que la IA pueda disponer de un punto de partida con el que generar el nuevo contenido. En este caso podemos seleccionar todas las partes en una única selección o trabajar cada zona con selecciones independientes y, por tanto, obtener varias generaciones de contenido en una misma imagen.

Con la selección activa, hacemos clic sobre ella con el botón secundario del ratón y, en el menú desplegable, veremos las tres opciones que nos interesan: Relleno según contenido, Relleno generativo y Eliminar y rellenar selección.

herramientas-inteligencia-artificial-para-fotografos-13-arcadina

En el caso de Relleno generativo, los pasos a seguir son exactamente los mismos que con la Ampliación Generativa, con lo que, de nuevo, partiremos de la ventanita con eso de ¿Qué desea generar?

Con la opción Eliminar y rellenar selección el proceso es totalmente automatizado, sin opción de introducir ningún prompt y, por las pruebas que yo mismo he realizado, casi es preferible usar esta opción para obtener un relleno a partir de un contenido original uniforme como, por ejemplo, ampliar el fondo neutro de un retrato en estudio.

Por último, podemos optar por Relleno según contenido, con lo que se nos activará una especie de herramienta de pincel con la que podemos ir obteniendo muestras alrededor de la imagen original para que la IA genere contenido basado en ellas dentro de la zona de selección.

herramientas-inteligencia-artificial-para-fotografos-14-arcadina
Resultado de la aplicación de la herramienta Relleno Generativo sobre la imagen vertical original.

Pero sin duda, una de las utilidades más interesantes del Relleno Generativo es, tal y como he comentado antes, la posibilidad de crear o eliminar contenidos dentro de la propia imagen original, para lo cual, sí debemos de trabajar a través de la ventanita del prompt e introducir las instrucciones (en inglés) de lo que queremos que haga la inteligencia artificial. Así que, a modo de demostración, la mejor manera de ver las posibilidades es mediante la comparativa y sirva como ejemplo las tres pruebas que podéis ver a continuación, en las que hemos trabajado seleccionando únicamente la zona de la imagen original en la que queremos intervenir. En la primera le hemos pedido a la IA que elimine unas letras sobre una prenda de vestir, en la segunda que elimine un cactus y que rellene la zona con el contenido del fondo y, en la tercera, que añada sobre la imagen de una modelo, nada más y nada menos, que unas gafas de sol.

herramientas-inteligencia-artificial-para-fotografos-15-arcadina
herramientas-inteligencia-artificial-para-fotografos-16-arcadina
herramientas-inteligencia-artificial-para-fotografos-17-arcadina

De todos modos, hay que aceptar que, en no pocos aspectos, la inteligencia artificial generativa no es perfecta, y no es para nada extraño encontrarse con auténticas aberraciones al más puro estilo de la película La Cosa (John Carpenter, 1982), sobre todo al generar partes del cuerpo humano como manos, piernas o brazos, por no decir algunas miradas y bocas que ni el Ecce Homo de Borja. También pasa lo mismo cuando la ampliación o el relleno incluye partes de objetos no completos en la imagen original, como un coche o, ya puestos, una cámara fotográfica. Pero tiempo al tiempo, porque son cuestiones que, sin duda, van a resolverse, y con creces, a medida que la IA vaya perfeccionándose.

Más allá de Adobe: Topaz Labs

Dejamos de lado a Adobe y nos metemos de lleno en otra colección de softwares basados en inteligencia artificial que son una auténtica maravilla y que van más destinados a un uso técnico que a la generación de contenidos propiamente.

Mi primer contacto con la IA desarrollada por l@s chic@s de Topaz Labs fue anterior a descubrir la IA generativa. Fue hace un par de años cuando empezó a sonar con fuerza un programa llamado Topaz Sharpen AI que, según la publicidad en RRSS, permitía «enfocar» imágenes desenfocadas e incluso movidas a partir de cualquier formato de archivo y con unos resultados nunca vistos hasta entonces. Topaz Sharpen AI no era la única herramienta IA que por aquel entonces basaba su éxito en la posibilidad de crear nitidez y detalle dónde no lo había, pero el hecho de venir de una marca ya conocida por sus plugins integrables en Photoshop o Illustrator y mostrarse con una interfaz, tan completa e intuitiva como sencilla de usar, fue la que me llevó a escogerla antes que otras opciones del mercado. Y, la verdad, no defraudó. Y es que el pretexto de solucionar problemas de enfoque o movimiento se queda corto con todas las posibilidades que el programa ofrece y que, al completarlo con otras aplicaciones de la casa como Topaz Noise AI o Topaz Gigapixel AI, suponen otra vuelta de tuerca para reafirmarse en que el tamaño de un sensor de cámara ya no importa.

herramientas-inteligencia-artificial-para-fotografos-18-arcadina
Interfaz de Topaz Sharpen AI.

Trabajar con los programas de Topaz Labs es relativamente sencillo. Se trata de comprender el funcionamiento de unos pocos parámetros que nos permitirán operar de manera manual o dejar que la IA actúe en modo automático según las opciones de cada aplicación.

Actualmente existe una versión de Topaz Labs que integra el funcionamiento de las tres aplicaciones que vamos a ver a continuación, aunque de manera más simplificada. Se trata de Topaz Photo AI. Pero creo que la mejor manera de entender el funcionamiento de esta IA es verlo sobre cada tipo de aplicación por separado y luego ya, cada uno, que decida si le interesa una opción u otra porque, al fin y al cabo, los conceptos en los que se basan son los mismos, tanto en las versiones individuales como en la versión integral.

Topaz Sharpen AI

En el caso de Topaz Sharpen AI, disponemos de 4 modelos principales de procesado de imagen. El modelo Standard, que aplica un procesado general sobre la imagen, el Motion Blur, con el que podemos trabajar sobre imágenes afectadas por un desenfoque se movimiento, Out of Focus para imágenes directamente desenfocadas y el Too Soft para aquellas que, sin tener un desenfoque muy pronunciado, sí están afectadas por cierta falta de nitidez. Todos estos modelos tienen a su vez 3 opciones más, Normal, Very Noisy y Very Blurry, con las que podemos afinar mejor el procesado dependiendo de si el problema de falta de nitidez proviene de un exceso de ruido en la imagen o de que esta esté, directamente, borrosa. Pero, lo mejor de todo es que, si no tenemos claro que opción es la mejor para solucionar el problema de nitidez de cada imagen, podemos automatizar el proceso y dejar que la IA haga un análisis previo y escoja el modelo idóneo de procesado según cada imagen. Para ello debemos activar la opción automática (indicada con un icono en forma de rayo) en el selector del menú Sharpen Model.

Además, también tenemos la opción de operar con cada modelo de procesado, tanto de manera automática como en manual, afinando nosotros mismos el enfoque de la imagen (Remove Blur) y el ruido (Suppress Noise), o dejando que la IA lo haga automáticamente.

herramientas-inteligencia-artificial-para-fotografos-19-arcadina

Otro aspecto muy interesante de Topaz Sharpen AI es la función de procesado en modo máscara, que puede venir muy bien en fotografías en las que queramos corregir aspectos como la profundidad de campo o ganar nitidez en zonas concretas de la imagen. Y es que, con la opción Select activada podemos escoger varios tipos de máscara automatizadas o expandir o reducir estas (Refine) mediante una herramienta de pincel (Brush) que también lleva sus propios parámetros de configuración y guardado.

herramientas-inteligencia-artificial-para-fotografos-20-arcadina

Si con la herramienta Super Resolution de Adobe no tenéis suficiente, todos los programas de Topaz Labs están preparados para trabajar directamente sobre un archivo RAW, con lo que os podéis hacer una idea de la resolución y calidad visual que podéis llegar a conseguir, combinando diferentes herramientas, en el proceso de revelado digital previo a la edición o postproducción de la imagen.

Y para poder ver todos estos efectos con total claridad antes de aplicar cada procesado, la interfaz de Topaz Sharpen AI nos permite una visualización en varios modos y con un zoom de hasta el 400%, combinando la imagen original con el previo del procesado en ventanas partidas o desplazables o mediante la muestra de varios de los modelos a la vez con lo que podemos comparar diferentes resultados sobre una misma imagen. Tanto Topaz Sharpen AI como Topaz Noise AI, del que vamos a hablar a continuación, se pueden integrar como plugins de Photoshop, lo que nos permite operar sobre cualquier archivo que tengamos abierto en el programa de Adobe y, además, si con la herramienta Super Resolution de Adobe no tenéis suficiente, todos los programas de Topaz Labs están preparados para trabajar directamente sobre un archivo RAW, con lo que os podéis hacer una idea de la resolución y calidad visual que podéis llegar a conseguir, combinando diferentes herramientas, en el proceso de revelado digital previo a la edición o postproducción de la imagen.

Topaz Noise AI

La interfaz de Topaz Noise AI es prácticamente idéntica a la de Topaz Sharpen AI pero, en este caso, como su nombre indica, el programa está destinado a solucionar los problemas de ruido o «grano» digital, otro de los quebraderos de cabeza con los que nos hemos encontrado muchos fotógrafos, sobre todo, al trabajar a altas sensibilidades en condiciones de luz baja, con esas combinaciones tan molestas entre luces nítidas y sombras llenas de ruido.

De nuevo disponemos de las mismas ventanas de previsualización y comparativas entre originales y procesados disponibles en Topaz Sharpen AI y, en este caso, cinco modelos para procesar nuestra imagen: el Standard, que reduce de manera integral el ruido preservando los detalles; Clear, que funciona muy bien sobre superficies lisas como la piel; Low Light, para imágenes tomadas en situaciones de baja iluminación; Severe Noise, para condiciones de ruido excesivo y, por último, el modo RAW, preparado para trabajar mejor a partir de archivos RAW sin procesar.

herramientas-inteligencia-artificial-para-fotografos-21-arcadina
Interfaz de Topaz Noise AI.

Cada modelo lleva sus propias herramientas para afinar de manera manual el procesado de eliminación de ruido (Remove Noise) y la mejora de la nitidez de los detalles de la imagen (Enhance Sharpness).

Sobra decir que, tanto a la hora de escoger el modelo de procesado que mejor se ajusta a la imagen original como a la hora de hacer uso de las herramientas de cada modelo, la IA puede trabajar también de manera automatizada, analizando las condiciones de cada imagen y escogiendo el modelo más adecuado, así como el ajuste idóneo de cada tipo de procesado.

Y si con esto no tienes suficiente, Topaz Noise AI te permite realizar un último ajuste (Post Processing) posterior al procesado de la IA, con el que podemos ganar un poco más de definición o solucionar problemas de artefactos de color.

Topaz Gigapixel AI

Y vamos ahora con una herramienta que, en mi caso, se ha vuelto fundamental, sobre todo para imágenes creadas a partir de IA generativa, como es el caso de Midjourney que, hoy en día, solo permite obtenerlas a baja resolución como, por ejemplo, los 1024×1024 píxeles en formato 1:1, que es el que más suelo utilizar.

La IA de Topaz Gigapixel AI nos permite escalar cualquier archivo de imagen al tamaño de salida que queramos, con independencia de la compresión y resolución de este, obteniendo una calidad de detalle espectacular que perfectamente pasaría el control de calidad de un archivo destinado a impresión en gran formato. Aunque ¡ojo!, porque la IA no hace milagros y el resultado final depende de otros factores, no únicamente del tamaño del original.

Os pongo como ejemplo mi propio sistema de trabajo.

Como ya os he comentado, cuando genero imágenes con Midjourney en formato cuadrado, estás no son superiores a los 1024 px de cada lado y, por tanto, si a partir de ese tamaño quiero obtener, por ejemplo, un archivo de impresión de 50×50 cm (5906 px a 300 ppp), estamos hablando de una diferencia bastante considerable entre el original y el tamaño de imagen al que quiero trabajar como para conseguir una buena calidad visual con todo detalle y nitidez.

Por tanto, antes de editar cualquier archivo de baja resolución en Photoshop, lo que hago es pasarlo primero por Topaz Gigapixel AI y escalarlo ya al tamaño de salida que quiero para cada imagen, dejando que la IA aplique sobre ella lo que podríamos entender como una interpolación a lo bestia.

herramientas-inteligencia-artificial-para-fotografos-22-arcadina
Interfaz de Topaz Gigapixel AI. A la izquierda, la imagen original a 1024 px. A la derecha el procesado a 5906 px.

La IA de Topaz Gigapixel AI nos permite escalar cualquier archivo de imagen al tamaño de salida que queramos, con independencia de la compresión y resolución de este, obteniendo una calidad de detalle espectacular que perfectamente pasaría el control de calidad de un archivo destinado a impresión en gran formato.

De nuevo nos encontramos con el mismo tipo de interfaz de Topaz Sharpen AI y Topaz Noise AI, con sus ventanas de previsualización características y sus modelos de procesado. Pero previamente, en el campo Resize Mode debemos indicar la escala (Scale) o el tamaño de salida priorizando, según nos interese, el ancho de la imagen (Width) o la altura (Height) e indicando el valor de este en el campo Output… en píxeles, pulgadas o centímetros.

Con este dato ya introducido, ya podemos elegir y ajustar cualquiera de los 5 modelos de procesado que ofrece el programa, o bien dejar que la IA lo haga por nosotros de manera automática según su propio análisis de la imagen original.

En este caso disponemos, de nuevo, de un modelo Standard que actúa de manera general con todo tipo de imágenes. El modo Lines aplica una mejor precisión sobre fotografías de arquitectura o de paisajes urbanos en las que nos interesa resaltar la definición de las líneas, fugas, etc. Art & CG es la opción idónea para imágenes gráficas, dibujos o escaneados. Con HQ podemos mejorar imágenes ya obtenidas originariamente a alta resolución o trabajar con aquellas que ya han pasado por un procesado previo como, por ejemplo, aplicación de filtros digitales, eliminación de ruido, interpolación, etc. Con Low Res podemos escalar imágenes extraídas de la web o capturas de pantalla, las cuáles no suelen superar los 72 px ppp. Y, por último, tenemos el modelo Very Compressed que es una buena opción para imágenes con muchos artefactos de compresión o para mejorar digitalizaciones a partir de un soporte químico como un negativo, una diapositiva o un positivado en papel fotográfico.

Cada modelo dispone de sus propios ajustes que, de nuevo, pueden ser automatizados, o manuales. Con estos ajustes podemos reducir el ruido de la imagen y minimizar los desenfoques de lente o los producidos por movimiento. Además, en los modelos Standard y HQ disponemos de un ajuste adicional, Fix Compression, con el que podemos mejorar la imagen reduciendo, también, los artefactos de compresión.

Topaz Video AI

He querido incluir en este artículo un programa de inteligencia artificial dedicado al vídeo, por un lado, porque sé que muchos fotógrafos tocan también esta disciplina y, por otro, porque si con los programas anteriores ha quedado en evidencia que la IA está propiciado una cambio descomunal con respecto a las necesidades técnicas a la hora de adquirir una cámara fotográfica, no os hacéis una idea de lo que se avecina ahora en el terreno del vídeo y eso que, por ahora, solo vamos a incidir en el uso de la IA como herramienta técnica de edición, porque si abrimos el melón de lo que ya se está planteando a nivel de IA generativa aplicada al vídeo, cine, etcétera, más de uno va a saltar de cabeza por la ventana.

La última virguería de l@s chic@s de Topaz Labs es Topaz Video AI y, de nuevo, estamos antes un software que nos va a hacer replantear las cosas, y mucho, a la hora de decidir qué equipo adquirir para grabar en vídeo porque, si en el caso de la IA aplicada a la fotografía, cuestiones como la potencia del sensor de cámara ya no son tan determinantes para obtener imágenes a altísima resolución, en lo concerniente al vídeo, poco va a importar a partir de hora la resolución de grabación o el frame rate.

herramientas-inteligencia-artificial-para-fotografos-23-arcadina
Interfaz de Topaz Video AI.

La última virguería de l@s chic@s de Topaz Labs es Topaz Video AI y, de nuevo, estamos antes un software que nos va a hacer replantear las cosas, y mucho, a la hora de decidir qué equipo adquirir para grabar en vídeo.

Pongamos, por ejemplo, que registras una grabación en vídeo, sea con una cámara de vídeo propiamente, una DSLR o un smartphone, a una resolución Full HD (1920×1080 px) y a 30 fps. Pues bien, con Topaz Video AI puedes escalar ese archivo de vídeo a una resolución de hasta 8K con la misma calidad que si lo hubieras obtenido originariamente en cámara a esa misma resolución y, además, (preparaos para pillaros de nuevo los ojos al vuelo) convertir el frame rate original a cualquier otro comprendido entre los 24 y los 120 fps, o cambiar el tipo de codificación (códec) en los ajustes de salida del archivo final, sea cual sea el utilizado en la grabación, con la calidad propia de un códec nativo.

De nuevo recurro a mi propia experiencia. Hace unos años adquirí una cámara, la Panasonic Lumix DMC FZ2000, un modelo bridge que en su momento tuvo cierta repercusión por lo bien equipada que venía para la grabación de vídeo, incluso a un nivel semiprofesional. Permitía una captura de hasta 4K a 30 fps son un sensor de 1 pulgada, y destacaba por su conectividad para accesorios imprescindibles como micrófonos, pantallas externas, etcétera. A eso cabía sumarle una potente óptica Leica con un zoom de 24-480 mm y un sinfín de funciones propias de un equipo profesional sin serlo. En su momento fue una de las mejores inversiones que hice en equipamiento para mi estudio algo que, ahora, gracias a las opciones de la IA, se ha consolidado en su totalidad a pesar de la cantidad de cámaras superiores, en todos los aspectos, que han surgido desde entonces.

herramientas-inteligencia-artificial-para-fotografos-24-arcadina
Mi equipo de vídeo con la Panasonic Lumix DMC FZ2000.

Y es que la FZ2000 tenía sus obvias limitaciones para una cámara dentro de un rango de precio no superior a los 1.300 € en su momento. Por un lado, a pesar de permitir grabar en 4K a 30 fps, esto se quedó rápidamente obsoleto con la aparición de cámaras que permitían grabar en UHD, con frame rates superiores, y sin aplicar ningún factor de recorte en el sensor, como sí es el caso de esta cámara, o la limitación de códecs de grabación y el bitrate que impedían una calidad de imagen superior. Aunque el vídeo no es la disciplina que más trabajo en mi estudio, sí que estuve tentado en vender este equipo e invertir en una cámara superior que me permitiera grabaciones en 4K con un mayor frame rate, fundamental para obtener un efecto de cámara lenta limpio y sin trompicones y poder aprovechar al máximo una óptica gran angular a esa resolución, cuestiones que con la FZ2000 solo eran viables en grabaciones a Full HD como máximo.

Pues bien, en medio de este dilema, aparece Topaz Video AI, planteando una serie de soluciones para el vídeo imposibles de creer hasta ahora y tras varias pruebas reconvirtiendo algunos de mis proyectos en vídeo he llegado a la conclusión de que tengo el equipo idóneo para realizar cualquier proyecto de vídeo sin necesidad de cambiar de cámara en mucho tiempo y supliendo sus limitaciones gracias a la inteligencia artificial, obteniendo vídeo finales con una calidad cercana al broadcast.

Al abrir Topaz Video AI nos encontramos, de nuevo, con una interfaz sencilla, marca de la casa, con una ventana principal dónde podemos visualizar nuestro vídeo tras cargarlo desde nuestro equipo y previsualizar (Preview) la conversión que apliquemos, comparando esta con el original en pantalla partida. Además, tenemos la opción de recortar el vídeo (Trim) o modificar el encuadre final a nuestro antojo (Crop).

Pero en lo que nos debemos de fijar antes de nada es en la columna lateral y en la cantidad de opciones que el programa nos ofrece, pudiendo optar por presets ya preparados que pueden ser ampliables con otros parámetros, o componer una batería de opciones a nuestro gusto según el resultado que busquemos con la conversión.

herramientas-inteligencia-artificial-para-fotografos-25-arcadina

En el apartado Video, vemos indicada la resolución y el frame rate del archivo original y, a partir de ahí, en los desplegables del campo Out podemos seleccionar la resolución de salida y el nuevo frame rate que deseamos aplicar en la conversión, escalando la imagen a los formatos estándar (SD, HD, FullHD, 4K, 8K…) o bien creando nuestros propios escalados personalizados.

Pero Topaz Video AI también dispone de filtros para mejorar la imagen con su propio sistema de estabilización mediante inteligencia artificial (Stabilization) que incluye aspectos ya conocidos por cualquier videógrafo como el Auto-Crop y otras funciones, o el muy interesante Motion Deblur que reduce el efecto de desenfoque en planos en movimiento, aumentando la nitidez y el detalle sin ese molesto contraste en los bordes propio de una interpolación hecha de manera rudimentaria. Y si lo que queremos es conseguir un buen efecto de cámara lenta, con la función Frame Interpolation y sus diferentes opciones, la IA hará lo suyo con unos resultados espectaculares. Por último, en el apartado de filtros, tenemos la función Enhancement con sus respectivas opciones de entrada para archivos de vídeo creados en origen en modo progresivo (p) o entrelazado (i) y que, en mi caso, ha sido fundamental para mejorar la calidad de vídeos digitalizados a partir de formatos de vídeo analógicos como el VHS y eliminar las molestas líneas de escaneo características de este tipo de procesos de conversión analógica a digital.

Y no nos olvidamos de otra herramienta fundamental de Topaz Video AI: los ajustes de codificación de salida (Output Settings) que incluyen varios códecs estándard como el H264 o el H265, pero también algunos de alto rendimiento como los ProRes de Apple, con los que podéis obtener una mejor calidad de vídeo y tasa de bits con respecto al original.

Eso sí, a diferencia de los programas de Topaz Labs destinados a imagen fija, los cuáles suelen funcionar de manera bastante rápida aunque uno no disponga de un ordenador muy potente, en el caso de Topaz Video AI, y como es lógico con cualquier programa de edición videográfica digital, es recomendable fijarse bien en los requisitos técnicos que el programa requiere porque os aseguro que, algunos de los procesos, y en especial cuando trabajamos con vídeos relativamente largos, van a necesitar de una buena máquina, tanto en procesador, RAM, como gráfica, para, primero, poder ejecutar la previsualización sin problemas y, luego, procesar el archivo final.

Y por fin, The End

Y llegamos al final de tan extenso artículo y eso que me he dejado muchas opciones en el tintero que ya veremos en próximos posts dedicados a la inteligencia artificial. De hecho, en algún momento tendremos que hablar de Adobe Firefly, la incursión de Adobe en la IA generativa al estilo Midjourney o Dall-E, pero con su propia interfaz, la cual todavía estoy investigando, como también habrá que dedicar su tiempo a analizar el funcionamiento de herramientas tan interesantes como Evoto (entre otras) con la que podemos conseguir resultados espectaculares en el tratamiento de las pieles de los retratos fotográficos, sustituyendo con la IA procesos de edición tan laboriosos como el retoque por separación de frecuencias o el Dodge and Burn, con idénticos resultados.

herramientas-inteligencia-artificial-para-fotografos-26-arcadina
Adobe Firefly, el «Midjourney» de Adobe con algunas cosas más.

La IA es inevitable, como lo han sido muchos otros avances a lo largo de la historia. El mejor modo de adaptarnos a los cambios es la investigación personal y, como mínimo, el conocimiento, incluso de aquello que nos contradice.

Soy consciente de que la irrupción de la inteligencia artificial lleva consigo un debate interno y, como ya he comentado al principio de este artículo, no se trata de aceptar todo lo que se nos propone ni dejar de lado otras metodologías que nos hagan disfrutar de los procesos con independencia del resultado final. Cada profesional, creativo o artista es quien tiene la última palabra a la hora de integrar, o no, la IA en sus procesos de producción y en su manera de entender aquello que hace. Por eso he querido incidir en este artículo en herramientas prácticas y no tanto en lo concerniente a la IA generativa que simula imágenes como si fueran fotografías, ilustraciones y todo tipo de obras gráficas y, como siempre hago cuando Arcadina me invita a escribir un artículo en su blog, siempre planteo las cosas desde mis propia experiencia porque, para mí, la única manera de llegar a conclusiones cada vez que un avance tecnológico sacude los cimientos de los sectores en los que me muevo, es a base del método «prueba y resultado».

El futuro es inevitable por muchas reticencias que le pongamos a ello. La IA es inevitable, como lo han sido muchos otros avances a lo largo de la historia. El mejor modo de adaptarnos a los cambios es la investigación personal y, como mínimo, el conocimiento, incluso de aquello que nos contradice. Luego, ya cada uno encontrará la manera de encajar estos avances en su propio sistema de trabajo, llevándolos a su terreno, porque la IA va a abrir heridas en muchos frentes, pero también sanará muchas otras y, por mucho que esta tenga ya la capacidad de aprender por sí misma, el uso que de ella hagamos sigue dependiendo de nosotros mismos.

Bonus Track

Y como lo prometido es deuda, ahí va un consejo para quienes no tengan suficientes conocimientos para crear prompts en inglés con fluidez. Os recomiendo que probéis a escribir vuestros textos y luego uséis ChatGPT para traducirlos. Es más, ChatGPT puede desarrollar prompts específicos y muy bien detallados a partir de un briefing de lo que queréis conseguir y su capacidad de traducción de idiomas supera ya a la de cualquier traductor online como Deepl o Google Traductor, sobre todo si usáis la versión ChatGPT 4.0, la más avanzada, aunque cabe decir que esta ya es de pago.

Y, lo dicho, la única manera de aprender a controlar la IA es «prueba y resultado» y así sucesivamente hasta conseguir aquello que, claramente, lo sintáis como propio…

¿Continuará…?

Nat Gutiérrez | @natestudi

¡Comparte!
Subscribe
Notify of
guest

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

0 Comments
Inline Feedbacks
View all comments