L’AI applicata alla fotografia: strumenti per trasformare l’intelligenza artificiale in un alleato

È passato un anno da quando ho scritto il mio primo articolo in questo blog sull’intelligenza artificiale e sull’impatto che avrebbe avuto sul settore della fotografia, sia a livello creativo che professionale. E il fatto è che l’IA ha smesso di essere quell’innovazione ricorrente che nell’immaginario collettivo ha avuto tante forme che sono nate dal cinema o dalla letteratura di fantascienza per diventare una realtà fattibile che, fino a pochissimo tempo fa, nessuno si aspettava. E questo, nonostante il primo abbozzo di intelligenza artificiale risalga al 1939, quando il matematico inglese Alan Turing ideò Bombe, la macchina calcolatrice con cui fu possibile decifrare i codici Enigma nazisti, con un tempo sufficiente ad anticipare le mosse del Reich durante la Seconda Guerra Mondiale.

strumenti-di-intelligenza-artificiale-per-fotografi-copertina-arcadina

Il primo abbozzo di intelligenza artificiale risale al 1939, quando il matematico inglese
Alan Turing ideò Bombe, la macchina calcolatrice con cui fu possibile decifrare i codici Enigma nazisti.

E così, mentre HAL 9000 si ribellava agli umani in 2001 Odissea nello spazio (Stanley Kubrick, 1968) o Rick Deckard in Blade Runner (Ridley Scott, 1982) dava la caccia a replicanti dotati di un’intelligenza emotiva non molto più sviluppata di quella del bambino supergiocattolo in A.I. Intelligenza Artificiale (Steven Spielberg, 2001), nel mondo reale è nato Eliza (1966), il primo programma basato sull’idea di reti neurali artificiali, un supercomputer chiamato Deep Blue ha sconfitto il campione mondiale di scacchi Gary Kasparov (1996), e AlphaGo (2015) e AlphaZero (2017) hanno fatto un enorme passo avanti, essendo i primi programmi conosciuti in grado di apprendere da soli.

Tutti questi eventi, all’epoca, non ebbero sulla coscienza collettiva un impatto maggiore di quello di una notizia riempitiva in un qualsiasi telegiornale o di un documentario di La 2 sulla scienza e la tecnologia, a patto che non si finisse per appisolarsi alla voce di Eduard Punset in sottofondo. E nonostante il fatto che tutta la conoscenza che c’è e ci sarà mai sia disponibile a chiunque grazie a Internet, la stragrande maggioranza delle intelligenze non artificiali sembra scegliere di utilizzare il fatto tecnologico per sbucciare il tacchino sulla RRSS, totalmente ignara dell’evoluzione degli eventi che preludono a un cambiamento di paradigma che senza dubbio stravolgerà tutto.

strumenti-di-intelligenza-artificiale-per-fotografi-1-arcadina
Bombe: il primo schizzo di un’intelligenza artificiale.

E l’intelligenza artificiale è qui per restare…

Già nel 2024 non bisogna guardare molto indietro per trovare una successione di eventi, in una timeline davvero breve, dopo i quali l’intelligenza artificiale ha smesso di essere un concetto alieno per il cittadino medio per diventare un “qualcosa” sufficientemente rilevante-stimolante-preoccupante-riempire la linea tratteggiata…, tanto che molti di noi non riescono a toglierselo dalla testa. Il colpo di scena è stato messo a segno da OpenAI nel 2019, con il lancio della versione 2 di ChatGPT, un’applicazione di chatbot di intelligenza artificiale, addestrata all’epoca a partire da 1,5 miliardi di parametri e 8 milioni di pagine web e che, a soli 4 anni di distanza, conta oggi 100 trilioni di parametri e un volume di dati di oltre un milione di Gigabyte.

strumenti-di-intelligenza-artificiale-per-fotografi-2-arcadina

Interfaccia della versione gratuita di ChatGPT.

Ma se c’è stato un momento specifico che ha messo in allarme fotografi, designer, illustratori, artisti grafici e audiovisivi, ecc. è stato nell’aprile del 2022, quando l’immagine di un astronauta a cavallo che attraversa il cielo ha iniziato a circolare sui media di tutto il mondo. Quella sorta di foto-illustrazione dall’aspetto realistico era stata generata da DALL-E 2, un’intelligenza artificiale creata anch’essa da OpenAI, capace di generare contenuti grafici a partire da una semplice spiegazione testuale, quello che oggi conosciamo come prompt. Improvvisamente ci siamo trovati di fronte all’evidenza che un’intelligenza artificiale poteva essere creativa ed emulare qualsiasi processo di produzione di immagini, con la differenza che, ciò che per un fotografo o un illustratore implicherebbe ore di lavoro o una grande quantità di risorse umane e tecniche, questa era in grado di raggiungere un risultato in pochi secondi, senza che la complessità o meno delle istruzioni fornite attraverso il prompt influisse minimamente sulla sua velocità di elaborazione.

E se questo ha già avuto un impatto, almeno tra quelli di noi che già cominciavano a vedere l’intelligenza artificiale come qualcosa da tenere in considerazione, nel luglio dello stesso anno è stata lanciata la prima versione open beta di quella che è senza dubbio l’IA che ha fatto scalpore nel settore audiovisivo e artistico. Sto parlando di Midjourney, l’intelligenza artificiale più avanzata che esista al momento in modo aperto per generare contenuti di immagini a partire da prompt, al punto che, oggi, è praticamente impossibile differenziare le immagini generate dall’IA da quelle ottenute con qualsiasi processo di creazione e produzione audiovisiva senza IA, con risultati così affascinanti e verosimili che, senza dubbio, possiamo già affermare, senza farci prendere la mano, che la capacità di un’IA di convertire un briefing in una finitura visiva finale è sempre più vicina a superare quella della stessa capacità umana.

strumenti-di-intelligenza-artificiale-per-fotografi-3-arcadina

Homepage di Midjourney.

È difficile trovare un precedente, sia nella rivoluzione industriale che nelle successive rivoluzioni tecnologiche e digitali, per un ritmo di sviluppo così vertiginoso che racchiude così tante possibilità, presenti e future…

Infatti, parte della ricerca e dell’apprendimento che molti di noi che hanno iniziato a introdurre l’IA nei propri processi creativi, dopo aver vissuto per anni l’evoluzione tecnologica, non senza aver digerito molte controversie interne, si basa sulla creazione dell’ingestibile, cioè di ciò che finora era realizzabile solo nell’immaginazione di ciascun individuo e impossibile da riprodurre a causa dei limiti della produzione nel mondo reale.

E la velocità con cui tutto questo sta avvenendo è travolgente. In effetti, è difficile trovare un precedente, né nella rivoluzione industriale né nelle successive rivoluzioni tecnologiche e digitali, di un ritmo di sviluppo così vertiginoso che racchiude così tante possibilità, presenti e future, praticamente in ogni campo che si possa pensare. Perché ci concentreremo sul settore audiovisivo, che è quello che ci interessa attraverso il contenuto di questo blog, ma è davvero travolgente cercare di elaborare tutto ciò che sta già accadendo, e tutto ciò che deve ancora arrivare, in altri campi così disparati come la scienza, la medicina, il giornalismo, la musica o la finanza. E lasciate che la mia più modesta esperienza serva da esempio di questa velocità: gli originali delle seguenti immagini, che potremmo chiamare i RAW di AI, sono stati creati con Midjourney con un prompt dalle caratteristiche testuali molto simili, ma a meno di un anno di distanza l’uno dall’altro; la prima immagine è il risultato che ho ottenuto nel gennaio 2023; la seconda risale all’agosto dello stesso anno.

strumenti-di-intelligenza-artificiale-per-fotografi-4-arcadina

Due immagini create da Midjourney a distanza di 8 mesi l’una dall’altra.

Se la capacità di creare finiture realistiche – ma non reali – attraverso l’intelligenza artificiale è arrivata a questo punto in meno di 8 mesi e continua a evolversi con la velocità con cui si sta evolvendo, è ovvio che ottenere una risposta alla domanda “E adesso?” potrebbe essere complesso come la quadratura del cerchio simbolicamente incarnata nella parabola di Sant’Agostino, della Trinità e del ragazzo che, secchio dopo secchio, cercava di svuotare tutta l’acqua del mare in un buco nella sabbia.

Un altro dilemma per l’industria fotografica

Ogni progresso tecnologico che tocca direttamente la fibra di qualsiasi settore produttivo non è mai esente da controversie, né da conseguenze, sia positive che negative. Tutti noi che ci siamo dedicati alla fotografia, e ancor più quelli che si sono formati nell’era analogica della celluloide e dei prodotti chimici, abbiamo avuto i nostri dilemmi morali con l’irruzione delle fotocamere digitali e la democratizzazione dell’uso di programmi di ritocco digitale come Photoshop. E non parliamo poi dei telefoni cellulari e delle loro fotocamere integrate sempre più sofisticate. Non sono mancate le voci che hanno gridato “la fotografia è morta”. Ma il fatto è che non è così. Oggi si scattano più fotografie che mai e, nonostante uno smartphone possa essere dotato di obiettivi Leica o Carl Zeiss, le fotocamere DSLR continuano a evolversi e a conquistare il mercato, fino a saturarlo con un’offerta così ampia. La fotografia non è morta, quello che è successo è che si è evoluta, superando limiti che 30 anni fa non avremmo immaginato, il che ha costretto i creativi, gli artisti e i professionisti di questo settore, non solo a incorporare il digitale nei loro processi di produzione di immagini, ma a reinventarsi e ad ampliare le loro capacità per offrire qualcosa con cui distinguersi in mezzo a questo fenomeno che Joan Fontcuberta ha sviscerato in modo molto intelligente nel suo saggio del 2020, La furia de las imágenes: Notas sobre la postfotografía (La furia delle immagini: note sulla post-fotografia). E siamo sinceri, perché nessuno può negare che l’evoluzione tecnologica applicata all’immagine non solo ha perfezionato la qualità delle finiture finali, ma ha anche portato a un’autentica rivoluzione creativa, con una sorprendente diversità di stili, proposte e fusioni visive. Né ha significato la morte della fotografia chimica, che negli ultimi anni è riemersa come un’altra opzione identitaria all’interno di tutta questa pluralità audiovisiva che, nonostante la sua essenza purista, viene diffusa anche attraverso piattaforme come Instagram, TikTok o Facebook, tutte governate da algoritmi che lavorano con l’intelligenza artificiale.

Ogni progresso tecnologico che tocca direttamente la fibra di qualsiasi settore produttivo non è mai esente da controversie, né da conseguenze, sia positive che negative.

Nel mio caso, creo immagini attraverso la fotografia, il design e il video da più di 30 anni, di cui 10 esclusivamente analogici. Quindi 20 anni come libero professionista e 16 con il mio studio di comunicazione audiovisiva. Tutto questo percorso e tutto ciò che ho imparato a fare lungo la strada non sarebbe stato possibile se avessi chiuso la mente all’irruzione del digitale e a tutti i progressi che ha portato con sé. Non si tratta di accogliere il progresso a braccia aperte e di offrirgli un assegno in bianco per tutto. Dubitare, mettere in discussione, essere critici… è fondamentale perché apre le porte alla ricerca personale e professionale e, nel caso dell’intelligenza artificiale, ci sono tanti motivi per temerla quanti per entrarci dentro ed esplorarne tutte le possibilità, non solo in termini di IA generativa, ma anche di tutta la gamma di strumenti che stanno emergendo e che stanno già riformulando drasticamente le tecniche di editing e post-produzione delle immagini digitali. Ad alcuni di questi strumenti, che non sono specificamente finalizzati alla creazione di lavori grafici attraverso l’IA, dedicheremo le righe successive di questo post. Perché non tutto ruota intorno a ChatGPT o Midjourney. L’IA, a livello tecnico, ci permetterà anche di semplificare i processi di editing e di migliorare notevolmente la qualità delle nostre immagini e delle loro finiture finali, sia per l’uso digitale che per la stampa, al punto che dibattiti che per anni hanno fatto parte delle vicissitudini del settore fotografico, come ad esempio di quale dimensione del sensore ho bisogno per ottenere immagini ad altissima risoluzione, saranno risolti qui per sempre.

Quindi andiamo…

Adobe Super Resolution

Lo sviluppatore per eccellenza del software di editing di immagini e video più diffuso sul mercato avrebbe fatto una pessima figura se non fosse salito sul carro dell’intelligenza artificiale con le proprie proposte e, va detto, non ha fatto affatto male.

All’inizio del 2021, Adobe ha sorpreso i suoi utenti con un aggiornamento di Adobe Camera Raw che ha introdotto un nuovo strumento chiamato Super Resolution. Questa funzione ha lasciato a bocca aperta molti utenti, me compreso, e ha rappresentato una pietra miliare nel dibattito in corso sulla risoluzione e sulle dimensioni del sensore quando si decide di acquistare una fotocamera. Improvvisamente, la risoluzione di un file RAW non era più legata esclusivamente all’acquisizione nella fotocamera, ma dipendeva dalla capacità del software di aumentare la risoluzione dell’immagine originale fino a quattro volte. Sebbene all’inizio ci fossero alcuni difetti che richiedevano una regolazione (nulla che non potesse essere risolto con altri strumenti di Camera Raw e Photoshop), col tempo questi aspetti sono migliorati notevolmente, mettendo in discussione la necessità di un fotogramma pieno di megapixel.

strumenti-di-intelligenza-artificiale-per-fotografi-5-arcadina

File RAW aperto in Adobe Camera Raw.

Super Resolution si basa su un’intelligenza artificiale chiamata Enhance Details, sviluppata solo un paio di anni prima di essere incorporata in Adobe Camera Raw. Questa intelligenza artificiale è stata addestrata su milioni di immagini per comprendere gli schemi di interpolazione e correggere algoritmicamente i principali errori di pixelatura e bande di colore durante l’interpolazione di un’immagine. In altre parole, riempie le informazioni mancanti nell’immagine originale con dati “inventati”, ottenendo così un file con molte più informazioni di quello ottenuto dalla fotocamera. L’interpolazione non è una novità per chi lavora in digitale con le immagini, ma i risultati, soprattutto quando la differenza tra la dimensione del file originale e quella del file risultante era notevole, lasciavano spesso a desiderare, nonostante la post-produzione. Improvvisamente è arrivata un’intelligenza artificiale a risolvere una delle principali sfide per fotografi e creativi digitali, e lo ha fatto in modo automatizzato e veloce. Man mano che questa IA continua ad allenarsi, i risultati si avvicinano sempre di più alla perfezione di un’immagine originale catturata con un sensore ad altissima risoluzione.

Se state pensando di acquistare la fotocamera con il sensore più potente sul mercato per tappezzare la vostra casa di foto in formato cartellone, vi consiglio di controllare il vostro flusso di lavoro, perché questo è solo l’inizio…

Per attivare la Super risoluzione una volta aperto il file RAW in Adobe Camera Raw, è sufficiente fare clic sull’immagine con il tasto destro del mouse e aprire il menu delle opzioni. Quindi, selezionare l’opzione Migliora e nella casella successiva attivare il campo Super risoluzione e infine fare clic sul pulsante Migliora.

strumenti-di-intelligenza-artificiale-per-fotografi-6-arcadina

strumenti-di-intelligenza-artificiale-per-fotografi-7-arcadina

Questo genererà un file DNG che, a seconda della potenza del nostro computer, richiederà più o meno tempo. Una volta generato, possiamo selezionare il file con cui lavorare facendo clic sulle miniature dell’immagine che appaiono in fondo alla schermata principale di Adobe Camera Raw: la prima è l’originale e la seconda è quella migliorata.

Per darvi un’idea di cosa si ottiene con Super Resolution, il file RAW originale che potete vedere nelle schermate corrisponde a una fotografia scattata con la mia Nikon D750 Full Frame, con un sensore da 24,2 MP e una dimensione di output di 4016×6016 mm a 300 dpi. Dopo l’elaborazione con Super Resolution, il file DNG risultante equivale a un file da 96,6 MP con dimensioni di uscita di 8032×12032 mm a 300 dpi. Questo processo può essere eseguito prima o dopo aver regolato il resto dei parametri di Adobe Camera Raw, poiché l’uso di Super Resolution non modifica le impostazioni esistenti al momento della sua esecuzione.

strumenti-di-intelligenza-artificiale-per-fotografi-8-arcadina

Quindi, se state pensando di acquistare la fotocamera con il sensore più potente sul mercato per tappezzare la vostra casa di foto in formato cartellone, vi consiglio di controllare il vostro flusso di lavoro, perché questo è solo l’inizio…

Riempimento generativo, sempre di Adobe

E ora, se non conoscete questo strumento che è stato testato per alcuni mesi in una sorta di versione beta di Photoshop inclusa in Adobe Creative Cloud e che, dalla fine dello scorso anno, è stato incluso nelle ultime versioni di Adobe Photoshop, la vostra testa esploderà. Si tratta dello strumento Riempimento generativo che può essere utilizzato in due varianti: Riempimento generativo e Ingrandimento generativo.

Supponiamo quindi di avere un’immagine fotografica in formato verticale e di doverne ricavare un’altra in formato orizzontale. Finora l’unica cosa che potevamo fare era applicare il formato ritagliando solo il contenuto dell’immagine originale, a meno che non fossimo dotati di ritoccatori digitali in grado di riempire perfettamente il contenuto delle aree vuote risultanti dall’ingrandimento del fotogramma senza ritaglio.

strumenti-di-intelligenza-artificiale-per-fotografi-9-arcadina

Bene, allora. Ora, una volta aperta l’immagine verticale in Photoshop, inizieremo a utilizzare l’Ingrandimento generativo, per il quale attiveremo lo strumento Ritaglio nella barra degli strumenti. Dopo averlo attivato, vedremo le sue opzioni nella barra superiore della finestra principale e, aprendo il campo Riempimento, troveremo la funzione Ingrandimento generativo, che è quella che dobbiamo selezionare.

A questo punto, si imposterà anche il rapporto per il nuovo formato di ritaglio, ad esempio 3:2 (orizzontale) e poi si applicherà l’ingrandimento che si vuole ottenere sull’immagine e si premerà invio.

È qui che inizia la magia. Sullo schermo apparirà una piccola finestra con una domanda apparentemente semplice: cosa volete generare?

strumenti-di-intelligenza-artificiale-per-fotografi-10-arcadina

Strumento di ingrandimento generativo attivo.

L’intelligenza artificiale di Generative Fill analizzerà l’immagine originale in pochi secondi e “inventerà” il contenuto rimanente con una coerenza tale che gli occhi di più di una persona usciranno dalle orbite.

È in questo campo che dobbiamo inserire il prompt, cioè le istruzioni che dobbiamo dare all’IA per generare nuovi contenuti e riempire così le aree vuote della nuova cornice. Il fatto è che lo strumento è talmente ‘intelligente’ che possiamo fare a meno di inserire qualsiasi istruzione, per cui il testo Opzionale appare accanto alla domanda e basta premere il pulsante Genera. L’IA Generative Fill analizzerà l’immagine originale in pochi secondi e “inventerà” il contenuto rimanente con una coerenza tale da far uscire gli occhi dalle orbite a più di una persona. A me è successo la prima volta, ho dovuto raccoglierli da sopra la tastiera e rimetterli nelle loro orbite.

strumenti-di-intelligenza-artificiale-per-fotografi-11-arcadina

Risultato dell’applicazione dello strumento di ingrandimento generativo sull’immagine verticale originale. 

Ma attenzione, non si ferma qui. Poiché l’intelligenza artificiale è più forte di un otto, non solo genererà un singolo contenuto, ma suggerirà almeno 3 proposte, che vi mostrerà in un’altra finestra, sotto forma di miniature su cui potrete cliccare per vedere ogni variante nell’immagine principale. E se nessuna delle proposte vi convince, dalla stessa finestra potrete generare nuove varianti all’infinito e oltre. A ogni clic, l’IA genererà altre 3 proposte, per cui rischiate di entrare in un loop e il giorno dopo vi ritroverete pietrificati davanti al computer con l’indice come se steste inviando un telegramma alla vecchia maniera.

E non dimenticate che avete la possibilità di indicare attraverso un prompt, in modo più specifico, cosa volete che generi, quindi, se l’automazione completa non vi convince, potete sempre provare a inserire istruzioni più precise, che vi raccomando di essere il più specifiche possibile (non si tratta di Midjourney o ChatGPT) e, naturalmente, in inglese, quindi se il vostro livello non è molto fluente, non preoccupatevi, perché alla fine di questo articolo vi dirò alcune piccole cose che potete fare per risolvere questo problema…E anche con l’IA, naturalmente, perché è di questo che si tratta.

strumenti-di-intelligenza-artificiale-per-fotografi-12-arcadina

Ma il Riempimento generativo permette anche di ingrandire immagini con contenuti inesistenti e persino di introdurre nuovi elementi come oggetti, cambi di guardaroba e persino di rimuovere elementi fastidiosi come il dito che si è bloccato davanti alla fotocamera durante lo scatto di una foto. E per questo abbiamo la possibilità di lavorare l’immagine con il metodo Generative Fill.

In questo caso possiamo ottenere risultati simili a quelli dell’Ingrandimento generativo, se ciò che vogliamo è ingrandire il contenuto dell’immagine originale, quindi possiamo ricominciare con lo strumento Ritaglia ma, in questo caso, nel campo Riempimento selezioneremo semplicemente l’opzione Sfondo (predefinita) in modo che, quando si ingrandisce il formato secondo la proporzione scelta (proviamo di nuovo con 3:2), ciò che si otterrà sono aree vuote intorno all’originale con solo il colore uniforme che avete selezionato come colore di sfondo.

Per utilizzare il Riempimento generativo, attivare lo strumento di selezione e selezionare le parti vuote del nuovo fotogramma, includendo sempre una piccola parte del contenuto originale in modo che l’IA possa avere un punto di partenza da cui generare il nuovo contenuto. In questo caso possiamo selezionare tutte le parti in un’unica selezione o lavorare ogni area con selezioni indipendenti e, quindi, ottenere diverse generazioni di contenuti nella stessa immagine.

Con la selezione attiva, facciamo clic su di essa con il pulsante destro del mouse e, nel menu a discesa, vedremo le tre opzioni che ci interessano: Riempimento consapevole, Riempimento generativo e Cancella e riempi selezione.

strumenti-di-intelligenza-artificiale-per-fotografi-13-arcadina

Nel caso del Riempimento generativo, i passi da seguire sono esattamente gli stessi del Miglioramento generativo, quindi, anche in questo caso, si partirà dalla finestrella con la domanda “Cosa si vuole generare?

Con l’opzione Rimuovi e riempi il processo è completamente automatico, senza la possibilità di inserire alcuna richiesta e, in base ai miei test, è quasi preferibile utilizzare questa opzione per ottenere un riempimento da un contenuto originale uniforme, come ad esempio l’ingrandimento dello sfondo neutro di un ritratto in studio.

Infine, possiamo optare per Content-Aware Fill, che attiverà una sorta di strumento pennello con il quale possiamo ottenere campioni intorno all’immagine originale affinché l’IA generi contenuti basati su di essi all’interno dell’area di selezione.

strumenti-di-intelligenza-artificiale-per-fotografi-14-arcadina

Risultato dell’applicazione dello strumento Riempimento generativo sull’immagine verticale originale.

Ma senza dubbio una delle utilità più interessanti di Generative Fill è, come ho già detto, la possibilità di creare o eliminare contenuti all’interno dell’immagine originale stessa, per la quale dobbiamo lavorare attraverso la finestra di prompt e inserire le istruzioni (in inglese) di ciò che vogliamo che l’intelligenza artificiale faccia. Quindi, a titolo dimostrativo, il modo migliore per vedere le possibilità è attraverso il confronto, e le tre prove che vedete qui sotto servono da esempio, in cui abbiamo lavorato selezionando solo l’area dell’immagine originale in cui vogliamo intervenire. Nel primo abbiamo chiesto all’IA di rimuovere alcune lettere su un capo d’abbigliamento, nel secondo di rimuovere un cactus e riempire l’area con il contenuto dello sfondo e, nel terzo, di aggiungere né più né meno che un paio di occhiali da sole sull’immagine di una modella.

strumenti-di-intelligenza-artificiale-per-fotografi-15-arcadina

strumenti-di-intelligenza-artificiale-per-fotografi-16-arcadina

strumenti-di-intelligenza-artificiale-per-fotografi-17-arcadina

Ma senza dubbio una delle utilità più interessanti di Generative Fill è, come ho già detto, la possibilità di creare o eliminare contenuti all’interno dell’immagine originale stessa, per la quale dobbiamo lavorare attraverso la finestra di prompt e inserire le istruzioni (in inglese) di ciò che vogliamo che l’intelligenza artificiale faccia. Quindi, a titolo dimostrativo, il modo migliore per vedere le possibilità è attraverso il confronto, e le tre prove che vedete qui sotto servono da esempio, in cui abbiamo lavorato selezionando solo l’area dell’immagine originale in cui vogliamo intervenire. Nel primo abbiamo chiesto all’IA di rimuovere alcune lettere su un capo d’abbigliamento, nel secondo di rimuovere un cactus e riempire l’area con il contenuto dello sfondo e, nel terzo, di aggiungere né più né meno che un paio di occhiali da sole sull’immagine di una modella.

strumenti-di-intelligenza-artificiale-per-fotografi-18-arcadina

Interfaccia di Topaz Sharpen AI.

Lavorare con il software Topaz Labs è relativamente semplice. Si tratta di capire il funzionamento di alcuni parametri che ci permetteranno di operare manualmente o di lasciare che l’IA agisca in modalità automatica in base alle opzioni di ogni applicazione.

Attualmente esiste una versione di Topaz Labs che integra il funzionamento delle tre applicazioni che vedremo di seguito, anche se in modo più semplificato. Si tratta di Topaz Photo AI. Ma credo che il modo migliore per capire come funziona questa AI sia quello di vederla su ogni tipo di applicazione separatamente e poi, ognuno potrà decidere se è interessato a un’opzione o a un’altra perché, in fin dei conti, i concetti su cui si basano sono gli stessi, sia nelle singole versioni che nella versione integrata.

Topaz Sharpen AI

Nel caso di Topaz Sharpen AI, sono disponibili 4 modelli principali di elaborazione delle immagini. Il modello Standard, che applica un’elaborazione generale all’immagine, Motion Blur, con il quale possiamo lavorare sulle immagini affette da motion blur, Out of Focus per le immagini che sono direttamente fuori fuoco e Too Soft per quelle che, senza avere una sfocatura molto pronunciata, sono affette da una certa mancanza di nitidezza. Tutti questi modelli dispongono di altre 3 opzioni, Normale, Molto rumoroso e Molto sfocato, con le quali è possibile regolare con precisione l’elaborazione a seconda che il problema della mancanza di nitidezza derivi da un eccesso di rumore nell’immagine o se questa sia direttamente sfocata. Ma soprattutto, se non siamo sicuri di quale sia l’opzione migliore per risolvere il problema di nitidezza di ogni immagine, possiamo automatizzare il processo e lasciare che l’IA faccia un’analisi preliminare e scelga il modello di elaborazione ideale per ogni immagine. Per fare ciò, è necessario attivare l’opzione automatica (indicata dall’icona di un fulmine) nel selettore del menu Modello di nitidezza. Inoltre, abbiamo anche la possibilità di operare con ogni modello di elaborazione, automaticamente o in modalità manuale, regolando la messa a fuoco dell’immagine (Rimuovi sfocatura) e il rumore (Sopprimi rumore) da soli o lasciando che l’IA lo faccia automaticamente.

strumenti-di-intelligenza-artificiale-per-fotografi-19-arcadina

Un altro aspetto molto interessante di Topaz Sharpen AI è la funzione di elaborazione in modalità maschera, che può essere molto utile nelle fotografie in cui si desidera correggere aspetti come la profondità di campo o guadagnare nitidezza in aree specifiche dell’immagine. Con l’opzione Seleziona attivata, possiamo scegliere vari tipi di maschere automatiche o espanderle o ridurle (Raffina) usando uno strumento pennello (Brush) che ha anche i suoi parametri di configurazione e salvataggio.

strumenti-di-intelligenza-artificiale-per-fotografi-20-arcadina

Se lo strumento Adobe Super Resolution non vi basta, tutti i programmi Topaz Labs sono predisposti per lavorare direttamente su un file RAW, in modo che possiate farvi un’idea della risoluzione e della qualità visiva che potete ottenere, combinando diversi strumenti, nel processo di sviluppo digitale prima dell’editing o della postproduzione dell’immagine.

E per poter vedere tutti questi effetti con totale chiarezza prima di applicare ogni elaborazione, l’interfaccia di Topaz Sharpen AI ci permette di visualizzarli in diverse modalità e con uno zoom fino al 400%, combinando l’immagine originale con l’anteprima dell’elaborazione in finestre divise o scorrevoli o visualizzando più modelli contemporaneamente in modo da poter confrontare diversi risultati sulla stessa immagine. Sia Topaz Sharpen AI che Topaz Noise AI, di cui parleremo in seguito, possono essere integrati come plugin di Photoshop, il che ci permette di operare su qualsiasi file aperto nel programma di Adobe e, inoltre, se non vi basta lo strumento Adobe Super Resolution, tutti i programmi Topaz Labs sono predisposti per lavorare direttamente su un file RAW, in modo da poter avere un’idea della risoluzione e della qualità visiva che si può ottenere, combinando diversi strumenti, nel processo di sviluppo digitale prima dell’editing o della postproduzione dell’immagine.

 

Topaz Noise AI

L’interfaccia di Topaz Noise AI è quasi identica a quella di Topaz Sharpen AI ma, in questo caso, come suggerisce il nome, il programma è mirato a risolvere i problemi di rumore digitale o “grana”, un altro dei grattacapi che molti fotografi hanno incontrato, soprattutto quando si lavora ad alte sensibilità in condizioni di scarsa illuminazione, con quelle fastidiose combinazioni di luci nitide e ombre rumorose.

Anche in questo caso abbiamo le stesse finestre di anteprima e confronto tra originali e immagini elaborate disponibili in Topaz Sharpen AI e, in questo caso, cinque modelli per elaborare la nostra immagine: Standard, che riduce in modo completo il rumore preservando i dettagli; Clear, che funziona molto bene sulle superfici lisce come la pelle; Low Light, per le immagini scattate in situazioni di scarsa illuminazione; Severe Noise, per condizioni di rumore eccessivo e, infine, la modalità RAW, pronta a lavorare meglio da file RAW grezzi.

strumenti-di-intelligenza-artificiale-per-fotografi-21-arcadina

Interfaccia Topaz Noise AI.

Ogni modello ha i propri strumenti per regolare manualmente l’elaborazione di Rimuovi rumore e Migliora nitidezza.

Ovviamente, sia nella scelta del modello di elaborazione che meglio si adatta all’immagine originale, sia nell’utilizzo degli strumenti di ciascun modello, l’IA può lavorare anche in modo automatizzato, analizzando le condizioni di ciascuna immagine e scegliendo il modello più adatto, nonché l’impostazione ideale per ciascun tipo di elaborazione.

E se questo non bastasse, Topaz Noise AI permette di effettuare una regolazione finale (Post Processing) dopo l’elaborazione AI, con la quale possiamo ottenere un po’ più di definizione o risolvere problemi di artefatti cromatici.

Topaz Gigapixel AI

E ora passiamo a uno strumento che, nel mio caso, è diventato essenziale, soprattutto per le immagini create dall’IA generativa, come Midjourney che, al giorno d’oggi, ci permette di ottenerle solo a bassa risoluzione, come 1024×1024 pixel in formato 1:1, che è quello che uso più spesso.

Topaz Gigapixel AI ci permette di scalare qualsiasi file di immagine alle dimensioni di output che desideriamo, indipendentemente dalla sua compressione e risoluzione, ottenendo una spettacolare qualità dei dettagli che supererebbe perfettamente il controllo di qualità di un file destinato alla stampa di grande formato. Attenzione però, perché l’AI non fa miracoli e il risultato finale dipende da altri fattori, non solo dalle dimensioni dell’originale.

Vi fornisco il mio sistema di lavoro come esempio.

Come ho già detto, quando genero immagini con Midjourney in formato quadrato, queste non superano i 1024 px per lato e, quindi, se da quella dimensione voglio ottenere, ad esempio, un file di stampa 50×50 cm (5906 px a 300 dpi), si tratta di una differenza notevole tra l’originale e la dimensione dell’immagine a cui voglio lavorare per ottenere una buona qualità visiva con tutti i dettagli e la nitidezza.

Quindi, prima di modificare qualsiasi file a bassa risoluzione in Photoshop, lo faccio passare attraverso Topaz Gigapixel AI e lo ridimensiono alle dimensioni di output che desidero per ogni immagine, lasciando che l’AI applichi quella che potremmo definire un’interpolazione bestiale.

strumenti-di-intelligenza-artificiale-per-fotografi-22-arcadina

Interfaccia di Topaz Gigapixel AI. A sinistra, l’immagine originale a 1024 px. A destra, l’immagine elaborata a 5906 px.

Topaz Gigapixel AI ci permette di scalare qualsiasi file di immagine alle dimensioni di output desiderate, indipendentemente dalla compressione e dalla risoluzione, ottenendo una spettacolare qualità dei dettagli che supererebbe perfettamente il controllo di qualità di un file destinato alla stampa di grande formato.

Anche in questo caso ritroviamo lo stesso tipo di interfaccia di Topaz Sharpen AI e Topaz Noise AI, con le loro caratteristiche finestre di anteprima e modelli di elaborazione. Ma prima, nel campo Modalità di ridimensionamento, dobbiamo indicare la scala o la dimensione di uscita, dando priorità alla larghezza (Width) o all’altezza (Height) dell’immagine e indicandone il valore nel campo Output… in pixel, pollici o centimetri.

Con queste informazioni già inserite, si può scegliere e regolare uno dei 5 modelli di elaborazione offerti dal programma, oppure lasciare che l’IA lo faccia automaticamente in base alla propria analisi dell’immagine originale.

Anche in questo caso abbiamo un modello Standard che funziona in modo generale con tutti i tipi di immagini. La modalità Linee applica una migliore precisione alle fotografie architettoniche o di paesaggi urbani in cui ci interessa evidenziare la definizione di linee, linee di fuga, ecc. Art & CG è l’opzione ideale per immagini grafiche, disegni o scansioni. Con HQ possiamo migliorare immagini già ottenute in origine ad alta risoluzione o lavorare con quelle già elaborate in precedenza, ad esempio applicando filtri digitali, denoising, interpolazione, ecc. Con Low Res si possono scalare immagini prese dal web o screenshot, che di solito non superano i 72 px dpi. Infine, il modello Molto compresso è una buona opzione per le immagini con molti artefatti di compressione o per migliorare le scansioni da un supporto chimico come un negativo, una diapositiva o una stampa su carta fotografica.

Ogni modello ha le proprie impostazioni che, anche in questo caso, possono essere automatizzate o manuali. Con queste impostazioni è possibile ridurre il rumore dell’immagine e minimizzare la sfocatura dell’obiettivo e del movimento. Inoltre, i modelli Standard e HQ dispongono di un’impostazione aggiuntiva, Correggi compressione, con la quale è possibile migliorare l’immagine riducendo anche gli artefatti di compressione.

Topaz Video AI

Ho voluto inserire in questo articolo un programma di intelligenza artificiale dedicato al video, da un lato, perché so che molti fotografi lavorano anche in questa disciplina e, dall’altro, perché se con i programmi precedenti è apparso chiaro che l’AI sta portando un enorme cambiamento rispetto alle esigenze tecniche quando si tratta di acquistare una fotocamera, non avete idea di cosa stia arrivando ora nel campo del video, non avete idea di ciò che sta arrivando nel campo del video e, per ora, ci concentreremo solo sull’uso dell’IA come strumento tecnico di editing, perché se apriamo il melone di ciò che si sta già considerando in termini di IA generativa applicata al video, al cinema, eccetera, più di una persona salterà fuori dalla finestra a testa bassa.

L’ultimo gadget dei ragazzi di Topaz Labs è Topaz Video AI e, ancora una volta, ci troviamo di fronte a un software che ci farà ripensare, e molto, al momento di decidere quale apparecchiatura acquistare per registrare video perché, se nel caso dell’AI applicata alla fotografia, questioni come la potenza del sensore della fotocamera non sono più così determinanti per ottenere immagini ad altissima risoluzione, per quanto riguarda i video, d’ora in poi conterà poco la risoluzione di registrazione o il frame rate.

strumenti-di-intelligenza-artificiale-per-fotografi-23-arcadina

Interfaccia Topaz Video AI.

L’ultimo software di Topaz Labs è Topaz Video AI e, ancora una volta, è un software che vi farà ripensare a quale attrezzatura acquistare per la registrazione video.

Supponiamo, ad esempio, di registrare un file video, con una videocamera, una DSLR o uno smartphone, alla risoluzione Full HD (1920×1080 px) e a 30 fps. Ebbene, con Topaz Video AI potete scalare quel file video a una risoluzione fino a 8K con la stessa qualità che se lo aveste ottenuto originariamente con la fotocamera alla stessa risoluzione e, inoltre, (preparatevi a rifarvi gli occhi al volo) convertire la frequenza dei fotogrammi originale in una qualsiasi altra tra 24 e 120 fps, o cambiare il tipo di codifica (codec) nelle impostazioni di uscita del file finale, qualunque sia quella usata nella registrazione, con la qualità di un codec nativo.

Anche in questo caso mi rifaccio alla mia esperienza personale. Qualche anno fa ho acquistato una fotocamera, la Panasonic Lumix DMC FZ2000, un modello bridge che all’epoca aveva un certo impatto per la sua buona dotazione per la registrazione video, anche a livello semi-professionale. Poteva catturare fino a 4K a 30 fps su un sensore da 1 pollice e si distingueva per la connettività ad accessori essenziali come microfoni, display esterni e così via. Disponeva inoltre di un potente obiettivo Leica con zoom 24-480 mm e di una serie di altre caratteristiche tipiche di una fotocamera professionale senza essere un professionista. All’epoca fu uno dei migliori investimenti in attrezzature per il mio studio e ora, grazie alle opzioni AI, si è consolidata completamente nonostante il numero di fotocamere superiori, sotto tutti gli aspetti, che sono emerse da allora.

strumenti-di-intelligenza-artificiale-per-fotografi-24-arcadina

La mia attrezzatura video con la Panasonic Lumix DMC FZ2000.

La FZ2000 aveva i suoi ovvi limiti per una fotocamera che all’epoca aveva un prezzo di 1.300 euro. Da un lato, nonostante fosse in grado di registrare in 4K a 30 fps, è diventata rapidamente obsoleta con la comparsa di fotocamere in grado di registrare in UHD, con frame rate più elevati e senza applicare alcun fattore di crop sul sensore, come nel caso di questa fotocamera, o con la limitazione dei codec di registrazione e del bitrate che impedivano una maggiore qualità dell’immagine. Anche se il video non è la disciplina in cui lavoro di più nel mio studio, ero tentato di vendere questa apparecchiatura e investire in una fotocamera superiore che mi permettesse di registrare in 4K con una frequenza di fotogrammi più elevata, essenziale per ottenere un effetto slow motion pulito e fluido e per poter sfruttare appieno un obiettivo grandangolare a quella risoluzione, aspetti che con la FZ2000 erano fattibili solo in registrazioni Full HD al massimo.

Ebbene, nel bel mezzo di questo dilemma, appare Topaz Video AI, proponendo una serie di soluzioni per il video impossibili da credere fino ad ora e dopo diverse prove di riconversione di alcuni miei progetti in video sono giunto alla conclusione di avere l’attrezzatura ideale per realizzare qualsiasi progetto video senza la necessità di cambiare telecamera in tempi lunghi e sopperendo ai suoi limiti grazie all’intelligenza artificiale, ottenendo video finali con una qualità vicina al broadcast.

Quando apriamo Topaz Video AI troviamo, ancora una volta, un’interfaccia semplice, marchio di fabbrica della casa, con una finestra principale in cui possiamo visualizzare il nostro video dopo averlo caricato dal computer e vedere l’anteprima della conversione applicata, confrontandola con l’originale in split screen. Abbiamo anche la possibilità di tagliare il video (Trim) o di modificare l’inquadratura finale a nostro piacimento (Crop).

Ma ciò che dobbiamo osservare prima di tutto è la colonna laterale e la quantità di opzioni che il programma ci offre, potendo optare per preset già pronti che possono essere ampliati con altri parametri, oppure comporre una batteria di opzioni a nostro piacimento in base al risultato che stiamo cercando con la conversione.

strumenti-di-intelligenza-artificiale-per-fotografi-25-arcadina

Nella sezione Video, vengono visualizzati la risoluzione e la frequenza dei fotogrammi del file originale e, da lì, nei menu a discesa del campo Out possiamo selezionare la risoluzione di uscita e la nuova frequenza dei fotogrammi che vogliamo applicare nella conversione, scalando l’immagine ai formati standard (SD, HD, FullHD, 4K, 8K…) o creando la nostra scalatura personalizzata.

Ma Topaz Video AI dispone anche di filtri per migliorare l’immagine con il proprio sistema di stabilizzazione tramite intelligenza artificiale (Stabilization) che include aspetti già noti a qualsiasi videografo come l’Auto-Crop e altre funzioni, o l’interessantissimo Motion Deblur che riduce l’effetto sfocatura nelle riprese in movimento, aumentando la nitidezza e i dettagli senza quel fastidioso contrasto ai bordi tipico di un’interpolazione fatta in modo rudimentale. E se vogliamo ottenere un buon effetto slow motion, con la funzione Interpolazione fotogrammi e le sue diverse opzioni, l’AI farà il suo dovere con risultati spettacolari. Infine, nella sezione filtri, abbiamo la funzione Enhancement con le rispettive opzioni di ingresso per i file video originariamente creati in modalità progressiva (p) o interlacciata (i) e che, nel mio caso, è stata fondamentale per migliorare la qualità dei video digitalizzati da formati video analogici come il VHS ed eliminare le fastidiose linee di scansione caratteristiche di questo tipo di processo di conversione analogico-digitale.

E non dimentichiamo un altro strumento fondamentale di Topaz Video AI: le Impostazioni di output, che includono diversi codec standard come H264 o H265, ma anche alcuni ad alte prestazioni come ProRes di Apple, con i quali è possibile ottenere una qualità video e un bit rate migliori rispetto all’originale.

Tuttavia, a differenza dei programmi Topaz Labs per le immagini fisse, che di solito funzionano abbastanza velocemente anche se non si dispone di un computer molto potente, nel caso di Topaz Video AI, e come è logico per qualsiasi programma di editing video digitale, è consigliabile prestare molta attenzione ai requisiti tecnici del programma perché vi assicuro che alcuni dei processi, soprattutto quando si lavora con video relativamente lunghi, richiederanno una buona macchina, sia in termini di processore, che di RAM, che di grafica, è consigliabile prestare molta attenzione ai requisiti tecnici del programma perché vi assicuro che alcuni processi, soprattutto quando si lavora con video relativamente lunghi, richiedono una buona macchina, sia in termini di processore, che di RAM e grafica, per poter eseguire l’anteprima senza problemi e poi elaborare il file finale.

E infine, La fine

E così arriviamo alla fine di un articolo così lungo, e ho lasciato indietro molte opzioni che vedremo nei prossimi post dedicati all’intelligenza artificiale. Infatti, prima o poi dovremo parlare di Adobe Firefly, l’incursione di Adobe nell’IA generativa sullo stile di Midjourney o Dall-E, ma con un’interfaccia propria, che sto ancora approfondendo, e dovremo anche dedicare del tempo ad analizzare il funzionamento di strumenti interessanti come Evoto (tra gli altri) con i quali si possono ottenere risultati spettacolari nel trattamento delle pelli dei ritratti fotografici, sostituendo con l’IA processi di editing laboriosi come il ritocco per separazione di frequenze o il Dodge and Burn, con risultati identici.

strumenti-di-intelligenza-artificiale-per-fotografi-26-arcadina

Adobe Firefly, “Midjourney” di Adobe con alcune altre cose.

L’intelligenza artificiale è inevitabile, come lo sono stati molti altri sviluppi nel corso della storia. Il modo migliore per adattarsi al cambiamento è la ricerca personale e, come minimo, la conoscenza, anche di ciò che ci contraddice.

Sono consapevole che l’irruzione dell’intelligenza artificiale porta con sé un dibattito interno e, come ho detto all’inizio di questo articolo, non si tratta di accettare tutto ciò che ci viene proposto o di lasciare da parte altre metodologie che ci fanno godere dei processi indipendentemente dal risultato finale. Ogni professionista, creativo o artista ha l’ultima parola quando si tratta di integrare o meno l’IA nei propri processi produttivi e nel proprio modo di intendere ciò che fa. Per questo motivo, in questo articolo ho voluto concentrarmi sugli strumenti pratici e non tanto sull’IA generativa che simula immagini come se fossero fotografie, illustrazioni e opere grafiche di ogni tipo e, come faccio sempre quando Arcadina mi invita a scrivere un articolo sul suo blog, affronto sempre le cose a partire dalla mia esperienza personale perché, per me, l’unico modo per giungere a delle conclusioni ogni volta che un progresso tecnologico scuote le fondamenta dei settori in cui lavoro, è basato sul metodo “test e risultato”.

Il futuro è inevitabile, per quanto possiamo essere riluttanti. L’intelligenza artificiale è inevitabile, così come lo sono stati molti altri progressi nel corso della storia. Il modo migliore per adattarsi al cambiamento è la ricerca personale e, come minimo, la conoscenza, anche di ciò che ci contraddice. Poi, ognuno troverà il modo di inserire questi progressi nel proprio sistema di lavoro, portandoli nel proprio territorio, perché l’IA aprirà ferite su molti fronti, ma ne curerà anche molte altre e, anche se ha già la capacità di imparare da sola, l’uso che ne faremo dipende ancora da noi stessi.

Traccia bonus

E poiché una promessa è una promessa, ecco un suggerimento per coloro che non hanno abbastanza conoscenze per creare prompt in inglese in modo fluente. Vi consiglio di provare a scrivere i vostri testi e poi usare ChatGPT per tradurli. Inoltre, ChatGPT è in grado di sviluppare messaggi specifici e molto ben dettagliati a partire da un briefing di ciò che si vuole ottenere e la sua capacità di traduzione linguistica supera già quella di qualsiasi traduttore online come Deepl o Google Translator, soprattutto se si utilizza ChatGPT 4.0, la versione più avanzata, anche se va detto che questa è già a pagamento.

E, come ho detto, l’unico modo per imparare a controllare l’IA è “tentativi ed errori” e così via fino a quando non si ottiene ciò che si sente chiaramente proprio….

Continuerà…?

Nat Gutiérrez | @natestudi

¡Comparte!
Subscribe
Notificami
guest

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

0 Comments
Newest
Oldest Most Voted
Inline Feedbacks
View all comments