Sistemi di intelligenza artificiale e algoritmi di machine learning sono sostanzialmente strumenti neutri, che assumono una valenza positiva o meno a seconda dell’utilizzo che si decide di farne. Ciò vale in pressoché qualsiasi ambito, compreso quello della fotografia. Su queste pagine abbiamo già parlato di come la sempre più massiccia presenza dell’IA nel territorio imaging non debba essere interpretata solo come un modo per semplificare il processo di acquisizione delle immagini, ma anche come una minaccia alla libertà d’azione: è essenziale avere consapevolezza di ciò che differenzia una bella foto da una buona foto.
Per dirla con altre parole, si dev’essere liberi di sbagliare, poiché una standardizzazione del risultato finale non potrà che portare a ottenere un’uniformità (leggasi anche “piattezza”) delle immagini. Vanno quindi guardati con un certo sospetto tutti quegli automatismi che sollevano l’utente dall’obbligo di agire manualmente sui parametri di scatto. Laddove l’intelligenza artificiale può invece offrire il proprio contributo senza sottrarre libertà al fotografo è nella fase di editing, suggerendo a quali immagini prestare maggiore attenzione: è quanto fa la tecnologia NIMA (Neural Image Assessment) sviluppata dai ricercatori di Google.
Senza addentrarsi in maniera approfondita nel comportamento degli algoritmi (tutti i dettagli tecnici sono contenuti in un white paper), si occupa di analizzare un set di immagini stabilendo quali potrebbero risultare “più piacevoli alla visione” di un essere umano. Non lo fa limitandosi a valutare l’applicazione della regola dei terzi oppure la disposizione degli elementi raffigurati secondo l’andamento della sezione aurea: attraverso l’impiego del deep learning viene istruita una rete neurale convoluzionale (CNN) affinché questa possa esprimere una valutazione per i singoli scatti. La valutazione prende in esame sia i singoli pixel sia l’aspetto generale. Di seguito un esempio, con la stessa immagine appositamente modificata per testare l’efficacia degli algoritmi. Sotto ogni versione il rating assegnato da NIMA, da 0 a 10.
Un approccio di questo tipo è applicabile a qualsiasi set di foto.
Come detto in apertura, il sistema può tornare utile per suggerire quali interventi attuare in fase di post-produzione, ad esempio migliorando il rapporto tra luci e ombre, ottimizzando il contrasto o la nitidezza delle immagini, lasciando però sempre all’utente-fotografo la decisione finale.
Una tecnologia di questo tipo ha inoltre potenzialità che vanno ben oltre l’ambito della fotografia: si pensi ad esempio a tutti i sistemi che si basano sui principi di machine vision, inclusi quelli che gestiscono i veicoli a guida autonoma, chiamati a elaborare le immagini acquisite per interpretarne il contenuto in modo del tutto simile a quanto farebbe un essere umano.