The next big thing: l’AI tra creatività e arte

Le implementazioni tecnologiche scaturiscono nella percezione comune sia curiosità che preoccupazione; di solito maggiore è la promessa della loro efficienza più forte risulta la polarità delle riflessioni in merito. È un aspetto insito della tecnica, particolarmente di quei processi che, anche solo in modo condizionale, potrebbero sfuggire al controllo dei loro agenti – che siamo noi, la specie umana – e proseguire il proprio corso in virtù di una potenza e di un’automazione inarrestabili. La filosofia si è occupata e si occupa assai della questione, la storia contemporanea ha purtroppo documentato episodi ricorrenti: abbiamo già trascorso fasi atroci, dall’organizzazione alienante del lavoro al servizio della catena di montaggio ai deliri eugenetici, sino allo sgancio nucleare che ha reso manifesto l’annichilimento istantaneo, su scala globale, della vita. Ciò per dire che il rapporto con la tecnologia, in ogni sua forma, è sempre complesso e dunque va condotto tramite una conoscenza estensiva dei fenomeni, della loro genesi, dei benefici, dei rischi possibili o effettivi. Se percepiamo un fatto come improvviso e dirompente abbiamo minori possibilità di comprenderlo, e un convincimento quasi nullo di poterlo gestire – sebbene queste eventualità siano paradossali, dato che ogni prodotto tecnico deriva da cause e volontà umane. Perciò, venendo all’intelligenza artificiale e alla sua “crescita” esponenziale, e volendo tracciare un principio di riflessione sul rapporto tra essa e la creatività, non possiamo prescindere dal chiederci, innanzitutto, che cosa in effetti l’AI sia, almeno ad oggi.

 


A. Michael Noll, Pattern One, 1962; courtesy dell’artista.

Se consideriamo ENIAC, sviluppato nel 1946 nei laboratori dell’Università della Pennsylvania, come primo esempio di computer general-purpose, cioè dotato di una certa versatilità di scopi, credo che risulterà piuttosto sorprendente constatare che già all’esordio degli anni Sessanta l’ingegnere americano Michael Noll aveva avuto l’idea di una relazione tra i calcolatori digitali e l’arte, riuscendo a generare una serie di disegni, randomici, tramite degli algoritmi. Gli esiti, esteticamente non esaltanti ma di rilievo storico, vennero esibiti nel 1965 alla Howard Wise Gallery di New York, insieme ad altri disegni creati in modo simile dal neuroscienziato ungherese Béla Julesz. Un altro evento rilevante fu Cybernetic Serendipity all’ICA di Londra nel 1968,  mostra curata da Jasia Reichardt e strutturata in varie sezioni, con opere eterogenee quali il Magnet TV di Nam June Paik, il robot capace di recitare Rosa Bosom, costruito da Bruce Lacey, una serie di composizioni musicali prodotte da un computer, la cui registrazione venne distribuita come LP insieme al catalogo dell’esposizione. Indicativo che il titolo dell’evento rimandasse alla cibernetica, secondo degli intenti esplicitati nella press release: «Il termine cibernetica fu usato per la prima volta da Norbert Wiener intorno al 1948.[…] Si riferisce ai sistemi di comunicazione e controllo di dispositivi elettronici complessi come i computer, che presentano analogie molto evidenti con i processi di comunicazione e controllo del sistema nervoso umano.» Inoltre, sin dal 1971 l’artista britannico Harold Cohen lavorò ad AARON presso l’Artificial Intelligence Laboratory di Stanford (si noti, fondato nel 1963), un software in grado di codificare l’atto pittorico e di comandare, per l’esecuzione, una sorta di mano meccanica. Se dapprima i risultati furono solo delle linee monocromatiche, tra gli anni Ottanta e Novanta AARON riuscì a elaborare forme complesse, tra cui dei corpi umani, e a colorarli, ottenendo delle figurazioni apprezzabili.

Harold Cohen con un’installazione di AARON presso il San Diego Museum; courtesy Harold Cohen Estate.

In ognuno di questi casi ricorreva il rapporto tra l’essere umano e la macchina. La relazione tra i due termini è stata prospettata molto presto, in riferimento sia ai movimenti del corpo che alle funzioni cerebrali. Soprattutto ad affascinare era ed è la possibilità estrema di un accostamento tra quanto caratterizza la nostra specie, e la distingue in modo sostanziale dalle altre – senza che ciò comunque significhi un’assoluta superiorità: la sofisticazione del pensiero astratto e dell’immaginazione. La performatività nell’elaborazione dei dati, intesa come calcolo, è un ambito in cui veniamo facilmente superati, invece vale il contrario per le inferenze logiche complesse, per la formazione di concetti, per la creatività. Viene da domandarsi come mai, data la strada intrapresa sin dagli anni Sessanta, non vi sia stato un progresso più intenso nell’uso dell’AI per generare delle opere d’arte. Ciò potrebbe essere rimandabile, in parte, ad alcuni limiti tecnici da superare, in parte, all’avvento del World Wide Web dal 1991. Il processo è abbastanza singolare, perché se il Web ha richiamato a sé ogni attenzione e ogni energia, in quanto strumento capace di trasformare la nostra società a più livelli, si è poi rivelato essenziale anche per le attuali evoluzioni dell’AI. Infatti senza di esso l’intelligenza artificiale sarebbe carente di materia prima. Non ci soffermeremo qui sulle modalità di interazione che sono sorte e si sono accentuate con il web – l’attitudine pro-am dei navigatori, che oltre a fruire producono i contenuti, o si appropriano di quelli esistenti per rielaborarli – ad ogni modo va rilevata una particolarità, ormai ovvia: che da allora è avvenuta un’ulteriore diffusione della fotografia, si tratti di immagini genuine, postprodotte, generate digitalmente.


Jon Rafman, Nine Eyes of Google Street View, 2008 – in corso; courtesy dell’artista.

Il web lo abbiamo dapprima conosciuto come combinazione di immagini fotografiche, testi e grafica, a cui poco dopo, con le implementazioni della banda internet, si è aggiunto il video. Smartphone, reflex, action cam, droni, satelliti, sistemi di sorveglianza, sono innumerevoli le fonti; ad esse da circa due anni si è aggiunta, in modo diffuso, la possibilità combinatoria del Text-to-Image tramite programmi quali Midjourney, DALL-E, Stable Diffusion. Conosciamo la procedura; il prompt è uno stimolo – nel caso specifico corrisponde a una proposizione – che permette di scaturire un output. Descrivo testualmente un’immagine e la ottengo. Avviene in modo simile con i modelli linguistici ampi, come ChatGPT, dove vale il sistema di domanda e risposta. Un singolo volto o un’immagine complessa, un racconto o un fumetto, in ogni caso non cambia il principio di funzionamento di tali sistemi, che operano su base statistica. Una quantità abnorme di dati visuali e testuali vengono combinati a partire dalle nostre richieste, per creare qualcosa che non c’era. Non è un aspetto secondario, la domanda fondamentale sta qui: le traiettorie probabilistiche possono essere intese in senso realmente creativo? Può riuscire la progressiva sofisticazione tecnica delle reti neurali profonde (Deep Neural Network, DNN), a ottenere risultati indistinguibili da quelli umani, in termini di originalità, innovazione, imprevedibilità? Gli sviluppi si susseguono con tempi sempre più ridotti; Sora, il modello Text-To-Video di OpenAI è ancora in fase di test, per migliorare le prestazioni e verificare le aree critiche, ma i pochi esempi di sequenze video pubblicate promettono un ulteriore avanzamento; alla metà di maggio 2024 è stato rilasciato GPT-4o, che è in grado di elaborare anche audio e immagini; siamo dunque sul punto di un cambiamento radicale? Avanzerò a questo riguardo due ipotesi. Prima però è necessaria una premessa.


Miniera di litio presso Silver Peak, Nevada; immagine Creative Commons.

Nella percezione comune la tecnologia viene recepita come immateriale, ovvero sostanziale nei suoi effetti ma fisicamente non collocata. Risulta più agevole pensare così, come accade guidando un’auto senza preoccuparsi del motore né dell’inquinamento. In realtà nessun prodotto tecnologico è inconsistente, maggiori sono la potenza e le prestazioni, più impattante, a vari livelli, è il suo funzionamento. A questo proposito è centrale la ricerca della studiosa Kate Crawford, che ha ben dimostrato quanto di concreto, e ingiusto, vi sia nell’AI: l’attività estrattiva del litio e delle terre rare in zone del mondo scarsamente o per nulla tutelate, il lavoro alienante e sottopagato dei clickworker, l’incremento del consumo di acqua ed elettricità, le emissioni di carbonio. Inoltre non è generalmente noto come vengano usati i data set, che sono il nutrimento degli algoritmi. Le verifiche dimostrano che i bias di genere, etnia, ecc., già operanti nella società, vengono inevitabilmente replicati dai modelli dell’intelligenza artificiale. Il rapporto tra noi e gli strumenti è indissolubile, se il sistema vede, vede solo tramite i nostri occhi. Dunque ogni esito dell’intelligenza artificiale generativa, anche in ambito creativo e artistico, non può esistere senza del materiale già prodotto, interpretato, giudicato. Fatto indicativo di una limitazione, sebbene in linea teorica a questo argomento si potrebbe opporre, con buone ragioni, che anche l’essere umano trae ispirazione da ciò che ha sperimentato nel passato, da modelli culturali e in genere da ciò che è già stato creato. Si potrebbe aggiungere che l’appropriazione di materiale altrui, da sottoporre a rielaborazione, è una prassi ben delineata nell’ambito dell’arte contemporanea. Comunque conta considerare che l’AI, come ogni altra tecnologia, non è astratta – l’astrazione è un atto del pensiero che può condurre a considerare qualsiasi cosa, sia essa un oggetto o un’idea, come un’entità superiore. Qui invece siamo in presenza di uno strumento radicato nella fisicità, nel lavoro, nei desideri, nelle opinioni, nelle scorie.

Trevor Paglen, Behold These Glorious Times!, 2017; courtesy dell’artista.

Avanziamo ora gli scenari. Nel primo, l’AI arriva a compiere totalmente ciò che ancora soltanto promette: la generazione di opere d’arte indistinguibili da quelle umane. Ovvero opere di alto valore formale e concettuale, in grado di aumentare le possibilità espressive a nostra disposizione, e di creare delle svolte. Immaginiamo le Demoiselles d’Avignon, revisione totale della bellezza, o Fountain, rivoluzione concettuale dell’arte – per citare due episodi fondanti della contemporaneità – ma in versione algoritmica. In caso di opere da creare materialmente sarebbero gli algoritmi a spiegare ad alcuni esecutori specializzati come procedere, come vale oggi per Jeff Koons o Maurizio Cattelan. In ogni caso la tecnologia sarà capace di valutare in autonomia ciò che è stato realizzato nel tempo e di decidere, in maniera imprevedibile, altre direzioni da intraprendere. A quel punto le parole “intelligenza” e “artificiale” avranno perso senso, e verrà meno il bisogno di distinguere l’identità creatrice. Finirà la prerogativa solo umana di fare arte, una tecnologia diventerà il nostro sostituto. In un’ipotesi meno estrema, gli esseri umani continuerebbero a creare, ma il tempo di ideazione e realizzazione, non comparabile tra la nostra specie e quella digitale, ci vedrebbe in continuo ritardo. Tale prospettiva ad ora risulta quasi inimmaginabile: letteratura, musica, film, danza, pittura, cinema e quant’altro, ne saremmo (quasi) solo fruitori, sebbene la nostra risposta come pubblico continuerebbe a stimolare gli sviluppi. In questo quadro avrebbe avuto pieno compimento il discorso che attualmente anima le Big Tech dell’AI, riferito a una performatività in costante miglioramento e  applicabile a ogni campo. Ma tale discorso è anche un possibile punto di debolezza. Un fatto è determinare la struttura delle proteine note alla scienza, fenomenale obiettivo raggiunto nel 2022 dal software AlphaFold, un fatto è creare un’opera d’arte: quella particolare ‘cosa’ che non ha corrispettivi e quasi niente a che vedere con la performatività intesa come efficienza. C’è una carenza culturale nella grande mente informatica degli sviluppatori dell’AI, per quanto riguarda la comprensione di tale differenza. Sanno nelle sedi di Open Ai, DeepMind, Google AI, che già da decenni la mimesi, il bello, la componente concettuale, l’autorialità, il valore economico, sono stati profondamente trasformati dalle pratiche artistiche, e che la corrispondenza con l’idea tradizionale di arte è quanto mai labile?

Hito Steyerl, This is the Future, 2019; courtesy dell’artista, Andrew Kreps Gallery, New York e Esther Schipper, Berlino.

Il secondo scenario è molto diverso. Al principio del 1839 Louis Daguerre presentò all’Accademia di Francia il risultato, perfettibile ma piuttosto stabile, di esperimenti che proseguivano da circa un ventennio: la fotografia. Cerchiamo di immaginare quale dovette essere l’effetto. Per millenni l’unico modo possibile di rappresentare visivamente la realtà era stato disegnarla, dipingerla, scolpirla, il che richiedeva apprendimento, perizia tecnica, elaborazione, tempo. Alla fine della prima rivoluzione industriale si scoprì che si poteva ottenere, grazie a una macchina, un esito molto più veloce e preciso – apparentemente senza dover fare nulla. C’era dell’altro, per la prima volta nella storia umana la realtà si mostrava tramite un suo doppio diretto, una copia sostanzialmente identica all’originale. Credo che ci siano diverse analogie tra quella fase storica e la nostra. Anche allora vi furono opposte reazioni – tra chi considerò la fotografia con sospetto, per varie ragioni, e chi ritenne che avrebbe modificato tutto. La prima generazione di artisti a confrontarsi appieno con il nuovo strumento fu quella degli Impressionisti. Alcuni di loro la rifiutarono, molti altri invece le usarono come ausilio, ammettendolo o meno; ad esempio Degas mai nascose di ricorrervi, e in effetti seppe farne un uso eccellente, definendo modi più disinvolti di inquadrare le scene in pittura. Di certo la fotografia ebbe un ruolo anche nelle sperimentazioni delle avanguardie storiche. Da allora che cosa è accaduto? Il medium è stato riconosciuto come forma d’arte, se usato in certo modo, e come strumento essenziale per varie professionalità. Potrebbe accadere, nel presente, qualcosa di simile. Del resto già le vicende della New Media Art e della Net Art sono un trascorso da considerare. L’AI sarà un tool particolarmente potente a cui gli artisti decideranno eventualmente di ricorrere. In alcun modo sarà un fine, ma un mezzo. E verrà impiegato criticamente: al modo in cui l’arte contemporanea ha stressato, dirottato, ri-significato tutto ciò che la tecnologia ha proposto nel tempo. Si tratterà anche di mostrare i limiti dello strumento, perché è spesso ciò che gli artisti trovano interessante – con buona pace della performatività di cui sopra. Ci sono già tanti esempi. Trevor Paglen, Refik Anadol, Hito Steyerl, per fare qualche nome. Vorrei concludere proprio con un’opera dell’ultima, dal titolo emblematico This is the Future. Un’installazione complessa, presentata alla Biennale di Venezia nel 2019. Alla base vi è la narrazione di una donna che ha scelto di proteggere un giardino collocandolo nel futuro. Ciò è reso possibile da una rete neurale in grado di generare nuove specie di piante in modo predittivo, a partire da migliaia di immagini botaniche. Le piante artificiali compaiono in modo incessante su dei monitor, ognuna ha un nome latino e delle particolari caratteristiche. Si tratta di una visione tendenzialmente ottimista, che sottolinea la possibilità generativa di ogni istante presente, grazie anche all’uso creativo e consapevole della tecnologia: «Teoricamente l’AI potrebbe essere impiegata in modo costruttivo, ne sono convinta. È un sistema davvero buono per creare pattern e analisi. Ma nelle condizioni attuali, che sono quelle del sistema capitalistico, è difficile ottenere degli effetti davvero positivi.»

Matteo Innocenti

Il testo qui riprodotto è stato pubblicato su MY/A, Rivista dell’Ordine degli Architetti di Prato, n.9, luglio 2024.

Immagine di copertina: Video generato con Sora, usando il prompt:”Video di festeggiamento del Capodanno lunare cinese, con il drago cinese, 2024; courtesy di Sora|Open AI

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *