Sunday, September 15, 2019
Home / Grafica 3D  / Nvidia GauGAN, quando l’intelligenza, diventa schiava dell’idiozia.

Nvidia GauGAN, quando l’intelligenza, diventa schiava dell’idiozia.

L'Nvidia sicuramente ha avuto negli ultimi anni un bilancio pieno e roseo per via delle vendite legate alle criptovalute. Ma come starà applicando i suoi fondi attuali? In una app che crea paesaggi

Sarò sincero, inizialmente scoprendo questa ennesima innovazione, mi sono trovato a sorridere ed a non prendere la cosa sul serio.
Chissà, visto il periodo, ho pensato, sarà stata una astutamente congeniata burla primaverile del primo aprile.
E invece no. E’ tutto vero. E più me ne rendevo conto, più mi sembrava incredibile… che tanta idiozia, si fosse manifestata nella applicazione dell’intelligenza artificiale!

Ma andiamo con calma.
Nvidia negli ultimi giorni di Marzo, ha rilasciato una dimostrazione video di un nuovissio software, ancora in via di sviluppo, denominato “GauGAN“.
In sostanza si tratta di un programma “IABased“, dove un sistema di intelligenza artificiale noto come “Generative adversarial network” (da qua l’acronimo GauGAN, che strizza l’occhio all’impressionismo francese), è capace di generare, da zero, composizioni paesaggistiche complete.

Il sistema si basa su un sistema di machine learning, condensato in un “pennello intelligente“, con cui potrete selezionare non più un colore (che cosa antiquata), ma bensì un elemento paesaggistico: montagne, laghi, alberi, cielo, nuvole.

Sapete come funziona il Machine Learning? In sostanza, si prende un software e gli si insegna, come per un bambino, cosa è rappresentato in tante immagini: in questa foto c’è un albero, in questa un hot dog, in questa una roccia,etc..

Si forniscono ossia, oltre che una logica similumana, anche una serie di esempi pratici con cui il software potrà confrontarsi per trovare la scelta più giusta.

Il “Machine Learning” diventa poi “Deep Learning” quando un software viene anche fornito di algoritmi che permettono al programma stessso di auto-imparare, di “insegnarsi” nuove nozioni.

Dimostrazione delle innovative ed acerbe potenzialità di Nvidia GauGAN

Con queste poche parole, per quanto neanche minimamente esaustive, si intuisce almeno il meccanismo insito del deep learning.

Il software, interpreterà il segno della vostra pennellata, andadovi ad applicare, sulla base di milioni di immagini immagazzinate ed indicizzate dal software tramite il deep learning, la foto più adatta da interpretare quel segno, fondendola quindi con il contesto di pennellate preesistenti.

“E’ molto più semplice fare brainstorming con delle banali bozze. E con questa tecnologia tali bozze possono venire convertite in immagini altamente realistiche“.
Questo a detta di Bryan Catanzaro, VP of Applied Deep Learning Reasercher di Nvidia.

Nvidia ha quindi deciso di applicare tale tecnologia al “PhotoBashing” (un collage digitale), facendo in modo di poter ricostruire tante immagini dal nulla, sfruttando la rete neurale del suo software, che però non tiene conto dell’immagine finale. E se ad un primo acchitto sembra eccezionale il risultato, non possono non essere presenti errori, di luce o di prospettiva generale, di ripetizioni di texture, di analisi delle forme.

Il termine “altamente realistiche“, usato da Catanzaro è decisamente un termine azzardato di Marketing. Tra ripetizioni evidenti, nessuna consistenza di illuminazione e palesi errori di unione, il sistema mostra già alcuni limiti. E questi limiti, non sono solo legati alla naturale acerbezza della tecnologia, ma propri e costanti della stessa tecnologia del deep learning.

Perchè? Perchè attualmente solo le pennellate vengono gestite tramite Deep learning, non la composizione nel suo insieme. Per cui la composizione finale, apparirà, seppur bella, come un pastrocchio, di immagini diverse, in cui su una montagna c’è della luce e su un’altra no, su una pozza d’acqua si riflette la roccia sovrastante, ma il cielo no.

Insomma, si, tutto bello, finchè facciamo lo sfondo di Windows XP. Cose banali ossia, che possono essere riprodotte da Nvidia GauGAN tramite uno schema semi logico di associazioniformeimmagini“.

Lo sfondo di Windows XP

Ma nel quotidiano di praticità d’uso ve ne è poca, se dovesse uscire in questo momento, senon quella di imbastire un enorme sfida di ego, tra incapaci che si credono Gauguin, usando appunto GauGAN, quando manco sanno cos’è la composizione.

Prima che possa diventare minimamente utilizzabile, l’intelligenza artificiale andrebbe arricchita di nuovi schemi, algoritmi di ragionamento ed esempi. Tutte cose che richiederebbero investimenti di tempo e denaro tali, da non poter giustificare le frustrazioni atroci di qualche programmatore che avrebbe voluto diventare un artista ma che, ahimè ha deciso di sfogare il suo auto-erotismo mentale tramite deep learning.

Non fraintendetemi, il deep learning è di fatto una tecnologia del futuro, con margini di guadagno e di sviluppo immensi. Ma perchè usarla per sviluppare software che vanno a mimare, con evidenti brutture ed imperfezioni , lavori di grafici? Considerando poi che questi potrebbero essere fatti meglio in un tempo molto minore  da un grafico o matte painter, in photoshop, rispetto a quello necessario per correggere tutte le suddette imperfezioni.
Nvidia, un consiglio personale: concentra le tue ricerche sul Deep Learning nel migliorare i tuoi sistemi di rendering, o meglio ancora il Raytracing in tempo reale… e paga ai tuoi dipendenti corsi di digital painting, così la frustrazione gli passa!

P.s. Lasciate stare Gauguin, che di certo non sarebbe stato entustiasta di veder utilizzare il suo nome per un simile prodotto..

pontolillo@ilas.com

Fu quando avevo 5 anni che scoccò la scintilla per la grafica 3D. L'uscita di Toy Story, film cult della Pixar, fu l'inizio del mio interesse per la nascente grafica in CGI. Dapprima nacque l'amore mai tramontato per il disegno, fu poi il tempo della grafica in 2D. Infine, diciottenne, approdai alla grafica tridimensionale, stregato dalle possibilità di poter raccontare e di ricreare qualsiasi cosa desiderassi. Dopo due anni ho iniziato a lavorare come 3D generalist, specializzandomi infine come Lighter TD, Concept artist e professionista Autodesk.

Review overview