ascolta l'articolo!
|
Apple ha recentemente lanciato MGIE (MLLM-Guided Image Editing), un modello di intelligenza artificiale open source che promette di rivoluzionare l’editing delle immagini, consentendo agli utenti anche non esperti di grafica, di apportare modifiche complesse attraverso semplici istruzioni testuali. Ironia facile: ora i clienti avranno ragione a dire che fa tutto il computer.
Sviluppato in collaborazione con l’Università della California – Santa Barbara, questo strumento utilizza i modelli di linguaggio multimodale di grandi dimensioni (MLLM) per interpretare le richieste degli utenti e modificare le immagini a livello di pixel, introducendo effettivamente una nuova era nell’editing fotografico digitale. in realtà sembrerebbe nulla di nuovo rispetto alle IA sviluppate da Photoshop e simili ma MGIE promette di portare l’editing di immagine a un livello superiore con risultati molto piu pertenenti ed esatti.
Le Capacità di MGIE: Versatilità e Precisione
MGIE dimostra una notevole versatilità, consentendo sia miglioramenti globali (come la regolazione della luminosità, del contrasto e della nitidezza) sia modifiche localizzate (ad esempio, la modifica della forma, dimensione, colore o texture di specifiche aree). Tra le funzionalità avanzate vi sono operazioni in stile Photoshop, come ritaglio, ridimensionamento, rotazione, applicazione di filtri, sostituzione di sfondi e fusione di immagini. La vera rivoluzione di questa tecnologia sta nella possibilità di tradurre istruzioni testuali molto specifiche e dettagliate in modifiche visive precise il che apre nuovi orizzonti per la creatività digitale, promettendo di rendere l’editing delle immagini più intuitivo e accessibile.
MGIE si distingue per la sua capacità di interpretare e raffinare le richieste testuali degli utenti, traducendole in istruzioni chiare e concisi per l’editing. Ad esempio, una semplice richiesta come “rendi l’erba più verde” viene elaborata e trasformata in un comando specifico (“aumenta la saturazione del colore nella regione dell’erba del 20%”), permettendo modifiche mirate e precise.
Oltre a regolazioni di carattere puramente fotografico come colore, temperatura, e illuminazione, MGIE può effettuare modifiche più complesse, come cambiare espressioni in un ritratto, aggiungere o rimuovere elementi, modificare sfondi, o combinare due immagini. Queste operazioni possono essere applicate a tutta l’immagine o a zone specifiche, offrendo un’esperienza di editing profondamente personalizzabile e accessibile a tutti. Immaginate di voler modificare l’immagine di una pizza per renderla visivamente più salutare: con MGIE, basta un semplice comando come “rendila più sana” e il modello aggiungerà automaticamente ingredienti salutari. Questa capacità di interpretare richieste da semplici a complesse dimostra la potenza e la flessibilità di MGIE. L’utente può chiedere di aumentare il contrasto di una foto scura con un comando diretto come “aggiungi più contrasto”, e MGIE eseguirà l’istruzione con precisione.
Critiche e Perplessità
Nonostante l’entusiasmo suscitato dal lancio di MGIE, emergono anche critiche e perplessità. Alcuni esperti sollevano dubbi sull’efficacia di MGIE in scenari di editing complessi, evidenziando come le richieste testuali possano a volte essere interpretate in modo troppo letterale o inadeguato dal modello. La preoccupazione riguarda anche la potenziale perdita di dettagli sottili e la sfida di mantenere l’autenticità visiva nelle modifiche avanzate.
intanto MGIE è utilizzabile in anteprima sul sito hugging face ma oltre a essere difficile da accedere in quanto preso d’assalto da moltissimi utenti, i risultati sono ancora acerbi per poter capire quale sarà il vero prodotto finito che con tutta probabilità ci ritroveremo nei nostri dispoitivi entro la fine del 2024, in concomitanza con l’uscita del nuovo ios.
Open Source e Futuro
Con la decisione di rendere MGIE un progetto open source disponibile su GitHub, Apple apre le porte a una vasta gamma di potenziali sviluppi e applicazioni. Tuttavia, l’azienda non ha ancora specificato come intende integrare questa tecnologia nei suoi prodotti consumer, lasciando spazio a infinite possibilità. La mossa di Apple con MGIE rafforza il suo impegno nel campo dell’intelligenza artificiale, un’area in cui deve competere con giganti tecnologici come Meta, Microsoft e Google. Con il lancio di strumenti come MLX a dicembre, progettati per semplificare l’addestramento di modelli di IA sui chip Apple Silicon, il 2024 si preannuncia come un anno di importanti innovazioni IA da parte di Apple, con Tim Cook che anticipa funzionalità inedite su molti dispositivi dell’azienda.
Il Futuro di MGIE e le Sue Implicazioni
Presentato alla conferenza ICLR 2024 e reso disponibile su GitHub e con una versione utilizzabile online su hugginface, MGIE rappresenta il secondo traguardo importante di Apple nella ricerca AI, seguendo l’innovativa tecnica per impiegare modelli linguistici su dispositivi con poca memoria. Le speculazioni su uno sviluppo in corso di un “Apple GPT” e l’eventuale integrazione di funzionalità AI generativa in iPhone e iPad entro la fine del 2024, in concomitanza con l’arrivo di iOS 18, suggeriscono che MGIE potrebbe essere solo l’inizio di una serie di innovazioni.
MGIE di Apple è senza dubbio un passo interessante verso l’evoluzione dell’editing di immagini, promettendo di democratizzare le tecniche avanzate e rendere la fotografia digitale più accessibile. Tuttavia, oltre a chi osanna le funzioni MGIE vi sono anche parecchie perplessità sollevate da alcuni esperti sottolineano l’importanza di un approccio equilibrato che valuti sia le potenzialità sia i limiti di questa tecnologia anche se “Ça va sans dire” e difficile pensare che apple non abbia gia previsto tutti possibili scenari del caso. Come con ogni strumento rivoluzionario, ricordiamoci che esso rimane sempre uno strumento, il successo di MGIE dipenderà dalla sua capacità di evolversi in risposta al feedback degli utenti e di integrarsi armoniosamente nell’ecosistema digitale, mantenendo al contempo un alto livello di qualità e autenticità visiva, bisognerà poi capire quanto un utente finale sia in grado di saper sfruttare questa potenza a scopo creativo e quanto invece possa trarne beneficio chi con la grafica ci lavora veramente.
Sui social serpeggia un certo malcontento in quanto MGIE di Apple ha l’obbiettivo di rendere il fotoritocco accessibile a tutti rendendo inutile il doversi rivolgere a un grafico per delle modifiche, alquanto ironico in quanto i computer con la mela siano i piu usati proprio dai grafici.