(ASI) Google ha appena sollevato il sipario sul suo nuovo gioiello tecnologico chiamato Gemini. Questo modello, sviluppato da un team di esperti provenienti dalle divisioni di intelligenza artificiale di punta di Google, promette di essere una pietra miliare nella storia della tecnologia.
Con un rilascio così atteso, Gemini è stato presentato come la risposta di Google al GPT-4 di OpenAI, ma è molto più di una semplice contesa tra giganti tecnologici. Si tratta di un'opera d'arte scientifica e ingegneristica, un capolavoro multimodale destinato a ridefinire l'elaborazione del linguaggio naturale.
La tecnologia Gemini è stata creata unendo le forze di Google Brain e DeepMind, le divisioni di IA di spicco del gigante tecnologico. Presentato come "il nostro più grande progetto scientifico e ingegneristico", Gemini è stato sviluppato per essere una forza trasformatrice nell'ambito dell'IA.
Una delle caratteristiche più sorprendenti di Gemini è la sua natura multimodale. Questo significa che il modello può elaborare non solo testo, ma anche immagini, audio, video e linguaggi di programmazione. È come se Gemini avesse imparato a parlare molte lingue contemporaneamente, ma con la potenza di elaborare dati in modi che prima erano riservati solo alla mente umana.
In termini pratici, ciò si traduce nella capacità di Gemini di analizzare grafici visivi e generare codice, sfidando direttamente Microsoft GitHub Copilot. I primi utenti avranno accesso a Gemini questo mese, mentre una versione più avanzata è prevista per il prossimo anno, promettendo di portare l'IA a nuove vette di comprensione e creatività.
Il modello Gemini è stato ottimizzato in tre taglie: Ultra, Pro e Nano. Ogni versione è stata progettata per affrontare sfide specifiche, dalla risoluzione di compiti altamente complessi alla gestione di applicazioni su dispositivi mobili. È come se Google avesse creato una famiglia di "supereroi" dell'IA, ognuno con il proprio compito e potenziamento unico.
L'ispirazione per Gemini ha una radice profonda nella storia di Google. Il modello deve molto al famoso AlphaGo, sviluppato da DeepMind nel 2016, che ha sconfitto un campione umano nel gioco del Go. Le tecniche di AlphaGo si fondono con le straordinarie capacità linguistiche dei grandi modelli come ChatGPT, creando un'entità nuova e potente nell'ecosistema dell'IA.
Gemini è stato testato in anteprima da un gruppo selezionato di aziende a settembre, e i risultati sono stati entusiasmanti. Il modello sembra avere un vantaggio su GPT-4 grazie all'accesso privilegiato di Google ai dati dei prodotti per i consumatori e alle informazioni raccolte online. Questa caratteristica dovrebbe consentire a Gemini di comprendere in modo più accurato le intenzioni degli utenti, evitando gli errori comuni nell'IA noti come "allucinazioni".
La corsa all'IA è diventata più appassionante con l'entrata in scena di Gemini, e il suo impatto potrebbe estendersi a settori come l'istruzione, la comunicazione multilingue e la creatività. Basti immaginare un assistente virtuale che può non solo rispondere alle vostre domande, ma anche comprendere le immagini, generare codice e sfidare i limiti della creatività.
Nonostante le numerose potenzialità di questo modello, la presentazione di Gemini ha però sollevato interrogativi dopo che è emerso che il video dimostrativo non rifletteva la realtà in modo accurato.
Google ha ammesso che la demo non è stata eseguita in tempo reale; invece, sono state utilizzate immagini fisse e prompt di testo predefiniti. Questo ha generato una discussione sulle reali capacità di Gemini, alimentando dubbi sulla trasparenza nelle presentazioni delle avanzate tecnologie di intelligenza artificiale.
Così Google si è difeso contro le accuse: "Il video è una rappresentazione illustrativa delle possibilità di interazione con Gemini, basata su veri prompt multimodali e risultati dei test. Non vediamo l'ora di vedere cosa creeranno le persone quando l'accesso a Gemini Pro si aprirà il 13 dicembre."
La controversia potrebbe influenzare la percezione di Gemini e sollevare la questione più ampia dell'affidabilità delle dimostrazioni di intelligenza artificiale in un settore in rapida evoluzione.
Tommaso Maiorca – Agenzia Stampa Italia