Tutto su Gemini: L’intelligenza artificiale secondo Google

Google Gemini Logo

Arriva Gemini, il nuovo LLM di Google che promette davvero “cose” impressionanti con l’Intelligenza Artificiale

Google Gemini è il nuovo LLM (Modello di Linguaggio di Grandi dimensioni, Large Language Model dall’Inglese) di Google, che rappresenta il primo lavoro sull’intelligenza artificiale in grado di impensierire OpenAI viste le potenziali mostrate in anteprima.

Realizzato da Brain Team e DeepMind di Alphabet, è stato completamente progettato da zero ed è stata concepita per essere multimodale così da potersi adattare a numerosi casi d’uso senza modifiche. E già nella prima dimostrazione mostra un potenziale pazzesco.

Cos’è Google Gemini?

Gemini è il nuovo modello di linguaggio di grandi dimensioni che Google utilizzerà come base per sviluppare tutti i progetti di intelligenza artificiale, come Bard (che fino a poco fa usare PaLM2). Gemini per Bard è come GPT-4 per ChatGPT, cioè la tecnologia che c’è dietro che permette di sfruttare l’intelligenza artificiale.

Il modo più semplice per spiegare un LLM è pensarlo come il motore dietro l’intelligenza artificiale, mentre i chatbot come Google Bard sono le macchine che lo guidano. Insomma un nuovo linguaggio creato da Google per creare l’intelligenza artificiale di un altro livello.

Gemini vs GPT

Google Gemini Nano non ha un confronto diretto, ma Gemini Pro e Ultra sono effettivamente la risposta di Google rispettivamente a GPT 3.5 e GPT 4. Gemini non solo ha la potenza di Ricerca Google in modo da poter recuperare informazioni più aggiornate.

Gemini è anche avanti a entrambi i motori nella stragrande maggioranza dei parametri. Ad esempio, Gemini Ultra ha super nelle performance GPT 4 nei benchmark MATH e GSM8K ed è nettamente superiore a GPT per la generazione di codice Python.

Gemini Nano, Pro e Ultra. Ecco le differenze

  • Gemini Ultra Il modello più grande e capace per compiti altamente complessi.
  • Gemini Pro Il miglior modello per adattarsi a un’ampia gamma di attività.
  • Gemini Nano Il modello più efficiente per le attività sul dispositivo.

Scopriamoli in dettaglio di seguito.

Google Gemini Nano: Pensata per l’integrazione diretta sui dispositivi mobili

Google Gemini è il modello più leggero ed efficiente, progettato per funzionare direttamente su dispositivi mobili. Google non si è accontentato di sole tre versioni di Gemini poiché Nano ha due varianti proprie Nano-1 e Nano-2. Il primo può gestire 1,8 miliardi di parametri, mentre il secondo è capace di 3,25 miliardi.

Sebbene entrambi siano progettati per funzionare direttamente su hardware a bassa potenza, Nano-1 è per dispositivi con poca memoria e Nano-2 è orientato verso prodotti ad alta memoria. Attualmente, Gemini Nano è in fase di lancio sotto forma della nuova app AICore per gli utenti Pixel 8 Pro.

Questa app abilita tutta una serie di nuove funzionalità AI su Pixel 8 Pro, inclusa la possibilità di riepilogare le pagine web utilizzando l’Assistente Google, nuovi trucchi AI su Google Foto e molto altro. Insomma un assaggio su cosa potremmo vedere sui dispositivi in futuro.

Google Gemini Pro: Il motore di Bard

Gemini Pro è la modalità di livello intermedio e ciò che attualmente alimenta Google Bard. La buona notizia è che Bard dovrebbe essere in grado di competere meglio con ChatGPT ora che funziona su Gemini Pro, almeno se le affermazioni di Google sono accurate.

Secondo quanto riferito, Pro è più capace di GPT-3.5 in sei diversi benchmark ed è particolarmente ottimizzato per attività come brainstorming, riepilogo di contenuti e scrittura. Sebbene questa non sia la versione più recente di GPT, è quella più frontale in quanto è ciò che alimenta il popolare servizio ChatGPT.

Google Gemini Ultra: Quando serve potenza pura

Google Gemini Ultra rappresenta il livello più alto ed è il modello LLM che dà filo da torcere a GPT-4. L’Ultra supera 30 dei 32 benchmark per i test utilizzati per gli LLM e batte GPT-4 in ogni categoria al di fuori del ragionamento basato sul buon senso per le attività quotidiane.

Mentre GPT-4 è in grado di comprendere solo il contesto di parole e immagini, Gemini fa un ulteriore passo avanti e può comprendere informazioni sfumate per parole, immagini, audio, codifica e argomenti ancora più complicati relativi alla matematica e alla fisica

Può anche rispondere rapidamente alle tue domande, essenzialmente in tempo reale. Sfortunatamente, non è ancora disponibile in alcuna forma e quindi rimane più una promessa che altro. Per questa versione dovremo aspettare ancora un po’ prima di vederla in azione realmente.

Come accedere al ChatBot Bard basato su Google Gemini

Il modo più semplice per accedere a Bard è andare su bard.google.com. Dovrai accedere con il tuo account Google se non lo hai già fatto. Non devi fare nulla per passare da Bard a Gemini, poiché questo è stato integrato da Google nel back-end.

Ovviamente vale la pena notare che Bard è disponibile solo in inglese, anche se puoi trovarlo in più di 170 paesi. Il nuovo Bard potenziato dai Gemini sarà inizialmente disponibile in inglese in più di 170 paesi, anche se sorprendentemente non nel Regno Unito o in Europa. Ciò è dovuto a ostacoli normativi che, si spera, verranno risolti a breve.

Altre curiosità su Google Gemini

La prima demo di Google Gemini non è stata registrata in tempo reale, ma ritagliata per rispettare tempi tecnici. Lo ha dichiarato Google stessa “Ai fini di questa demo, la latenza è stata ridotta e gli output di Gemini sono stati ridotti per brevità” Questo dimostra che c’è ancora da lavorare sulle tempistiche di risposta.

L’intelligenza artificiale Gemini di Google potrebbe presto arrivare su Samsung e altri telefoni Android. Infatti Gemini Nano ora supporta diverse funzionalità direttamente eseguibili sullo smartphone Pixel 8 Pro ma altri dispositivi top di gamma potrebbero veder integrato Gemini.

La dimostrazione che vedete nel video seguente è stata fatta da Gemini in una serie di comandi dove l’intelligenza artificiale ha visto mettere in pratica le sue doti anche se questa versione non è stata registrata in tempo reale, ma “tagliata” ad arte per risultare spettacolare.

Gemini spinge ai massimi livello Google Recorder che ora permette di ottenere riassunti audio precisi e diretti. Al momento, serve ben 1GB di dati da scaricare offline per offrire queste capacità di riassunto degli audio dall’app di Google.

Quando verrà rilasciato Google Gemini?

La data di rilascio di Google Gemini è un po’ complicata e non c’è nulla di ufficiale in quanto varia sia a seconda della versione LLM che delle applicazioni in cui verrà integrato. Ecco comunque una ripartizione di base sulle prossime date di Gemini:

  • Google Gemini Nano arriverà in anteprima nella nuova app AI Core di Google sui Pixel 8 Pro il 6 dicembre. Si prevede che prima o poi arriverà anche su altri dispositivi Android 14, ma almeno per ora rimane un’esclusiva dei Pixel.
  • Google Gemini Pro è stato lanciato il 6 dicembre come aggiornamento nascosto di Google Bard. Si prevede inoltre che verrà distribuito ai clienti aziendali che utilizzano Vertex AI il 13 dicembre.
  • Google Gemini Ultra è la versione più potente di LLM e dovrebbe essere un concorrente più adatto a ChatGPT. Sfortunatamente, non arriverà a breve. Sebbene Google non abbia ancora fissato la data di rilascio di Gemini Ultra, si parla di inizio 2025 o fine 2024.

FONTE

Sono appassionato di tecnologia sin dalla tenera età, coltivo la mia passione con aggiornamenti quotidiani e non mi lascio scappare proprio nulla. Ho creato HowTechIsMade per condividere con voi le mie passioni ed aiutarvi ad avere un approccio più semplice con la tecnologia.