Google Gemini cerca di mettere ChatGPT nello specchietto retrovisore

December 07, 2023
NelFinestre Centrali

Cosa hai bisogno di sapere

La corsa all’intelligenza artificiale si surriscalda quando Google ha rilasciato un nuovo modello di intelligenza artificiale (si pensi a GPT-4 vs GPT-3) per alimentare il proprio ecosistema AI.
I benchmark di Google mostrano che Gemini supera il GPT-4V in diversi parametri prestazionali.
Gemini sarà disponibile in 3 formati: Ultra, Pro e Nano.
Pixel 8 Pro sarà il primo Pixel a implementare Gemini tramite Gemini Nano.
Gemini Pro sarà disponibile tramite Gemini API in Google AI Studio il 21 dicembre. 13.

Con il recente sconvolgimento in OpenAI con il licenziamento e poi la riassunzione di Sam Altman, Google deve aver sentito l'odore del sangue nell'acqua perché solo poche settimane dopo Google ha annunciato un nuovo modello di intelligenza artificiale che sembra essere più potente di GPT-4V.

Google ha annunciato Google Gemini poiché il futuro dell'intelligenza artificiale per Google e a partire da oggi alimenterà Bard, e presto arriverà a tutti i prodotti AI di Google. Con 3 diverse dimensioni del modello: Ultra, Pro e Nano, Gemini 1.0 è costruito per essere onnipresente proprio come il resto di Google.

Cos'è Google Gemini?

Google definisce Gemini “il modello più capace e generale che abbiamo mai costruito”. È il modello di back-end ciò alimenterà la gamma di prodotti AI di Google, nonostante la decisione di rilasciare il modello con tre dimensioni.

Gemelli Ultra — Il modello più grande e capace di Google per attività altamente complesse.
Gemelli Pro — Il miglior modello di Google per la scalabilità in un'ampia gamma di attività.
Gemelli Nano — Il modello più efficiente di Google per le attività sul dispositivo.

Alcuni dei numeri sulle prestazioni pubblicizzati da Google per Gemini sono piuttosto impressionanti, ma se ho imparato una cosa in tecnologia, non fidarmi dei benchmark dei produttori. Detto questo, è difficile mettere in dubbio l'efficacia di Gemini vedendolo funzionare dal vivo. @rowancheung su X(Twitter) ha pubblicato un video mostra i Gemelli in azione e i risultati sono a dir poco notevoli.

🚨 BREAKING: Google DeepMind ha appena rivelato il più grande concorrente di Gemini-ChatGPT. Gemini è la PRIMA IA multimodale a superare gli esperti umani nel MMLU, con un punteggio superiore al 90%. pic.twitter.com/A7It1hPKGQ6 dicembre 2023

Vedi altro

Come si comporta Google Gemini?

Google sta pubblicizzando Gemini come il miglior modello di intelligenza artificiale del pianeta attraverso i benchmark pubblicati. Se questi benchmark resisteranno ai test di terze parti, Gemini sarà il leader sul mercato, almeno fino al rilascio di OpenAI ChatGPT-5. La grande regola dell’economia così come è strutturata attualmente è che, mentre le aziende competono per avere il prodotto migliore, solitamente vincono i consumatori.

Gemini dovrebbe spingere OpenAI a continuare a promuovere l'innovazione, ma ovviamente ci sono state molte preoccupazioni riguardo alla ricerca sconsiderata senza le dovute considerazioni sulla sicurezza, anche da parte di CEO come Satya Nadella paragonano l’intelligenza artificiale all’energia atomica.

Gemini Ultra è il primo modello a superare gli esperti umani in MMLU (massive multitask Language Understanding), che utilizza un combinazione di 57 materie come matematica, fisica, storia, diritto, medicina ed etica per testare sia la conoscenza del mondo che la risoluzione dei problemi abilità.

Google

Google Gemini ha superato ChatGPT-4V nella maggior parte dei benchmark mostrati da Google. A volte di oltre il 4% punti. Il benchmark con il nome più interessante del gruppo, HellaSwag, è stato quello che Gemini ha sottoperformato rispetto a ChatGPT-4V. Dai un'occhiata all'elenco completo dei benchmark.

Scorri per scorrere in orizzontale

Capacità	Segno di riferimento	Descrizione	Gemelli Ultra	GPT-4V
Generale	MMLU	Rappresentazione di domande in 57 argomenti (incl. STEM, discipline umanistiche e altri)	90,0% CoT@32*	86,4% 5 colpi* (riportato)
Ragionamento	Grande panca dura	Una serie diversificata di compiti impegnativi che richiedono un ragionamento in più fasi	83,6% 3 colpi	83,1% 3 colpi (API),
Riga 2 - Cella 0	GOCCIOLARE	Comprensione del testo (punteggio F1)	82.4 Tiri variabili	80,9 3 colpi (riportato)
Riga 3 - Cella 0	Hella Swag	Ragionamento basato sul buon senso per le attività quotidiane	87,8% 10 colpi*	95,3% 10 colpi* (riportato)
Matematica	GSM8K	Manipolazioni aritmetiche di base (incl. Problemi di matematica della scuola elementare)	94,4% maggiore1@32	92,0% CoT a 5 colpi (riportato)
Riga 5 - Cella 0	MATEMATICA	Problemi di matematica impegnativi (incl. algebra, geometria, precalcolo e altri)	53,2% 4 colpi	52,9% 4 colpi (API)
Codice	Valutazione umana	Generazione di codice Python	74,4% 0 colpi (IT)*	67,0% 0 colpi* (riportato)
Riga 7 - Cella 0	Natural2Codice	Generazione di codice Python. Nuovo set di dati simile a HumanEval, non trapelato sul web	74,9% 0 colpi	73,9% 0 colpi (API)
Riga 8 - Cella 0	Riga 8 - Cella 1	Riga 8 - Cella 2	Riga 8 - Cella 3	Riga 8 - Cella 4

Sebbene questi punteggi siano impressionanti, probabilmente non significano molto per il consumatore medio. Google che spinge Gemini Nano su Pixel 8 Pro è più entusiasmante per me in quanto è un modello per le attività sul dispositivo. Molti produttori stanno iniziando a farlo aggiungere funzionalità AI sul dispositivo, come TensorRT-LLM di NVIDIA ai dispositivi che producono. Per me, questa è una prospettiva più entusiasmante per il futuro dell’intelligenza artificiale, in cui potremo avere veri assistenti personali integrati nei nostri telefoni e personalizzare il nostro modello di intelligenza artificiale per funzionare al meglio per le nostre esigenze individuali.

Una delle migliori e probabilmente possibili applicazioni future per queste IA LLM è qualcosa che tutti abbiamo sognato da Star Trek più di 80 anni fa. Un traduttore linguistico universale. ChatGPT può già fungere da traduttore, ma è necessario un tempo di elaborazione piuttosto lungo per generare le traduzioni. Adesso ci sono Modelli di intelligenza artificiale in grado di tradurre la recitazione vocale in un'altra lingua, mantenendo intatta la voce dell'attore originale. Sono un grande fan degli anime, così come dei drammi giapponesi e coreani, mi piacerebbe un mondo in cui posso premi un pulsante sulla mia TV e senti la voce degli attori originali, ma ascoltala solo in inglese tempo reale. Mentre queste mega aziende competono per superarsi a vicenda nel progresso dell’intelligenza artificiale, questa realtà si avvicina sempre di più.