Google Gemini încearcă să pună ChatGPT în oglinda retrovizoare

December 07, 2023
ÎnFerestre Centrale

click fraud protection

Ce trebuie sa stii

Cursa AI se încălzește pe măsură ce Google a lansat un nou model AI, (gândiți-vă că GPT-4 vs GPT-3) pentru a-și alimenta ecosistemul AI.
Benchmark-urile Google arată că Gemeni depășește GPT-4V în mai multe valori de performanță.
Gemeni va veni în 3 formate: Ultra, Pro și Nano.
Pixel 8 Pro va fi primul Pixel care va implementa Gemini prin Gemini Nano.
Gemini Pro va fi disponibil prin API-ul Gemini în Google AI Studio în decembrie. al 13-lea.

Cu recentul tulburări la OpenAI cu concedierea și apoi reangajarea lui Sam Altman, Google trebuie să fi simțit miros de sânge în apă pentru că doar câteva săptămâni mai târziu Google a anunțat un nou model AI care pare a fi mai puternic decât GPT-4V.

Google a anunțat Google Gemini deoarece viitorul AI pentru Google și începând de astăzi va alimenta Bard, iar în curând va ajunge la toate produsele Google AI. Cu 3 dimensiuni diferite ale modelului: Ultra, Pro și Nano, Gemini 1.0 este construit pentru a fi omniprezent la fel ca restul Google.

Ce este Google Gemini?

Google îi numește pe Gemini „cel mai capabil și general model pe care l-am construit vreodată”. Este modelul backend care va alimenta teancul Google de produse AI, deși decizia de a lansa modelul cu trei dimensiuni.

Gemeni Ultra — Cel mai mare și cel mai capabil model Google pentru sarcini extrem de complexe.
Gemeni Pro — Cel mai bun model Google pentru scalarea unei game largi de sarcini.
Gemeni Nano — Cel mai eficient model Google pentru sarcini de pe dispozitiv.

Unele dintre cifrele de performanță prezentate de Google pentru Gemeni sunt destul de impresionante, dar dacă am învățat un lucru în tehnologie, nu aveți încredere în benchmark-urile producătorilor. Acestea fiind spuse, este dificil să punem la îndoială eficiența Gemenilor atunci când îl vedem funcționând live. @rowancheung pe X(Twitter) a postat un videoclip arătând Gemeni în acțiune, iar rezultatele sunt deloc remarcabile.

🚨 DEZVOLTARE: Google DeepMind tocmai a dezvăluit cel mai mare competitor al Gemini-ChatGPT. Gemenii este PRIMUL AI multimodal care depășește experții umani în MMLU, obținând un scor de peste 90%. pic.twitter.com/A7It1hPKGQ6 decembrie 2023

Vezi mai mult

Cum funcționează Google Gemini?

Google prezintă Gemeni ca fiind cel mai bun model AI de pe planetă prin intermediul benchmark-urilor pe care le-a postat. Dacă aceste benchmark-uri dețin până la testare terță parte, Gemeni va fi cel mai bun câine de pe piață, cel puțin până la lansarea OpenAI. ChatGPT-5. Marea regulă cu economia așa cum este structurată în prezent este că, pe măsură ce companiile concurează pentru a avea cel mai bun produs, consumatorii de obicei câștigă.

Gemenii ar trebui să împingă OpenAI să continue să impulsioneze inovarea, dar, evident, au existat o mulțime de preocupări cu privire la cercetarea nesăbuită fără considerații adecvate pentru siguranță, chiar și de la CEO precum Satya Nadella compară inteligența artificială cu energia atomică.

Gemini Ultra este primul model care depășește experții umani în MMLU (înțelegerea masivă a limbajului multitask), care utilizează o combinație de 57 de materii precum matematică, fizică, istorie, drept, medicină și etică pentru testarea atât a cunoștințelor lumii, cât și a soluționării problemelor abilități.

Google

Google Gemini a depășit ChatGPT-4V în majoritatea benchmark-urilor prezentate de Google. Uneori cu peste 4% puncte. Benchmark-ul cu cel mai interesant nume din grup, HellaSwag, a fost cel pe care Gemeni l-a subperformat în comparație cu ChatGPT-4V. Aruncă o privire la lista completă a benchmark-urilor.

Glisați pentru a derula pe orizontală

Capacitate	Benchmark	Descriere	Gemeni Ultra	GPT-4V
General	MMLU	Reprezentarea întrebărilor în 57 de subiecte (incl. STEM, științe umaniste și altele)	90,0% CoT@32*	86,4% 5-shot* (raportat)
Raţionament	Big-Bench Hard	Set divers de sarcini provocatoare care necesită raționament în mai mulți pași	83,6% 3 lovituri	83,1% 3-shot (API),
Rândul 2 - Celula 0	CĂDERE BRUSCA	Înțelegerea cititului (Scor F1)	82.4 Lovituri variabile	80.9 3 lovituri (raportat)
Rândul 3 - Celula 0	HellaSwag	Raționament bun pentru sarcinile de zi cu zi	87,8% 10 lovituri*	95,3% 10 lovituri* (raportat)
Matematică	GSM8K	Manipulări aritmetice de bază (incl. probleme de matematică pentru școala generală)	94,4% maj1@32	92,0% CoT cu 5 injecții (raportat)
Rândul 5 - Celula 0	MATEMATICĂ	Probleme provocatoare de matematică (incl. algebră, geometrie, pre-calcul și altele)	53,2% 4 lovituri	52,9% 4 shot-uri (API)
Cod	HumanEval	Generarea codului Python	74,4% 0-shot (IT)*	67,0% 0-shot* (raportat)
Rândul 7 - Celula 0	Natural2Code	Generarea codului Python. Setul de date nou, asemănător cu HumanEval, care nu a fost scurs pe web	74,9% 0-shot	73,9% 0-shot (API)
Rândul 8 - Celula 0	Rândul 8 - Celula 1	Rândul 8 - Celula 2	Rândul 8 - Celula 3	Rândul 8 - Celula 4

Deși aceste scoruri sunt impresionante, probabil că nu înseamnă o tonă pentru consumatorul mediu. Google împingând Gemini Nano pe Pixel 8 Pro este mai interesant pentru mine, deoarece este un model pentru sarcinile de pe dispozitiv. Mulți producători încep să adăugați capabilități AI pe dispozitiv, cum ar fi TensorRT-LLM de la NVIDIA la dispozitivele pe care le produc. Pentru mine, aceasta este o perspectivă mai interesantă pentru viitorul AI, unde putem avea adevărați asistenți personali încorporați în telefoanele noastre și putem personaliza modelul nostru AI pentru a funcționa cel mai bine pentru nevoile noastre individuale.

Una dintre cele mai bune și probabil posibile aplicații viitoare pentru aceste IA LLM este ceva la care am visat cu toții încă de la Star Trek cu peste 80 de ani în urmă. Un traducător de limbi universale. ChatGPT poate acționa deja ca un traducător, dar există un timp destul de lung de procesare pentru a genera traducerile. Există acum Modele AI care pot traduce actoria vocală într-o altă limbă, păstrând intactă vocea actorului original. Sunt un mare fan al anime-ului, precum și al dramelor japoneze și coreene, mi-ar plăcea o lume în care să pot apăsați un buton de pe televizorul meu și aud vocea actorilor originali, dar doar auziți-o în engleză în în timp real. Pe măsură ce aceste mega corporații concurează pentru a se întrece reciproc în progresul AI, această realitate se apropie din ce în ce mai mult.