Google Gemini nastoji staviti ChatGPT u retrovizor

December 07, 2023
UProzori Centralni

Što trebaš znati

Utrka s umjetnom inteligencijom se zahuktava jer je Google objavio novi model umjetne inteligencije (mislite na GPT-4 nasuprot GPT-3) za pokretanje svog ekosustava umjetne inteligencije.
Googleova mjerila pokazuju da Gemini nadmašuje GPT-4V u nekoliko metrika performansi.
Gemini će biti dostupan u 3 formata: Ultra, Pro i Nano.
Pixel 8 Pro bit će prvi Pixel koji će implementirati Gemini kroz Gemini Nano.
Gemini Pro bit će dostupan putem Gemini API-ja u Google AI Studiju 12. 13.

S nedavnim preokret u OpenAI-ju s otpuštanjem, a potom i ponovnim zapošljavanjem Sama Altmana, Google je sigurno namirisao krv u vodi jer je samo nekoliko tjedana kasnije Google najavio novi AI model koji se čini moćnijim od GPT-4V.

Google objavio je Google Gemini kao budućnost umjetne inteligencije za Google i od danas će pokretati Bard, a uskoro će doći i na sve Googleove proizvode umjetne inteligencije. Uz 3 različite veličine modela: Ultra, Pro i Nano, Gemini 1.0 napravljen je da bude sveprisutan baš kao i ostatak Googlea.

Što je Google Gemini?

Google naziva Gemini "najsposobnijim i najopćenitijim modelom koji smo ikada napravili." To je pozadinski model koji će pokretati Googleov skup AI proizvoda, iako je odluka o izdavanju modela s tri veličine.

Gemini Ultra — Googleov najveći i najsposobniji model za vrlo složene zadatke.
Gemini Pro — Googleov najbolji model za skaliranje u širokom rasponu zadataka.
Blizanci Nano — Googleov najučinkovitiji model za zadatke na uređaju.

Neki od brojeva performansi koje Google reklamira za Gemini prilično su impresivni, ali ako sam nešto naučio u tehnologiji, ne vjerujte proizvođačevim mjerilima. S tim u vezi, teško je dovesti u pitanje učinkovitost Geminija kada se vidi kako radi uživo. @rowancheung na X(Twitter) objavio je video pokazujući Gemini na djelu i rezultati su ništa manje nego izvanredni.

🚨 NAJVEĆE: Google DeepMind upravo je otkrio najvećeg konkurenta Gemini-ChatGPT-a. Gemini je PRVI multimodalni AI koji je nadmašio ljudske stručnjake na MMLU-u, s ocjenom od preko 90%. pic.twitter.com/A7It1hPKGQ6. prosinca 2023

Vidi više

Kako radi Google Gemini?

Google reklamira Gemini kao najbolji model umjetne inteligencije na planeti kroz mjerila koja je objavio. Ako ova mjerila izdrže testiranje treće strane, Gemini će biti vodeći na tržištu, barem do objave OpenAI-ja ChatGPT-5. Veliko pravilo s gospodarstvom kakvo je trenutno strukturirano je da dok se tvrtke natječu za najbolji proizvod, potrošači obično pobjeđuju.

Gemini bi trebao potaknuti OpenAI da nastavi s poticanjem inovacija, ali očito je bilo mnogo zabrinutosti zbog nepromišljenog istraživanja bez odgovarajućeg razmatranja sigurnosti, čak i od Direktori poput Satye Nadelle uspoređuju AI s atomskom energijom.

Gemini Ultra je prvi model koji nadmašuje ljudske stručnjake na MMLU-u (masovno razumijevanje višezadaćnog jezika), koji koristi kombinacija 57 predmeta kao što su matematika, fizika, povijest, pravo, medicina i etika za testiranje znanja o svijetu i rješavanja problema sposobnostima.

Google

Google Gemini nadmašio je ChatGPT-4V u većini mjerila koja je prikazao Google. Ponekad za više od 4% bodova. Mjerilo s najzanimljivijim imenom u nizu, HellaSwag, bilo je ono koje je Gemini imao slabije rezultate u usporedbi s ChatGPT-4V. Pogledajte cijeli popis mjerila.

Prijeđite prstom za vodoravno pomicanje

Sposobnost	Benchmark	Opis	Gemini Ultra	GPT-4V
Općenito	MMLU	Zastupljenost pitanja u 57 predmeta (uklj. STEM, humanističke znanosti i drugi)	90,0% CoT@32*	86,4% 5-shot* (prijavljeno)
Rasuđivanje	Big-Bench Hard	Raznovrstan skup izazovnih zadataka koji zahtijevaju razmišljanje u više koraka	83,6% 3-šut	83,1% 3 snimka (API),
Redak 2 - ćelija 0	PAD	Razumijevanje pročitanog (F1 rezultat)	82.4 Varijabilni udarci	80,9 3 udarca (prijavljeno)
Redak 3 - ćelija 0	HellaSwag	Zdravo razmišljanje za svakodnevne zadatke	87,8% 10 udaraca*	95,3% 10-shot* (prijavljeno)
matematika	GSM8K	Osnovne aritmetičke manipulacije (uklj. Zadaci iz matematike u osnovnoj školi)	94,4% [email protected]	92,0% CoT s 5 hitaca (prijavljeno)
Redak 5 - ćelija 0	MATEMATIKA	Teški matematički problemi (uklj. algebra, geometrija, predračun i drugi)	53,2% 4 šuta	52,9% 4 snimka (API)
Kodirati	HumanEval	Generiranje Python koda	74,4% 0-šut (IT)*	67,0% 0-shot* (prijavljeno)
Redak 7 - ćelija 0	Natural2Code	Generiranje Python koda. Novi skup podataka nalik na HumanEval, nije procurio na webu	74,9% 0-šut	73,9% 0-shot (API)
Redak 8 - ćelija 0	Redak 8 - ćelija 1	Redak 8 - Ćelija 2	Redak 8 - ćelija 3	Redak 8 - ćelija 4

Iako su ovi rezultati impresivni, prosječnom potrošaču vjerojatno ne znače ništa. Više mi je uzbudljivo što Google stavlja Gemini Nano na Pixel 8 Pro jer je to model za zadatke na uređaju. Mnogi proizvođači počinju dodajte AI mogućnosti na uređaju, poput NVIDIA TensorRT-LLM na uređaje koje proizvode. Za mene je ovo uzbudljivija perspektiva za budućnost umjetne inteligencije, gdje možemo imati prave osobne asistente ugrađene u svoje telefone i prilagoditi naš model umjetne inteligencije da najbolje funkcionira za naše individualne potrebe.

Jedna od najboljih i vjerojatno mogućih budućih aplikacija za ove LLM AIs je nešto o čemu smo svi sanjali još od Zvjezdanih staza prije više od 80 godina. Univerzalni jezični prevoditelj. ChatGPT već može djelovati kao prevoditelj, ali postoji prilično dugo vrijeme obrade za generiranje prijevoda. Sada postoje Modeli umjetne inteligencije koji mogu prevesti glasovnu glumu na drugi jezik, zadržavajući originalni glas glumca netaknutim. Veliki sam obožavatelj animea, kao i japanskih i korejskih drama, volio bih svijet u kojem mogu pritisnite tipku na mom TV-u i čujte originalni glas glumaca, ali čujte ga samo na engleskom stvarno vrijeme. Dok se ove megakorporacije natječu da nadmaše jedna drugu u napretku umjetne inteligencije, ova se stvarnost približava sve bliže i bliže.