Google Gemini želi postaviti ChatGPT v vzvratno ogledalo

December 07, 2023
VOkna Centralna

Kaj morate vedeti

Dirka z umetno inteligenco se zaostruje, ko je Google izdal nov model umetne inteligence (pomislite na GPT-4 v primerjavi z GPT-3), ki bo poganjal njihov ekosistem umetne inteligence.
Googlova merila uspešnosti kažejo, da je Gemini boljši od GPT-4V v več meritvah uspešnosti.
Gemini bo na voljo v treh formatih: Ultra, Pro in Nano.
Pixel 8 Pro bo prvi Pixel, ki bo implementiral Gemini prek Gemini Nano.
Gemini Pro bo na voljo prek Gemini API v Google AI Studio decembra. 13.

Z nedavnim preobrat v OpenAI z odpustitvijo in nato ponovno zaposlitvijo Sama Altmana, je Google verjetno zavohal kri v vodi, ker je le nekaj tednov kasneje Google objavil nov model AI, ki se zdi zmogljivejši od GPT-4V.

Google napovedal Google Gemini saj bo prihodnost umetne inteligence za Google in od danes naprej poganjala Bard, kmalu pa bo prišla v vse Googlove izdelke umetne inteligence. S tremi različnimi velikostmi modela: Ultra, Pro in Nano, je Gemini 1.0 zgrajen tako, da je vseprisoten tako kot preostali Google.

Kaj je Google Gemini?

Google imenuje Gemini "najbolj zmogljiv in splošen model, kar smo jih kdaj zgradili." To je zaledni model ki bo poganjal Googlov nabor izdelkov AI, čeprav odločitev o izdaji modela s tremi velikosti.

Gemini Ultra — Googlov največji in najzmogljivejši model za zelo zapletene naloge.
Gemini Pro — Googlov najboljši model za prilagajanje širokemu naboru nalog.
Gemini Nano — Googlov najučinkovitejši model za opravila v napravi.

Nekatere številke o zmogljivosti, ki jih navaja Google za Gemini, so precej impresivne, a če sem se naučil le ene stvari v tehniki, ne zaupajte merilom uspešnosti proizvajalca. Kot rečeno, je težko dvomiti o učinkovitosti Geminija, če ga vidimo v živo. @rowancheung na X(Twitter) je objavil video prikazuje Gemini v akciji in rezultati niso nič drugega kot izjemni.

🚨 NAJBOLJŠE: Google DeepMind je pravkar razkril največjega konkurenta Gemini- ChatGPT. Gemini je PRVI multimodalni AI, ki je na MMLU prekašal človeške strokovnjake in dosegel več kot 90 % točk. pic.twitter.com/A7It1hPKGQ6. december 2023

Poglej več

Kako deluje Google Gemini?

Google Gemini oglašuje kot najboljši model umetne inteligence na planetu s pomočjo meril, ki jih je objavil. Če bodo ta merila uspešnosti zdržala do testiranja tretjih oseb, bo Gemini najboljši pes na trgu, vsaj do izdaje OpenAI Klepet GPT-5. Veliko pravilo gospodarstva, kot je trenutno strukturirano, je, da ko podjetja tekmujejo za najboljši izdelek, običajno zmagajo potrošniki.

Gemini bi moral spodbuditi OpenAI, da še naprej pospešuje inovacije, a očitno je bilo veliko pomislekov glede nepremišljenih raziskav brez ustreznih premislekov o varnosti, tudi od Izvršni direktorji, kot je Satya Nadella, primerjajo AI z atomsko energijo.

Gemini Ultra je prvi model, ki je boljši od človeških strokovnjakov pri MMLU (razumevanje množičnega večopravilnega jezika), ki uporablja kombinacija 57 predmetov, kot so matematika, fizika, zgodovina, pravo, medicina in etika za preverjanje znanja o svetu in reševanja problemov zmožnosti.

Google

Google Gemini je presegel ChatGPT-4V v večini primerjalnih testov, ki jih je prikazal Google. Včasih za več kot 4 % točke. Merilo uspešnosti z najzanimivejšim imenom v skupini, HellaSwag, je bilo tisto, pri katerem je bil Gemini slabši v primerjavi s ChatGPT-4V. Oglejte si celoten seznam meril.

Povlecite za vodoravno pomikanje

Zmogljivost	Benchmark	Opis	Gemini Ultra	GPT-4V
Splošno	MMLU	Predstavitev vprašanj pri 57 predmetih (vklj. STEM, humanistika in drugo)	90,0 % CoT@32*	86,4 % 5-shot* (prijavljen)
Utemeljitev	Big-Bench Hard	Raznolik nabor zahtevnih nalog, ki zahtevajo sklepanje v več korakih	83,6 % 3-met	83,1 % 3-shot (API),
Vrstica 2 – Celica 0	DROP	Bralno razumevanje (ocena F1)	82.4 Spremenljivi streli	80,9 3-shot (prijavljen)
Vrstica 3 – Celica 0	HellaSwag	Zdravo razmišljanje za vsakdanja opravila	87,8 % 10 strelov*	95,3 % 10-shot* (prijavljen)
matematika	GSM8K	Osnovne aritmetične manipulacije (vklj. razredne matematične naloge)	94,4 % maj1@32	92,0 % 5-shot CoT (prijavljen)
Vrstica 5 - celica 0	MATH	Zahtevne matematične težave (vklj. algebra, geometrija, predračun in drugo)	53,2 % 4-met	52,9 % 4-shot (API)
Koda	HumanEval	Generiranje kode Python	74,4 % 0-shot (IT)*	67,0 % 0-shot* (prijavljen)
Vrstica 7 - celica 0	Natural2Code	Generiranje kode Python. Nov zadržan nabor podatkov, podoben HumanEval, ni pricurljal v splet	74,9 % 0-met	73,9 % 0-shot (API)
Vrstica 8 - Celica 0	Vrstica 8 - celica 1	Vrstica 8 - celica 2	Vrstica 8 - celica 3	Vrstica 8 - Celica 4

Čeprav so te ocene impresivne, povprečnemu potrošniku verjetno ne pomenijo prav nič. Google, ki Gemini Nano postavlja na Pixel 8 Pro, je zame bolj vznemirljiv, saj je to model za opravila v napravi. Veliko proizvajalcev začenja dodajte zmogljivosti umetne inteligence v napravi, kot je NVIDIA TensorRT-LLM na naprave, ki jih izdelujejo. Zame je to bolj vznemirljiva možnost za prihodnost umetne inteligence, kjer lahko imamo prave osebne pomočnike vgrajene v naše telefone in prilagodimo svoj model umetne inteligence, da najbolje deluje za naše individualne potrebe.

Ena najboljših in verjetno možnih prihodnjih aplikacij za te umetne inteligence LLM je nekaj, o čemer vsi sanjamo od Zvezdnih stez pred več kot 80 leti. Univerzalni jezikovni prevajalnik. ChatGPT že lahko deluje kot prevajalec, vendar je za ustvarjanje prevodov potreben precej dolg čas obdelave. Zdaj obstajajo Modeli umetne inteligence, ki lahko prevedejo glasovno igro v drug jezik, pri čemer ohranijo prvotni igralčev glas nedotaknjen. Sem velik oboževalec animejev, pa tudi japonskih in korejskih dram, rad bi imel svet, kjer bi lahko pritisnite gumb na mojem TV-ju in slišali boste izvirni glas igralcev, vendar ga boste slišali samo v angleščini v realnem času. Medtem ko te mega korporacije tekmujejo, da bodo druga drugo presegle pri napredku umetne inteligence, se ta resničnost približuje vse bližje.