Google Gemini püüab ChatGPT-d tahavaatepeeglisse panna

December 07, 2023
SisseAknad Kesksed

Mida peate teadma

AI võidujooks kuumeneb, kuna Google on välja andnud uue tehisintellekti mudeli (mõelge GPT-4 vs GPT-3), et nende AI ökosüsteemi toita.
Google'i võrdlusnäitajad näitavad, et Gemini ületab GPT-4V mitmes toimivusmõõdikas.
Gemini on saadaval kolmes vormingus: Ultra, Pro ja Nano.
Pixel 8 Pro on esimene Pixel, mis rakendab Gemini läbi Gemini Nano.
Gemini Pro on saadaval Gemini API kaudu Google AI Studios detsembris. 13.

Viimasega murrang OpenAI-s koos Sam Altmani vallandamise ja seejärel töölevõtmisegaGoogle tundis vees kindlasti vere lõhna, sest vaid paar nädalat hiljem teatas Google uuest tehisintellekti mudelist, mis näib olevat võimsam kui GPT-4V.

Google teatas Google Gemini kui Google'i tehisintellekti tulevik ja alates tänasest toidab Bardit ning peagi jõuab see kõikidesse Google'i tehisintellektitoodetesse. Mudeli kolmes erinevas suuruses: Ultra, Pro ja Nano, Gemini 1.0 on ehitatud nii, et see oleks kõikjal levinud nagu ülejäänud Google.

Mis on Google Gemini?

Google nimetab Geminit "kõige võimekamaks ja üldisemaks mudeliks, mille oleme kunagi ehitanud". See on taustamudel mis toidab Google'i AI-toodete virna, ehkki otsus vabastada mudel kolmega suurused.

Kaksikud Ultra — Google'i suurim ja võimekaim mudel väga keeruliste ülesannete jaoks.
Kaksikud Pro — Google'i parim mudel paljude ülesannete skaleerimiseks.
Kaksikud Nano — Google'i kõige tõhusam mudel seadmesiseste toimingute jaoks.

Mõned Google'i poolt Gemini jaoks reklaamitud jõudlusnumbrid on üsna muljetavaldavad, kuid kui ma olen tehnikas üht asja õppinud, siis ärge usaldage tootjate võrdlusaluseid. Nagu öeldud, on Kaksikute efektiivsuses raske kahtluse alla seada, kui näeb, et see töötab otse. @rowancheung X-is (Twitter) postitas video Näidates Kaksikuid tegevuses ja tulemused on midagi märkimisväärset.

🚨 MURDE: Google DeepMind paljastas just Gemini-ChatGPT suurima konkurendi. Gemini on ESIMENE multimodaalne tehisintellekt, kes ületas MMLU-s inimeksperte, saavutades üle 90%. pic.twitter.com/A7It1hPKGQ6. detsember 2023

Näe rohkem

Kuidas Google Gemini toimib?

Google reklaamib Gemini postitatud võrdlusnäitajate kaudu planeedi parimaks tehisintellekti mudeliks. Kui need võrdlusalused kehtivad kuni kolmanda osapoole testimiseni, on Gemini turul parim koer, vähemalt kuni OpenAI väljalaskmiseni ChatGPT-5. Praeguse majanduse suur reegel on see, et kui ettevõtted võistlevad parima toote nimel, võidavad tavaliselt tarbijad.

Kaksikud peaksid sundima OpenAI-d jätkama innovatsiooni edendamist, kuid ilmselgelt on olnud palju muret hoolimatute teadusuuringute pärast, ilma ohutusega arvestamata, isegi alates Tegevjuhid nagu Satya Nadella võrdlevad tehisintellekti aatomienergiaga.

Gemini Ultra on esimene mudel, mis edestab inimeksperte MMLU (massiivne multitegumkeele mõistmine), mis kasutab kombinatsioon 57 ainest, nagu matemaatika, füüsika, ajalugu, õigus, meditsiin ja eetika, et testida nii maailmateadmisi kui ka probleemide lahendamist võimeid.

Google

Google Gemini edestas ChatGPT-4V enamikus Google'i näidatud võrdlusalustes. Mõnikord üle 4% punkti. Kõige huvitavama nimega etalon HellaSwag oli see, mis Geminil oli ChatGPT-4V-ga võrreldes kehvem. Vaadake võrdlusaluste täielikku loendit.

Pühkige horisontaalselt kerimiseks

Võimekus	Võrdlusnäitaja	Kirjeldus	Kaksikud Ultra	GPT-4V
Kindral	MMLU	Küsimuste esitus 57 aines (sh. STEM, humanitaarteadused ja teised)	90,0% CoT@32*	86,4% 5-shot* (teatatud)
Arutluskäik	Big-Bench Hard	Mitmekesine komplekt väljakutseid pakkuvaid ülesandeid, mis nõuavad mitmeastmelist arutluskäiku	83,6% 3 lööki	83,1% kolmekordne (API),
2. rida – lahter 0	TULLA	Teksti mõistmine (F1 skoor)	82,4 Muutuv löök	80,9 3-lask (teatatud)
3. rida – lahter 0	HellaSwag	Igapäevaste toimingute arutluskäik	87,8% 10-võte*	95,3% 10-shot* (teatatud)
matemaatika	GSM8K	Põhilised aritmeetilised manipulatsioonid (sh. klassi matemaatikaülesanded)	94,4% maj1@32	92,0% 5-shot CoT (teatatud)
5. rida – lahter 0	MATEMAATIKA	Keerulised matemaatikaülesanded (sh. algebra, geomeetria, eelarvutus ja teised)	53,2% 4 lööki	52,9% 4-shot (API)
Kood	HumanEval	Pythoni koodi genereerimine	74,4% 0-shot (IT)*	67,0% 0-shot* (teatatud)
7. rida – lahter 0	Natural2Code	Pythoni koodi genereerimine. Uus andmekogum oli HumanEvali sarnane, veebi ei lekkinud	74,9% 0-lask	73,9% 0-shot (API)
8. rida – lahter 0	8. rida – lahter 1	8. rida – lahter 2	8. rida – lahter 3	8. rida – lahter 4

Kuigi need hinded on muljetavaldavad, ei tähenda need tõenäoliselt tavatarbijale tonni. Google'i lükkamine Gemini Nano peale Pixel 8 Pro on minu jaoks põnevam, kuna see on seadmesiseste toimingute mudel. Paljud tootjad hakkavad seda tegema lisage seadmes olevad AI-võimalused, nagu NVIDIA TensorRT-LLM nende valmistatud seadmetele. Minu jaoks on see AI tuleviku jaoks põnevam väljavaade, kus saame oma telefonidesse sisseehitada tõelised isiklikud assistendid ja kohandada oma tehisintellekti mudelit nii, et see vastaks kõige paremini meie individuaalsetele vajadustele.

Üks parimaid ja tõenäoliselt võimalikke tulevasi rakendusi nende LLM AI-de jaoks on midagi, millest oleme kõik unistanud alates Star Trekist alates 80 aastat tagasi. Universaalne keeletõlk. ChatGPT saab juba tõlkida, kuid tõlgete genereerimiseks kulub üsna pikk töötlemisaeg. Nüüd on neid AI mudelid, mis suudavad tõlkida häälnäitlemise teise keelde, säilitades algse näitleja hääle puutumatuna. Olen suur anime, aga ka jaapani ja korea draamade fänn, mulle meeldiks maailm, kus saaksin Vajutan teleri nuppu ja kuulete näitlejate originaalhäält, kuid kuulake seda inglise keeles reaalajas. Kuna need megakorporatsioonid võistlevad tehisintellekti edenemises üksteisest ülesaamise nimel, läheneb see reaalsus üha lähemale.