Google Gemini pyrkii tuomaan ChatGPT: n taustapeiliin

December 07, 2023
SisäänIkkunat Keskellä

Mitä sinun tarvitsee tietää

Tekoälykilpailu kuumenee, kun Google on julkaissut uuden tekoälymallin (ajattele GPT-4 vs GPT-3) tehostaakseen tekoälyekosysteemiään.
Googlen vertailuarvot osoittavat, että Gemini ylittää GPT-4V: n useissa suorituskykymittareissa.
Gemini tulee kolmessa muodossa: Ultra, Pro ja Nano.
Pixel 8 Pro on ensimmäinen Pixel, joka toteuttaa Geminin Gemini Nanon kautta.
Gemini Pro on saatavilla Gemini APIn kautta Google AI Studiossa joulukuussa. 13.

Viimeisimmän kanssa OpenAI: n mullistus Sam Altmanin potkua ja sitten palkkaamista uudelleen, Googlen on täytynyt haistaa verta vedessä, koska vain muutamaa viikkoa myöhemmin Google julkisti uuden tekoälymallin, joka näyttää olevan tehokkaampi kuin GPT-4V.

Google ilmoitti Google Gemini Koska Googlen tekoälyn tulevaisuus ja tästä päivästä alkaen, se toimii Bardissa, ja pian se tulee kaikkiin Googlen tekoälytuotteisiin. Mallista on kolme eri kokoa: Ultra, Pro ja Nano, joten Gemini 1.0 on rakennettu olemaan kaikkialla, kuten muukin Google.

Mikä on Google Gemini?

Google kutsuu Geminiä "kykevimmäksi ja yleisimmäksi malliksi, jonka olemme koskaan rakentaneet". Se on taustamalli joka antaa voiman Googlen AI-tuotteisiin, vaikka päätös julkaista malli kolmella koot.

Gemini Ultra — Googlen suurin ja tehokkain malli erittäin monimutkaisiin tehtäviin.
Gemini Pro — Googlen paras malli useiden tehtävien skaalaukseen.
Gemini Nano — Googlen tehokkain malli laitteessa oleviin tehtäviin.

Jotkut Googlen Geminille mainitsemista suorituskykyluvuista ovat melko vaikuttavia, mutta jos olen oppinut yhden asian tekniikassa, älä luota valmistajan vertailuarvoihin. Tästä huolimatta on vaikea kyseenalaistaa Geminin tehokkuutta, kun näet sen toimivan livenä. @rowancheung X: ssä (Twitter) julkaisi videon näyttelemällä Kaksoset toiminnassa, ja tulokset ovat aivan huikeita.

🚨 RAKKAUS: Google DeepMind paljasti juuri Gemini-ChatGPT: n suurimman kilpailijan. Gemini on ENSIMMÄINEN multimodaalinen tekoäly, joka on ylittänyt ihmisen asiantuntijat MMLU: ssa yli 90 prosentilla. pic.twitter.com/A7It1hPKGQ6. joulukuuta 2023

Katso lisää

Miten Google Gemini toimii?

Google mainitsee Geminiä planeetan parhaana tekoälymallina julkaisemiensa vertailuarvojen kautta. Jos nämä vertailuarvot kestävät kolmannen osapuolen testauksen, Gemini on markkinoiden paras koira ainakin OpenAI: n julkaisuun asti. ChatGPT-5. Suuri sääntö talouden nykyisessä rakenteessa on, että kun yritykset kilpailevat saadakseen parhaan tuotteen, kuluttajat yleensä voittaa.

Geminin pitäisi kannustaa OpenAI: ta jatkamaan innovaatioiden edistämistä, mutta on selvää, että holtittomasta tutkimuksesta ilman asianmukaisia turvallisuusnäkökohtia on ollut paljon huolta, jopa Toimitusjohtajat, kuten Satya Nadella, vertaavat tekoälyä atomienergiaan.

Gemini Ultra on ensimmäinen malli, joka päihittää ihmisen asiantuntijat MMLU: ssa (massive multitask language ymmärrys), joka käyttää 57 oppiaineen yhdistelmä, kuten matematiikka, fysiikka, historia, laki, lääketiede ja etiikka, joilla testataan sekä maailmantietoa että ongelmanratkaisua kyvyt.

Google

Google Gemini menestyi paremmin kuin ChatGPT-4V useimmissa Googlen osoittamissa vertailuissa. Joskus jopa yli 4 prosenttiyksikköä. Vertailuarvo, jolla oli mielenkiintoisin nimi joukosta, HellaSwag, oli se, jonka Gemini menestyi huonommin kuin ChatGPT-4V. Katso täydellinen luettelo vertailuarvoista.

Vieritä vaakasuunnassa pyyhkäisemällä

Kyky	Vertailuarvo	Kuvaus	Gemini Ultra	GPT-4V
Kenraali	MMLU	Kysymysten esitys 57 aiheesta (sis. STEM, humanistiset tieteet ja muut)	90,0 % CoT@32*	86,4 % 5-shot* (raportoitu)
Päättely	Big-Bench Hard	Monipuolinen joukko haastavia tehtäviä, jotka vaativat monivaiheista päättelyä	83,6 % 3 laukausta	83,1 % 3-shot (API),
Rivi 2 - Solu 0	PUDOTA	Luetun ymmärtäminen (F1-pisteet)	82.4 Muuttuva laukaus	80,9 3 laukaus (raportoitu)
Rivi 3 - Solu 0	HellaSwag	Tervettä järkeä jokapäiväisiin tehtäviin	87,8 % 10 laukausta*	95,3 % 10 laukausta* (raportoitu)
Matematiikka	GSM8K	Aritmeettiset peruskäsittelyt (sis. Luokkakoulun matematiikkatehtävät)	94,4 % maj1@32	92,0 % 5-shot CoT (raportoitu)
Rivi 5 - Solu 0	MATEMATIIKKA	Haastavat matematiikan tehtävät (sis. algebra, geometria, esilaskenta ja muut)	53,2 % 4 laukausta	52,9 % 4-shot (API)
Koodi	HumanEval	Python-koodin luominen	74,4 % nollasta (IT)*	67,0 % 0-laukaus* (raportoitu)
Rivi 7 - Solu 0	Natural2Code	Python-koodin luominen. Uusi, HumanEvalin kaltainen tietojoukko, ei vuotanut verkkoon	74,9 % 0-laukaus	73,9 % 0-shot (API)
Rivi 8 - Solu 0	Rivi 8 - Solu 1	Rivi 8 - Solu 2	Rivi 8 - Solu 3	Rivi 8 - Solu 4

Vaikka nämä pisteet ovat vaikuttavia, ne eivät todennäköisesti tarkoita tonnia keskivertokuluttajalle. Googlen työntäminen Gemini Nanon Pixel 8 Pron päälle on minusta jännittävämpää, koska se on malli laitteella suoritettaville tehtäville. Monet valmistajat ovat alkaneet lisää laitteen tekoälyominaisuuksia, kuten NVIDIAn TensorRT-LLM valmistamiinsa laitteisiin. Minulle tämä on jännittävämpi näkymä tekoälyn tulevaisuudelle, jossa voimme olla todellisia henkilökohtaisia avustajia sisäänrakennettuina puhelimiimme ja mukauttaa tekoälymallimme toimimaan parhaiten yksilöllisten tarpeidemme mukaan.

Yksi parhaista ja todennäköisesti mahdollisista tulevaisuuden sovelluksista näille LLM-AI: ille on jotain, josta olemme kaikki haaveilleet Star Trekistä yli 80 vuotta sitten. Universaali kielenkääntäjä. ChatGPT voi jo toimia kääntäjänä, mutta käännösten luominen kestää melko kauan. Niitä on nytkin AI-malleja, jotka voivat kääntää ääninäyttelijän toiselle kielelle pitäen alkuperäisen näyttelijän äänen ennallaan. Olen suuri animen sekä japanilaisten ja korealaisten draamien fani, rakastan maailmaa, jossa voin Paina televisioni painiketta ja kuule alkuperäisen näyttelijän äänen, mutta kuule se vain englanniksi reaaliaika. Kun nämä megayritykset kilpailevat toistensa päihittämisestä tekoälyn kehityksessä, tämä todellisuus lähestyy ja lähentyy.