Google Gemini pyrkii tuomaan ChatGPT: n taustapeiliin

click fraud protection

Mitä sinun tarvitsee tietää

  • Tekoälykilpailu kuumenee, kun Google on julkaissut uuden tekoälymallin (ajattele GPT-4 vs GPT-3) tehostaakseen tekoälyekosysteemiään.
  • Googlen vertailuarvot osoittavat, että Gemini ylittää GPT-4V: n useissa suorituskykymittareissa.
  • Gemini tulee kolmessa muodossa: Ultra, Pro ja Nano.
  • Pixel 8 Pro on ensimmäinen Pixel, joka toteuttaa Geminin Gemini Nanon kautta.
  • Gemini Pro on saatavilla Gemini APIn kautta Google AI Studiossa joulukuussa. 13.

Viimeisimmän kanssa OpenAI: n mullistus Sam Altmanin potkua ja sitten palkkaamista uudelleen, Googlen on täytynyt haistaa verta vedessä, koska vain muutamaa viikkoa myöhemmin Google julkisti uuden tekoälymallin, joka näyttää olevan tehokkaampi kuin GPT-4V.

Google ilmoitti Google Gemini Koska Googlen tekoälyn tulevaisuus ja tästä päivästä alkaen, se toimii Bardissa, ja pian se tulee kaikkiin Googlen tekoälytuotteisiin. Mallista on kolme eri kokoa: Ultra, Pro ja Nano, joten Gemini 1.0 on rakennettu olemaan kaikkialla, kuten muukin Google.

Mikä on Google Gemini?

Google kutsuu Geminiä "kykevimmäksi ja yleisimmäksi malliksi, jonka olemme koskaan rakentaneet". Se on taustamalli joka antaa voiman Googlen AI-tuotteisiin, vaikka päätös julkaista malli kolmella koot.

  • Gemini Ultra — Googlen suurin ja tehokkain malli erittäin monimutkaisiin tehtäviin.
  • Gemini Pro — Googlen paras malli useiden tehtävien skaalaukseen.
  • Gemini Nano — Googlen tehokkain malli laitteessa oleviin tehtäviin.

Jotkut Googlen Geminille mainitsemista suorituskykyluvuista ovat melko vaikuttavia, mutta jos olen oppinut yhden asian tekniikassa, älä luota valmistajan vertailuarvoihin. Tästä huolimatta on vaikea kyseenalaistaa Geminin tehokkuutta, kun näet sen toimivan livenä. @rowancheung X: ssä (Twitter) julkaisi videon näyttelemällä Kaksoset toiminnassa, ja tulokset ovat aivan huikeita.

🚨 RAKKAUS: Google DeepMind paljasti juuri Gemini-ChatGPT: n suurimman kilpailijan. Gemini on ENSIMMÄINEN multimodaalinen tekoäly, joka on ylittänyt ihmisen asiantuntijat MMLU: ssa yli 90 prosentilla. pic.twitter.com/A7It1hPKGQ6. joulukuuta 2023

Katso lisää

Miten Google Gemini toimii?

Google mainitsee Geminiä planeetan parhaana tekoälymallina julkaisemiensa vertailuarvojen kautta. Jos nämä vertailuarvot kestävät kolmannen osapuolen testauksen, Gemini on markkinoiden paras koira ainakin OpenAI: n julkaisuun asti. ChatGPT-5. Suuri sääntö talouden nykyisessä rakenteessa on, että kun yritykset kilpailevat saadakseen parhaan tuotteen, kuluttajat yleensä voittaa.

Geminin pitäisi kannustaa OpenAI: ta jatkamaan innovaatioiden edistämistä, mutta on selvää, että holtittomasta tutkimuksesta ilman asianmukaisia ​​turvallisuusnäkökohtia on ollut paljon huolta, jopa Toimitusjohtajat, kuten Satya Nadella, vertaavat tekoälyä atomienergiaan.

Gemini Ultra on ensimmäinen malli, joka päihittää ihmisen asiantuntijat MMLU: ssa (massive multitask language ymmärrys), joka käyttää 57 oppiaineen yhdistelmä, kuten matematiikka, fysiikka, historia, laki, lääketiede ja etiikka, joilla testataan sekä maailmantietoa että ongelmanratkaisua kyvyt.

Google

Google Gemini menestyi paremmin kuin ChatGPT-4V useimmissa Googlen osoittamissa vertailuissa. Joskus jopa yli 4 prosenttiyksikköä. Vertailuarvo, jolla oli mielenkiintoisin nimi joukosta, HellaSwag, oli se, jonka Gemini menestyi huonommin kuin ChatGPT-4V. Katso täydellinen luettelo vertailuarvoista.

Vieritä vaakasuunnassa pyyhkäisemällä
Kyky Vertailuarvo Kuvaus Gemini Ultra GPT-4V
Kenraali MMLU Kysymysten esitys 57 aiheesta (sis. STEM, humanistiset tieteet ja muut) 90,0 % CoT@32* 86,4 % 5-shot* (raportoitu)
Päättely Big-Bench Hard Monipuolinen joukko haastavia tehtäviä, jotka vaativat monivaiheista päättelyä 83,6 % 3 laukausta 83,1 % 3-shot (API),
Rivi 2 - Solu 0 PUDOTA Luetun ymmärtäminen (F1-pisteet) 82.4 Muuttuva laukaus 80,9 3 laukaus (raportoitu)
Rivi 3 - Solu 0 HellaSwag Tervettä järkeä jokapäiväisiin tehtäviin 87,8 % 10 laukausta* 95,3 % 10 laukausta* (raportoitu)
Matematiikka GSM8K Aritmeettiset peruskäsittelyt (sis. Luokkakoulun matematiikkatehtävät) 94,4 % maj1@32 92,0 % 5-shot CoT (raportoitu)
Rivi 5 - Solu 0 MATEMATIIKKA Haastavat matematiikan tehtävät (sis. algebra, geometria, esilaskenta ja muut) 53,2 % 4 laukausta 52,9 % 4-shot (API)
Koodi HumanEval Python-koodin luominen 74,4 % nollasta (IT)* 67,0 % 0-laukaus* (raportoitu)
Rivi 7 - Solu 0 Natural2Code Python-koodin luominen. Uusi, HumanEvalin kaltainen tietojoukko, ei vuotanut verkkoon 74,9 % 0-laukaus 73,9 % 0-shot (API)
Rivi 8 - Solu 0 Rivi 8 - Solu 1 Rivi 8 - Solu 2 Rivi 8 - Solu 3 Rivi 8 - Solu 4

Vaikka nämä pisteet ovat vaikuttavia, ne eivät todennäköisesti tarkoita tonnia keskivertokuluttajalle. Googlen työntäminen Gemini Nanon Pixel 8 Pron päälle on minusta jännittävämpää, koska se on malli laitteella suoritettaville tehtäville. Monet valmistajat ovat alkaneet lisää laitteen tekoälyominaisuuksia, kuten NVIDIAn TensorRT-LLM valmistamiinsa laitteisiin. Minulle tämä on jännittävämpi näkymä tekoälyn tulevaisuudelle, jossa voimme olla todellisia henkilökohtaisia ​​avustajia sisäänrakennettuina puhelimiimme ja mukauttaa tekoälymallimme toimimaan parhaiten yksilöllisten tarpeidemme mukaan.

Yksi parhaista ja todennäköisesti mahdollisista tulevaisuuden sovelluksista näille LLM-AI: ille on jotain, josta olemme kaikki haaveilleet Star Trekistä yli 80 vuotta sitten. Universaali kielenkääntäjä. ChatGPT voi jo toimia kääntäjänä, mutta käännösten luominen kestää melko kauan. Niitä on nytkin AI-malleja, jotka voivat kääntää ääninäyttelijän toiselle kielelle pitäen alkuperäisen näyttelijän äänen ennallaan. Olen suuri animen sekä japanilaisten ja korealaisten draamien fani, rakastan maailmaa, jossa voin Paina televisioni painiketta ja kuule alkuperäisen näyttelijän äänen, mutta kuule se vain englanniksi reaaliaika. Kun nämä megayritykset kilpailevat toistensa päihittämisestä tekoälyn kehityksessä, tämä todellisuus lähestyy ja lähentyy.