Google Gemini sa snaží umiestniť ChatGPT do spätného zrkadla
Čo potrebuješ vedieť
- Preteky v oblasti AI sa zohrievajú, pretože spoločnosť Google vydala nový model AI (napríklad GPT-4 vs GPT-3), ktorý poháňa ich ekosystém AI.
- Benchmarky Google ukazujú, že Gemini prekonáva GPT-4V v niekoľkých výkonnostných metrikách.
- Gemini budú k dispozícii v 3 formátoch: Ultra, Pro a Nano.
- Pixel 8 Pro bude prvým Pixelom, ktorý implementuje Gemini cez Gemini Nano.
- Gemini Pro bude k dispozícii cez Gemini API v Google AI Studio v decembri. 13.
S nedávnym prevrat v OpenAI s prepustením a potom znovunajatím Sama AltmanaGoogle musel vo vode cítiť krv, pretože len o pár týždňov neskôr Google oznámil nový model AI, ktorý sa zdá byť výkonnejší ako GPT-4V.
Google oznámil Google Gemini keďže budúcnosť AI pre Google a počnúc dneškom bude poháňať Bard a čoskoro sa dostane do všetkých produktov AI od Google. Vďaka 3 rôznym veľkostiam modelu: Ultra, Pro a Nano je Gemini 1.0 postavený tak, aby bol všadeprítomný rovnako ako zvyšok Googlu.
Čo je Google Gemini?
Google nazýva Gemini „najschopnejší a najvšeobecnejší model, aký sme kedy vytvorili“. Je to backendový model to bude poháňať hromadu produktov AI od Googlu, hoci rozhodnutie vydať model s tromi veľkosti.
- Gemini Ultra — Najväčší a najschopnejší model spoločnosti Google pre veľmi zložité úlohy.
- Gemini Pro — Najlepší model spoločnosti Google na škálovanie v rámci širokej škály úloh.
- Blíženci Nano — Najúčinnejší model spoločnosti Google pre úlohy na zariadení.
Niektoré z výkonových čísel, ktoré ponúka Google pre Gemini, sú dosť pôsobivé, ale ak som sa naučil jednu vec v technike, neverím štandardom výrobcu. Ako už bolo povedané, je ťažké spochybniť účinnosť Gemini, keď ho uvidíte naživo. @rowancheung na X (Twitter) uverejnil video ukazuje Blížencov v akcii a výsledky sú pozoruhodné.
🚨 BREAKING: Google DeepMind práve odhalil Gemini – najväčšieho konkurenta ChatGPT. Gemini je PRVÁ multimodálna umelá inteligencia, ktorá prekonala ľudských expertov na MMLU a dosiahla viac ako 90 %. pic.twitter.com/A7It1hPKGQ6. decembra 2023
Pozrieť viac
Ako funguje Google Gemini?
Google propaguje Gemini ako najlepší model AI na planéte prostredníctvom benchmarkov, ktoré zverejnil. Ak tieto benchmarky vydržia testovanie treťou stranou, Gemini bude najlepším psom na trhu, aspoň do vydania OpenAI ChatGPT-5. Veľkým pravidlom súčasnej ekonomiky je, že keď spoločnosti súťažia o najlepší produkt, spotrebitelia zvyčajne vyhrávajú.
Blíženci by mali presadzovať OpenAI, aby pokračovalo v presadzovaní inovácií, ale je zrejmé, že existuje veľa obáv z bezohľadného výskumu bez náležitých úvah o bezpečnosti, dokonca aj od Generálni riaditelia ako Satya Nadella porovnávajú AI s atómovou energiou.
Gemini Ultra je prvým modelom, ktorý prekonal ľudských expertov na MMLU (masívne multitaskové porozumenie jazyka), ktorý využíva kombinácia 57 predmetov ako matematika, fyzika, história, právo, medicína a etika na testovanie svetových vedomostí a riešenie problémov schopnosti.
Google Gemini prekonal ChatGPT-4V vo väčšine benchmarkov, ktoré ukázal Google. Niekedy o viac ako 4 % bodov. Benchmark s najzaujímavejším menom zo všetkých, HellaSwag, bol ten, ktorý Gemini nedosahoval v porovnaní s ChatGPT-4V. Pozrite si úplný zoznam benchmarkov.
Schopnosť | Benchmark | Popis | Gemini Ultra | GPT-4V |
---|---|---|---|---|
generál | MMLU | Zastúpenie otázok v 57 predmetoch (vr. STEM, humanitné vedy a iné) | 90,0 % CoT@32* | 86,4 % 5-krát* (uvedené) |
Zdôvodnenie | Big-Bench Hard | Rôznorodý súbor náročných úloh vyžadujúcich viackrokové uvažovanie | 83,6 % 3-ran | 83,1 % 3-shot (API), |
Riadok 2 – bunka 0 | POKLES | Čítanie s porozumením (skóre F1) | 82,4 Variabilné strely | 80,9 3 rany (nahlásené) |
Riadok 3 – bunka 0 | HellaSwag | Zdravý rozum pri každodenných úlohách | 87,8 % 10 výstrelov* | 95,3 % 10 záberov* (hlásené) |
Matematika | GSM8K | Základné aritmetické manipulácie (vrátane Matematické úlohy na základnej škole) | 94,4 % maj1@32 | 92,0 % 5-krát CoT (nahlásené) |
Riadok 5 – bunka 0 | MATEMATIKA | Náročné matematické úlohy (vr. algebra, geometria, predkalkulácia a iné) | 53,2 % 4-ran | 52,9 % 4-krát (API) |
kód | HumanEval | Generovanie kódu Python | 74,4 % nula (IT)* | 67,0 % 0-shot* (nahlásené) |
Riadok 7 – bunka 0 | Natural2Code | Generovanie kódu Python. Nová množina údajov podobná HumanEval, ktorá neunikla na web | 74,9 % 0-strel | 73,9 % 0 snímok (API) |
Riadok 8 – bunka 0 | Riadok 8 – bunka 1 | 8. riadok – bunka 2 | 8. riadok – bunka 3 | 8. riadok – bunka 4 |
Aj keď sú tieto skóre pôsobivé, pre priemerného spotrebiteľa pravdepodobne neznamenajú veľa. Presadzovanie Gemini Nano od Googlu na Pixel 8 Pro je pre mňa vzrušujúcejšie, pretože je to model pre úlohy na zariadení. Veľa výrobcov s tým začína pridajte funkcie AI na zariadení, ako je TensorRT-LLM od NVIDIA k zariadeniam, ktoré vyrábajú. Pre mňa je to vzrušujúcejšia vyhliadka do budúcnosti AI, kde môžeme mať skutočných osobných asistentov zabudovaných do našich telefónov a prispôsobiť náš model AI tak, aby čo najlepšie vyhovoval našim individuálnym potrebám.
Jedna z najlepších a pravdepodobne možných budúcich aplikácií pre tieto LLM AI je niečo, o čom sme všetci snívali od Star Treku pred 80 a viac rokmi. Univerzálny jazykový prekladač. ChatGPT už môže fungovať ako prekladateľ, ale na generovanie prekladov je dosť dlhý čas spracovania. Teraz existujú Modely AI, ktoré dokážu preložiť hlasové prejavy do iného jazyka, pričom zachovajú hlas pôvodného herca nedotknutý. Som veľkým fanúšikom anime, ako aj japonských a kórejských drám, rád by som mal svet, kde môžem stlačte tlačidlo na mojom televízore a vypočujte si hlas pôvodných hercov, ale počúvajte ho len v angličtine reálny čas. Keďže tieto mega korporácie súťažia, aby sa navzájom prekonali v rozvoji AI, táto realita sa približuje čoraz bližšie.