Google Gemini se snaží umístit ChatGPT do zpětného zrcátka
Co potřebuješ vědět
- Závod v oblasti umělé inteligence se rozhořel, protože společnost Google vydala nový model umělé inteligence (například GPT-4 vs GPT-3), který pohání jejich ekosystém umělé inteligence.
- Srovnávací testy Google ukazují, že Gemini předčí GPT-4V v několika výkonnostních metrikách.
- Gemini budou k dispozici ve 3 formátech: Ultra, Pro a Nano.
- Pixel 8 Pro bude prvním Pixelem, který implementuje Gemini prostřednictvím Gemini Nano.
- Gemini Pro bude k dispozici prostřednictvím Gemini API v Google AI Studio v prosinci. 13.
S nedávným pozdvižení v OpenAI se střelbou a poté znovunajmutí Sama Altmana, Google musel cítit krev ve vodě, protože jen o několik týdnů později Google oznámil nový model AI, který se zdá být výkonnější než GPT-4V.
Google oznámil Google Gemini protože budoucnost AI pro Google a počínaje dneškem bude pohánět Barda a brzy se dostane do všech produktů AI společnosti Google. Se 3 různými velikostmi modelu: Ultra, Pro a Nano je Gemini 1.0 postaven tak, aby byl všudypřítomný stejně jako zbytek Googlu.
Co je Google Gemini?
Google nazývá Gemini „nejschopnějším a nejobecnějším modelem, jaký jsme kdy postavili“. Je to backendový model to bude pohánět hromadu produktů AI společnosti Google, ačkoli rozhodnutí vydat model se třemi velikosti.
- Blíženci Ultra — Největší a nejschopnější model společnosti Google pro velmi složité úkoly.
- Gemini Pro — Nejlepší model Google pro škálování napříč širokou škálou úkolů.
- Blíženci Nano — Nejúčinnější model společnosti Google pro úkoly na zařízení.
Některá výkonnostní čísla nabízená Googlem pro Gemini jsou docela působivá, ale pokud jsem se naučil jednu věc v technice, nevěřte měřítkům výrobce. Jak již bylo řečeno, je obtížné zpochybnit účinnost Gemini, když ji uvidíte naživo. @rowancheung na X (Twitter) zveřejnil(a) video ukazuje Blížence v akci a výsledky jsou pozoruhodné.
🚨 BREAKING: Google DeepMind právě odhalil Gemini-ChatGPT největšího konkurenta. Gemini je PRVNÍ multimodální AI, která překonala lidské experty na MMLU a dosáhla více než 90 %. pic.twitter.com/A7It1hPKGQ6. prosince 2023
Vidět víc
Jak si Google Gemini vede?
Google propaguje Gemini jako nejlepší model umělé inteligence na planetě prostřednictvím benchmarků, které zveřejnil. Pokud tyto benchmarky obstojí v testování třetí stranou, bude Gemini nejlepším psem na trhu, alespoň dokud nevyjde OpenAI ChatGPT-5. Velkým pravidlem ekonomiky, jak je v současné době strukturována, je, že když společnosti soutěží o nejlepší produkt, spotřebitelé obvykle vyhrávají.
Blíženci by měli tlačit na OpenAI, aby pokračovala v prosazování inovací, ale zjevně se objevilo mnoho obav z bezohledného výzkumu bez náležitých ohledů na bezpečnost, a to i ze strany Generální ředitelé jako Satya Nadella srovnávají AI s atomovou energií.
Google Gemini překonal ChatGPT-4V ve většině benchmarků, které Google ukázal. Někdy o více než 4 % bodů. Benchmark s nejzajímavějším jménem ze všech, HellaSwag, byl ten, který Gemini ve srovnání s ChatGPT-4V nedosáhl. Podívejte se na úplný seznam benchmarků.
Schopnost | Benchmark | Popis | Blíženci Ultra | GPT-4V |
---|---|---|---|---|
Všeobecné | MMLU | Zastoupení otázek v 57 předmětech (vč. STEM, humanitní vědy a další) | 90,0 % CoT@32* | 86,4 % 5 ran* (uvedeno) |
Uvažování | Big-Bench Hard | Různorodá sada náročných úkolů vyžadujících vícekrokové uvažování | 83,6 % 3 výstřely | 83,1 % 3 snímky (API), |
Řádek 2 – buňka 0 | POKLES | Čtení s porozuměním (F1 skóre) | 82,4 Variabilní záběry | 80,9 3 ran (uvedeno) |
Řádek 3 – buňka 0 | HellaSwag | Zdravý rozum pro každodenní úkoly | 87,8 % 10 ran* | 95,3 % 10 ran* (uvedeno) |
Matematika | GSM 8K | Základní aritmetické manipulace (vč. Matematické úlohy na základní škole) | 94,4 % maj1@32 | 92,0 % 5-shot CoT (uvedeno) |
Řádek 5 – buňka 0 | MATEMATIKA | Náročné matematické úlohy (vč. algebra, geometrie, předkalkulace a další) | 53,2 % 4 ran | 52,9 % 4 snímky (API) |
Kód | HumanEval | Generování kódu v Pythonu | 74,4 % 0 výstřelů (IT)* | 67,0 % 0-shot* (uvedeno) |
Řádek 7 – buňka 0 | Natural2Code | Generování kódu Python. Nová datová sada podobná HumanEval, která neunikla na web | 74,9 % 0 střel | 73,9 % 0 snímků (API) |
Řádek 8 – buňka 0 | Řádek 8 – Buňka 1 | Řádek 8 – Buňka 2 | Řádek 8 – Buňka 3 | Řádek 8 – Buňka 4 |
I když jsou tato skóre působivá, pro běžného spotřebitele pravděpodobně neznamenají tuny. Posouvání Gemini Nano od Googlu na Pixel 8 Pro je pro mě vzrušující, protože je to model pro úkoly na zařízení. Hodně výrobců s tím začíná přidat funkce umělé inteligence na zařízení, jako je TensorRT-LLM NVIDIA na zařízení, která vyrábějí. Pro mě je to vzrušující vyhlídka do budoucnosti umělé inteligence, kde můžeme mít skutečné osobní asistenty zabudované do našich telefonů a přizpůsobit náš model umělé inteligence tak, aby co nejlépe vyhovoval našim individuálním potřebám.
Jedna z nejlepších a pravděpodobně možných budoucích aplikací pro tyto LLM AI je něco, o čem jsme všichni snili od Star Treku před 80 a více lety. Univerzální jazykový překladač. ChatGPT již může fungovat jako překladatel, ale vygenerování překladů trvá poměrně dlouho. Nyní existují Modely umělé inteligence, které dokážou přeložit hlasové hraní do jiného jazyka a zachovat hlas původního herce nedotčený. Jsem velkým fanouškem anime, stejně jako japonských a korejských dramat, rád bych svět, kde mohu stiskněte tlačítko na mé televizi a uslyšíte hlas původních herců, ale pouze v angličtině reálný čas. Jak tyto mega korporace soutěží o to, aby se navzájem předčily v pokroku AI, tato realita se blíží čím dál tím víc.