Google Gemini se snaží umístit ChatGPT do zpětného zrcátka

December 07, 2023
VCentrální Okna

click fraud protection

Co potřebuješ vědět

Závod v oblasti umělé inteligence se rozhořel, protože společnost Google vydala nový model umělé inteligence (například GPT-4 vs GPT-3), který pohání jejich ekosystém umělé inteligence.
Srovnávací testy Google ukazují, že Gemini předčí GPT-4V v několika výkonnostních metrikách.
Gemini budou k dispozici ve 3 formátech: Ultra, Pro a Nano.
Pixel 8 Pro bude prvním Pixelem, který implementuje Gemini prostřednictvím Gemini Nano.
Gemini Pro bude k dispozici prostřednictvím Gemini API v Google AI Studio v prosinci. 13.

S nedávným pozdvižení v OpenAI se střelbou a poté znovunajmutí Sama Altmana, Google musel cítit krev ve vodě, protože jen o několik týdnů později Google oznámil nový model AI, který se zdá být výkonnější než GPT-4V.

Google oznámil Google Gemini protože budoucnost AI pro Google a počínaje dneškem bude pohánět Barda a brzy se dostane do všech produktů AI společnosti Google. Se 3 různými velikostmi modelu: Ultra, Pro a Nano je Gemini 1.0 postaven tak, aby byl všudypřítomný stejně jako zbytek Googlu.

Co je Google Gemini?

Google nazývá Gemini „nejschopnějším a nejobecnějším modelem, jaký jsme kdy postavili“. Je to backendový model to bude pohánět hromadu produktů AI společnosti Google, ačkoli rozhodnutí vydat model se třemi velikosti.

Blíženci Ultra — Největší a nejschopnější model společnosti Google pro velmi složité úkoly.
Gemini Pro — Nejlepší model Google pro škálování napříč širokou škálou úkolů.
Blíženci Nano — Nejúčinnější model společnosti Google pro úkoly na zařízení.

Některá výkonnostní čísla nabízená Googlem pro Gemini jsou docela působivá, ale pokud jsem se naučil jednu věc v technice, nevěřte měřítkům výrobce. Jak již bylo řečeno, je obtížné zpochybnit účinnost Gemini, když ji uvidíte naživo. @rowancheung na X (Twitter) zveřejnil(a) video ukazuje Blížence v akci a výsledky jsou pozoruhodné.

🚨 BREAKING: Google DeepMind právě odhalil Gemini-ChatGPT největšího konkurenta. Gemini je PRVNÍ multimodální AI, která překonala lidské experty na MMLU a dosáhla více než 90 %. pic.twitter.com/A7It1hPKGQ6. prosince 2023

Vidět víc

Jak si Google Gemini vede?

Google propaguje Gemini jako nejlepší model umělé inteligence na planetě prostřednictvím benchmarků, které zveřejnil. Pokud tyto benchmarky obstojí v testování třetí stranou, bude Gemini nejlepším psem na trhu, alespoň dokud nevyjde OpenAI ChatGPT-5. Velkým pravidlem ekonomiky, jak je v současné době strukturována, je, že když společnosti soutěží o nejlepší produkt, spotřebitelé obvykle vyhrávají.

Blíženci by měli tlačit na OpenAI, aby pokračovala v prosazování inovací, ale zjevně se objevilo mnoho obav z bezohledného výzkumu bez náležitých ohledů na bezpečnost, a to i ze strany Generální ředitelé jako Satya Nadella srovnávají AI s atomovou energií.

Gemini Ultra je prvním modelem, který překonává lidské odborníky na MMLU (masivní multitaskové porozumění jazyku), který využívá kombinace 57 předmětů, jako je matematika, fyzika, historie, právo, medicína a etika pro testování světových znalostí a řešení problémů schopnosti.

Google

Google Gemini překonal ChatGPT-4V ve většině benchmarků, které Google ukázal. Někdy o více než 4 % bodů. Benchmark s nejzajímavějším jménem ze všech, HellaSwag, byl ten, který Gemini ve srovnání s ChatGPT-4V nedosáhl. Podívejte se na úplný seznam benchmarků.

Přejetím prstem posouváte vodorovně

Schopnost	Benchmark	Popis	Blíženci Ultra	GPT-4V
Všeobecné	MMLU	Zastoupení otázek v 57 předmětech (vč. STEM, humanitní vědy a další)	90,0 % CoT@32*	86,4 % 5 ran* (uvedeno)
Uvažování	Big-Bench Hard	Různorodá sada náročných úkolů vyžadujících vícekrokové uvažování	83,6 % 3 výstřely	83,1 % 3 snímky (API),
Řádek 2 – buňka 0	POKLES	Čtení s porozuměním (F1 skóre)	82,4 Variabilní záběry	80,9 3 ran (uvedeno)
Řádek 3 – buňka 0	HellaSwag	Zdravý rozum pro každodenní úkoly	87,8 % 10 ran*	95,3 % 10 ran* (uvedeno)
Matematika	GSM 8K	Základní aritmetické manipulace (vč. Matematické úlohy na základní škole)	94,4 % maj1@32	92,0 % 5-shot CoT (uvedeno)
Řádek 5 – buňka 0	MATEMATIKA	Náročné matematické úlohy (vč. algebra, geometrie, předkalkulace a další)	53,2 % 4 ran	52,9 % 4 snímky (API)
Kód	HumanEval	Generování kódu v Pythonu	74,4 % 0 výstřelů (IT)*	67,0 % 0-shot* (uvedeno)
Řádek 7 – buňka 0	Natural2Code	Generování kódu Python. Nová datová sada podobná HumanEval, která neunikla na web	74,9 % 0 střel	73,9 % 0 snímků (API)
Řádek 8 – buňka 0	Řádek 8 – Buňka 1	Řádek 8 – Buňka 2	Řádek 8 – Buňka 3	Řádek 8 – Buňka 4

I když jsou tato skóre působivá, pro běžného spotřebitele pravděpodobně neznamenají tuny. Posouvání Gemini Nano od Googlu na Pixel 8 Pro je pro mě vzrušující, protože je to model pro úkoly na zařízení. Hodně výrobců s tím začíná přidat funkce umělé inteligence na zařízení, jako je TensorRT-LLM NVIDIA na zařízení, která vyrábějí. Pro mě je to vzrušující vyhlídka do budoucnosti umělé inteligence, kde můžeme mít skutečné osobní asistenty zabudované do našich telefonů a přizpůsobit náš model umělé inteligence tak, aby co nejlépe vyhovoval našim individuálním potřebám.

Jedna z nejlepších a pravděpodobně možných budoucích aplikací pro tyto LLM AI je něco, o čem jsme všichni snili od Star Treku před 80 a více lety. Univerzální jazykový překladač. ChatGPT již může fungovat jako překladatel, ale vygenerování překladů trvá poměrně dlouho. Nyní existují Modely umělé inteligence, které dokážou přeložit hlasové hraní do jiného jazyka a zachovat hlas původního herce nedotčený. Jsem velkým fanouškem anime, stejně jako japonských a korejských dramat, rád bych svět, kde mohu stiskněte tlačítko na mé televizi a uslyšíte hlas původních herců, ale pouze v angličtině reálný čas. Jak tyto mega korporace soutěží o to, aby se navzájem předčily v pokroku AI, tato realita se blíží čím dál tím víc.