A Google Gemini arra törekszik, hogy a ChatGPT-t a visszapillantó tükörbe helyezze

December 07, 2023
Ban benAblakok Központi

Amit tudnod kell

A mesterséges intelligencia versenye felforrósodik, mivel a Google új mesterségesintelligencia-modellt adott ki (gondoljunk csak a GPT-4-re a GPT-3-ra), hogy az AI ökoszisztémáját megerősítse.
A Google referenciaértékei azt mutatják, hogy a Gemini több teljesítménymutatóban is felülmúlja a GPT-4V-t.
A Gemini 3 formátumban érkezik: Ultra, Pro és Nano.
A Pixel 8 Pro lesz az első Pixel, amely megvalósítja a Geminit a Gemini Nanón keresztül.
A Gemini Pro decemberben lesz elérhető a Gemini API-n keresztül a Google AI Studio-ban. 13.

A legutóbbival felfordulás az OpenAI-nál Sam Altman kirúgásával, majd újbóli felvételével, a Google bizonyára vérszagot érzett a vízben, mert alig néhány héttel később a Google bejelentette egy új AI-modellt, amely erősebbnek tűnik, mint a GPT-4V.

Google jelentette be a Google Gemini mint a Google számára készült mesterséges intelligencia jövője, mától kezdve a Bard hajtása lesz, és hamarosan elérhető lesz a Google összes mesterségesintelligencia-termékében. A modell három különböző méretével: Ultra, Pro és Nano, a Gemini 1.0 úgy készült, hogy a Google többi részéhez hasonlóan mindenütt jelen legyen.

Mi az a Google Gemini?

A Google a Geminit "a valaha épített legerősebb és legáltalánosabb modellnek" nevezi. Ez a háttérmodell amely a Google mesterséges intelligencia-termékeinek készletét fogja működtetni, bár az a döntés, hogy a modellt hárommal kiadják méretek.

Gemini Ultra — A Google legnagyobb és legmegfelelőbb modellje rendkívül összetett feladatokhoz.
Gemini Pro – A Google legjobb modellje a feladatok széles skáláján történő skálázáshoz.
Gemini Nano — A Google leghatékonyabb modellje az eszközön végzett feladatokhoz.

A Google által a Gemini számára meghirdetett teljesítményszámok némelyike meglehetősen lenyűgöző, de ha tanultam valamit a technológiából, ne bízzon a gyártói referenciaértékekben. Ennek ellenére nehéz megkérdőjelezni a Gemini hatékonyságát, ha élőben látjuk, hogy működik. @rowancheung az X-en (Twitter) közzétett egy videót Az Ikrek akcióban mutatják be, és az eredmények egészen figyelemre méltóak.

🚨 TÖRÉS: A Google DeepMind felfedte a Gemini-ChatGPT legnagyobb versenytársát. A Gemini az ELSŐ multimodális mesterséges intelligencia, amely felülmúlta az emberi szakértőket az MMLU-ban, több mint 90%-os pontszámmal. pic.twitter.com/A7It1hPKGQ2023. december 6

Többet látni

Hogyan teljesít a Google Gemini?

A Google a Geminit a bolygó legjobb mesterségesintelligencia-modelljeként hirdeti az általa közzétett referenciaértékeken keresztül. Ha ezek a benchmarkok megfelelnek a harmadik fél által végzett teszteléseknek, a Gemini lesz a piac legjobb kutyája, legalábbis az OpenAI megjelenéséig ChatGPT-5. A gazdaság jelenlegi felépítésének nagy szabálya az, hogy amikor a vállalatok versenyeznek a legjobb termékért, általában a fogyasztók nyernek.

A Gemininek arra kellene ösztönöznie az OpenAI-t, hogy folytassa az innováció ösztönzését, de nyilvánvalóan sok aggodalomra ad okot a meggondolatlan kutatás, amely nem veszi figyelembe a megfelelő biztonsági szempontokat, még a Az olyan vezérigazgatók, mint Satya Nadella, a mesterséges intelligenciát az atomenergiával hasonlítják össze.

A Gemini Ultra az első olyan modell, amely felülmúlja az emberi szakértőket az MMLU (massive multitask language megértése) terén, amely egy 57 tantárgy, például matematika, fizika, történelem, jog, orvostudomány és etika kombinációja a világismeret és a problémamegoldás tesztelésére képességeit.

Google

A Google Gemini felülmúlta a ChatGPT-4V-t a Google által mutatott legtöbb benchmark esetében. Néha több mint 4 százalékponttal. A legérdekesebb név, a HellaSwag etalon volt az, amelynél a Gemini alulteljesített a ChatGPT-4V-hez képest. Tekintse meg a benchmarkok teljes listáját.

Csúsztatással vízszintesen görgethet

Képesség	Viszonyítási alap	Leírás	Gemini Ultra	GPT-4V
Tábornok	MMLU	Kérdések megjelenítése 57 témakörben (beleértve STEM, bölcsészettudományok és mások)	90,0% CoT@32*	86,4% 5-lövés* (jelentették)
Érvelés	Big-Bench Hard	Kihívást jelentő feladatok változatos halmaza, amely többlépcsős érvelést igényel	83,6% 3-lövés	83,1% 3-shot (API),
2. sor – 0. cella	CSEPP	Olvasott szöveg értése (F1 pontszám)	82.4 Változó lövések	80,9 3-lövés (jelentették)
3. sor – 0. cella	HellaSwag	Közönséges érvelés a mindennapi feladatokhoz	87,8% 10-lövés*	95,3% 10-lövés* (jelentették)
Math	GSM8K	Alapvető aritmetikai manipulációk (pl. általános iskolai matematikai feladatok)	94,4% maj1@32	92,0% 5-lövés CoT (jelentett)
5. sor – 0. cella	MATH	Kihívást jelentő matematikai feladatok (pl. algebra, geometria, előszámítás és mások)	53,2% 4-lövés	52,9% 4-shot (API)
Kód	HumanEval	Python kód generálása	74,4% 0-lövés (IT)*	67,0% 0-lövés* (jelentették)
7. sor – 0. cella	Natural2Code	Python kód generálása. Az új, HumanEval-szerű adatkészletet nem szivárogtatta ki	74,9% 0-lövés	73,9% 0-shot (API)
8. sor – 0. cella	8. sor – 1. cella	8. sor – 2. cella	8. sor – 3. cella	8. sor – 4. cella

Bár ezek a pontszámok lenyűgözőek, valószínűleg nem jelentenek semmit az átlagos fogyasztó számára. A Google a Gemini Nanót a Pixel 8 Pro-ra tolva izgalmasabb számomra, mivel az eszközön végzett feladatok modellje. Sok gyártó kezdi az eszközön lévő mesterséges intelligencia képességek hozzáadása, például az NVIDIA TensorRT-LLM az általuk készített készülékekre. Számomra ez egy izgalmasabb perspektíva a mesterséges intelligencia jövője szempontjából, ahol valódi személyi asszisztenseket építhetünk telefonjainkba, és testreszabhatjuk mesterséges intelligencia modellünket, hogy a legjobban működjön az egyéni igényeinknek.

Ezeknek az LLM AI-knak az egyik legjobb és valószínűleg lehetséges jövőbeli alkalmazása az, amiről mindannyian álmodozunk a Star Trek 80 év feletti éve óta. Univerzális nyelvi fordító. A ChatGPT már képes fordítóként működni, de a fordítások előállítása meglehetősen hosszú feldolgozási időbe telik. Most is vannak AI modellek, amelyek képesek lefordítani a hangjátékot egy másik nyelvre, megőrizve az eredeti színész hangját. Nagy rajongója vagyok az animéknek, valamint a japán és koreai drámáknak, szeretnék egy világot, ahol megtehetem Nyomj meg egy gombot a TV-n, és hallhatod az eredeti színészek hangját, de csak angolul valós idő. Ahogy ezek a megavállalatok versenyeznek egymással, hogy felülmúlják egymást a mesterséges intelligencia fejlődésében, ez a valóság egyre közelebb kerül.