A Google Gemini arra törekszik, hogy a ChatGPT-t a visszapillantó tükörbe helyezze
Amit tudnod kell
- A mesterséges intelligencia versenye felforrósodik, mivel a Google új mesterségesintelligencia-modellt adott ki (gondoljunk csak a GPT-4-re a GPT-3-ra), hogy az AI ökoszisztémáját megerősítse.
- A Google referenciaértékei azt mutatják, hogy a Gemini több teljesítménymutatóban is felülmúlja a GPT-4V-t.
- A Gemini 3 formátumban érkezik: Ultra, Pro és Nano.
- A Pixel 8 Pro lesz az első Pixel, amely megvalósítja a Geminit a Gemini Nanón keresztül.
- A Gemini Pro decemberben lesz elérhető a Gemini API-n keresztül a Google AI Studio-ban. 13.
A legutóbbival felfordulás az OpenAI-nál Sam Altman kirúgásával, majd újbóli felvételével, a Google bizonyára vérszagot érzett a vízben, mert alig néhány héttel később a Google bejelentette egy új AI-modellt, amely erősebbnek tűnik, mint a GPT-4V.
Google jelentette be a Google Gemini mint a Google számára készült mesterséges intelligencia jövője, mától kezdve a Bard hajtása lesz, és hamarosan elérhető lesz a Google összes mesterségesintelligencia-termékében. A modell három különböző méretével: Ultra, Pro és Nano, a Gemini 1.0 úgy készült, hogy a Google többi részéhez hasonlóan mindenütt jelen legyen.
Mi az a Google Gemini?
A Google a Geminit "a valaha épített legerősebb és legáltalánosabb modellnek" nevezi. Ez a háttérmodell amely a Google mesterséges intelligencia-termékeinek készletét fogja működtetni, bár az a döntés, hogy a modellt hárommal kiadják méretek.
- Gemini Ultra — A Google legnagyobb és legmegfelelőbb modellje rendkívül összetett feladatokhoz.
- Gemini Pro – A Google legjobb modellje a feladatok széles skáláján történő skálázáshoz.
- Gemini Nano — A Google leghatékonyabb modellje az eszközön végzett feladatokhoz.
A Google által a Gemini számára meghirdetett teljesítményszámok némelyike meglehetősen lenyűgöző, de ha tanultam valamit a technológiából, ne bízzon a gyártói referenciaértékekben. Ennek ellenére nehéz megkérdőjelezni a Gemini hatékonyságát, ha élőben látjuk, hogy működik. @rowancheung az X-en (Twitter) közzétett egy videót Az Ikrek akcióban mutatják be, és az eredmények egészen figyelemre méltóak.
🚨 TÖRÉS: A Google DeepMind felfedte a Gemini-ChatGPT legnagyobb versenytársát. A Gemini az ELSŐ multimodális mesterséges intelligencia, amely felülmúlta az emberi szakértőket az MMLU-ban, több mint 90%-os pontszámmal. pic.twitter.com/A7It1hPKGQ2023. december 6
Többet látni
Hogyan teljesít a Google Gemini?
A Google a Geminit a bolygó legjobb mesterségesintelligencia-modelljeként hirdeti az általa közzétett referenciaértékeken keresztül. Ha ezek a benchmarkok megfelelnek a harmadik fél által végzett teszteléseknek, a Gemini lesz a piac legjobb kutyája, legalábbis az OpenAI megjelenéséig ChatGPT-5. A gazdaság jelenlegi felépítésének nagy szabálya az, hogy amikor a vállalatok versenyeznek a legjobb termékért, általában a fogyasztók nyernek.
A Gemininek arra kellene ösztönöznie az OpenAI-t, hogy folytassa az innováció ösztönzését, de nyilvánvalóan sok aggodalomra ad okot a meggondolatlan kutatás, amely nem veszi figyelembe a megfelelő biztonsági szempontokat, még a Az olyan vezérigazgatók, mint Satya Nadella, a mesterséges intelligenciát az atomenergiával hasonlítják össze.
A Google Gemini felülmúlta a ChatGPT-4V-t a Google által mutatott legtöbb benchmark esetében. Néha több mint 4 százalékponttal. A legérdekesebb név, a HellaSwag etalon volt az, amelynél a Gemini alulteljesített a ChatGPT-4V-hez képest. Tekintse meg a benchmarkok teljes listáját.
Képesség | Viszonyítási alap | Leírás | Gemini Ultra | GPT-4V |
---|---|---|---|---|
Tábornok | MMLU | Kérdések megjelenítése 57 témakörben (beleértve STEM, bölcsészettudományok és mások) | 90,0% CoT@32* | 86,4% 5-lövés* (jelentették) |
Érvelés | Big-Bench Hard | Kihívást jelentő feladatok változatos halmaza, amely többlépcsős érvelést igényel | 83,6% 3-lövés | 83,1% 3-shot (API), |
2. sor – 0. cella | CSEPP | Olvasott szöveg értése (F1 pontszám) | 82.4 Változó lövések | 80,9 3-lövés (jelentették) |
3. sor – 0. cella | HellaSwag | Közönséges érvelés a mindennapi feladatokhoz | 87,8% 10-lövés* | 95,3% 10-lövés* (jelentették) |
Math | GSM8K | Alapvető aritmetikai manipulációk (pl. általános iskolai matematikai feladatok) | 94,4% maj1@32 | 92,0% 5-lövés CoT (jelentett) |
5. sor – 0. cella | MATH | Kihívást jelentő matematikai feladatok (pl. algebra, geometria, előszámítás és mások) | 53,2% 4-lövés | 52,9% 4-shot (API) |
Kód | HumanEval | Python kód generálása | 74,4% 0-lövés (IT)* | 67,0% 0-lövés* (jelentették) |
7. sor – 0. cella | Natural2Code | Python kód generálása. Az új, HumanEval-szerű adatkészletet nem szivárogtatta ki | 74,9% 0-lövés | 73,9% 0-shot (API) |
8. sor – 0. cella | 8. sor – 1. cella | 8. sor – 2. cella | 8. sor – 3. cella | 8. sor – 4. cella |
Bár ezek a pontszámok lenyűgözőek, valószínűleg nem jelentenek semmit az átlagos fogyasztó számára. A Google a Gemini Nanót a Pixel 8 Pro-ra tolva izgalmasabb számomra, mivel az eszközön végzett feladatok modellje. Sok gyártó kezdi az eszközön lévő mesterséges intelligencia képességek hozzáadása, például az NVIDIA TensorRT-LLM az általuk készített készülékekre. Számomra ez egy izgalmasabb perspektíva a mesterséges intelligencia jövője szempontjából, ahol valódi személyi asszisztenseket építhetünk telefonjainkba, és testreszabhatjuk mesterséges intelligencia modellünket, hogy a legjobban működjön az egyéni igényeinknek.
Ezeknek az LLM AI-knak az egyik legjobb és valószínűleg lehetséges jövőbeli alkalmazása az, amiről mindannyian álmodozunk a Star Trek 80 év feletti éve óta. Univerzális nyelvi fordító. A ChatGPT már képes fordítóként működni, de a fordítások előállítása meglehetősen hosszú feldolgozási időbe telik. Most is vannak AI modellek, amelyek képesek lefordítani a hangjátékot egy másik nyelvre, megőrizve az eredeti színész hangját. Nagy rajongója vagyok az animéknek, valamint a japán és koreai drámáknak, szeretnék egy világot, ahol megtehetem Nyomj meg egy gombot a TV-n, és hallhatod az eredeti színészek hangját, de csak angolul valós idő. Ahogy ezek a megavállalatok versenyeznek egymással, hogy felülmúlják egymást a mesterséges intelligencia fejlődésében, ez a valóság egyre közelebb kerül.