Google Gemini се стреми да постави ChatGPT в огледалото за обратно виждане

click fraud protection

Какво трябва да знаете

  • Състезанието с изкуствен интелект се нажежава, тъй като Google пусна нов модел на изкуствен интелект (помислете за GPT-4 срещу GPT-3), за да захранва тяхната екосистема с изкуствен интелект.
  • Бенчмарковете на Google показват, че Gemini превъзхожда GPT-4V в няколко показателя за ефективност.
  • Gemini ще се предлага в 3 формата: Ultra, Pro и Nano.
  • Pixel 8 Pro ще бъде първият Pixel, който внедрява Gemini чрез Gemini Nano.
  • Gemini Pro ще бъде достъпен чрез Gemini API в Google AI Studio на декември 13-ти.

С последните катаклизъм в OpenAI с уволнението и след това повторното наемане на Сам Алтман, Google трябва да е надушил кръв във водата, защото само няколко седмици по-късно Google обяви нов AI модел, който изглежда е по-мощен от GPT-4V.

Google обяви Google Gemini тъй като бъдещето на AI за Google и от днес ще захранва Bard и скоро ще се появи във всички продукти на AI на Google. С 3 различни размера на модела: Ultra, Pro и Nano, Gemini 1.0 е създаден да бъде повсеместен точно като останалата част от Google.

Какво е Google Gemini?

Google нарича Gemini „най-способният и общ модел, който някога сме създавали“. Това е бекенд моделът които ще захранват стека от продукти на AI на Google, въпреки че решението да се пусне моделът с три размери.

  • Близнаци Ултра — Най-големият и най-способен модел на Google за изключително сложни задачи.
  • Gemini Pro — Най-добрият модел на Google за мащабиране в широк набор от задачи.
  • Близнаци Нано — Най-ефективният модел на Google за задачи на устройството.

Някои от показателите за производителност, рекламирани от Google за Gemini, са доста впечатляващи, но ако съм научил нещо в технологиите, не се доверявайте на показателите на производителя. Като се има предвид това, трудно е да се постави под въпрос ефективността на Gemini, когато се види как работи на живо. @rowancheung в X(Twitter) публикува видео показвайки Gemini в действие и резултатите са нищо друго освен забележителни.

🚨 ИЗМЕНЕНИЕ: Google DeepMind току-що разкри най-големия конкурент на Gemini - ChatGPT. Gemini е ПЪРВИЯТ мултимодален AI, който надминава човешките експерти в MMLU, постигайки над 90%. pic.twitter.com/A7It1hPKGQ6 декември 2023 г

Виж повече

Как работи Google Gemini?

Google рекламира Gemini като най-добрия AI модел на планетата чрез бенчмарковете, които публикува. Ако тези бенчмаркове издържат на тестове от трета страна, Gemini ще бъде най-доброто куче на пазара, поне до пускането на OpenAI ЧатGPT-5. Голямото правило с икономиката, както е структурирана в момента, е, че докато компаниите се състезават да имат най-добрия продукт, потребителите обикновено печелят.

Gemini трябва да настоява OpenAI да продължи да насърчава иновациите, но очевидно има много опасения относно безразсъдните изследвания без подходящи съображения за безопасност, дори от Изпълнителни директори като Сатя Надела сравняват ИИ с атомната енергия.

Gemini Ultra е първият модел, който надминава човешките експерти по MMLU (разбиране на масов многозадачен език), който използва комбинация от 57 предмета като математика, физика, история, право, медицина и етика за тестване както на познанието за света, така и за решаване на проблеми способности.

Google

Google Gemini надмина ChatGPT-4V в повечето от бенчмарковете, показани от Google. Понякога с над 4% точки. Бенчмаркът с най-интересното име от групата, HellaSwag, беше този, който Gemini се представи по-слабо в сравнение с ChatGPT-4V. Разгледайте пълния списък с бенчмаркове.

Плъзнете за хоризонтално превъртане
Възможност Бенчмарк Описание Близнаци Ултра GPT-4V
Общ MMLU Представяне на въпроси по 57 предмета (вкл. STEM, хуманитарни науки и други) 90,0% CoT@32* 86,4% 5-shot* (отчетено)
Обосновавам се Big-Bench Hard Разнообразен набор от предизвикателни задачи, изискващи многоетапно разсъждение 83,6% 3 изстрела 83,1% 3 изстрела (API),
Ред 2 - клетка 0 ИЗПУСКАЙТЕ Четене с разбиране (резултат F1) 82.4 Променливи удари 80.9 3 изстрела (отчетено)
Ред 3 - клетка 0 HellaSwag Разумни разсъждения за ежедневни задачи 87,8% 10 изстрела* 95,3% 10 изстрела* (отчетено)
математика GSM8K Основни аритметични манипулации (вкл. Училищни задачи по математика) 94,4% 1@32 май 92,0% 5-shot CoT (отчетено)
Ред 5 - клетка 0 МАТЕМАТИКА Предизвикателни математически задачи (вкл. алгебра, геометрия, предварително смятане и други) 53,2% 4 изстрела 52,9% 4 изстрела (API)
Код HumanEval Генериране на Python код 74,4% 0-shot (IT)* 67,0% 0-изстрел* (отчетено)
Ред 7 - клетка 0 Natural2Code Генериране на Python код. Нов набор от данни, подобен на HumanEval, който не е изтекъл в мрежата 74,9% нулев удар 73,9% 0-изстрел (API)
Ред 8 - клетка 0 Ред 8 - Клетка 1 Ред 8 - Клетка 2 Ред 8 - Клетка 3 Ред 8 - клетка 4

Въпреки че тези резултати са впечатляващи, те вероятно не означават много за средния потребител. Google натиска Gemini Nano върху Pixel 8 Pro е по-вълнуващо за мен, тъй като това е модел за задачи на устройството. Много производители започват да добавете възможности за AI на устройството, като TensorRT-LLM на NVIDIA към устройствата, които правят. За мен това е по-вълнуваща перспектива за бъдещето на AI, където можем да имаме истински лични асистенти, вградени в нашите телефони и да персонализираме нашия AI модел, за да работи най-добре за нашите индивидуални нужди.

Едно от най-добрите и вероятно възможни бъдещи приложения за тези LLM AI е нещо, за което всички сме мечтали от Star Trek преди 80 години. Универсален езиков преводач. ChatGPT вече може да действа като преводач, но има доста дълго време за обработка за генериране на преводите. Сега има AI модели, които могат да превеждат гласовата игра на друг език, запазвайки оригиналния глас на актьора непокътнат. Аз съм голям фен на анимето, както и на японските и корейските драми, бих се радвал на свят, в който мога натиснете бутон на моя телевизор и ще чуете оригиналния глас на актьорите, но просто го чуйте на английски реално време. Докато тези мега корпорации се състезават да надминат една друга в напредъка на ИИ, тази реалност се приближава все повече и повече.