Google Gemini стремится поместить ChatGPT в зеркало заднего вида

December 07, 2023
ВЦентральные окна

Что тебе нужно знать

Гонка ИИ накаляется, поскольку Google выпустила новую модель ИИ (например, GPT-4 против GPT-3) для поддержки своей экосистемы ИИ.
Тесты Google показывают, что Gemini превосходит GPT-4V по нескольким показателям производительности.
Gemini будет доступен в трех форматах: Ultra, Pro и Nano.
Pixel 8 Pro станет первым Pixel, в котором реализована технология Gemini через Gemini Nano.
Gemini Pro будет доступен через Gemini API в Google AI Studio 1 декабря. 13-е.

С недавним переворот в OpenAI с увольнением, а затем повторным приемом на работу Сэма Альтмана, Google, должно быть, почувствовал запах крови в воде, потому что всего несколько недель спустя Google анонсировал новую модель искусственного интеллекта, которая кажется более мощной, чем GPT-4V.

Google анонсирован Google Gemini поскольку будущее искусственного интеллекта для Google, начиная с сегодняшнего дня, будет основой Bard, и вскоре он появится во всех продуктах Google с искусственным интеллектом. Благодаря трем различным размерам модели: Ultra, Pro и Nano, Gemini 1.0 создан для повсеместного использования, как и остальная часть Google.

Что такое Google Gemini?

Google называет Gemini «самой функциональной и универсальной моделью, которую мы когда-либо создавали». Это серверная модель это послужит основой для линейки продуктов искусственного интеллекта Google, хотя решение выпустить модель с тремя размеры.

Близнецы Ультра — Самая крупная и эффективная модель Google для решения очень сложных задач.
Близнецы Про — Лучшая модель Google для масштабирования под широкий круг задач.
Близнецы Нано — Самая эффективная модель Google для задач на устройстве.

Некоторые показатели производительности, рекламируемые Google для Gemini, весьма впечатляют, но если я чему-то научился в области технологий, не доверяйте тестам производителей. При этом трудно усомниться в эффективности Gemini, видя, как она работает вживую. @rowancheung в X(Твиттере) опубликовал видео показывая Близнецов в действии, и результаты просто замечательные.

🚨 СРОЧНО: Google DeepMind только что выявил Gemini — крупнейшего конкурента ChatGPT. Gemini — ПЕРВЫЙ мультимодальный ИИ, превзошедший экспертов-людей по MMLU, набрав более 90%. pic.twitter.com/A7It1hPKGQ6 декабря 2023 г.

Узнать больше

Как работает Google Gemini?

Google рекламирует Gemini как лучшую модель искусственного интеллекта на планете посредством опубликованных тестов. Если эти тесты выдержат стороннее тестирование, Gemini станет лидером на рынке, по крайней мере, до выпуска OpenAI. ЧатGPT-5. Главное правило экономики в ее нынешнем виде заключается в том, что, когда компании конкурируют за лучший продукт, обычно побеждают потребители.

Gemini следует подтолкнуть OpenAI к дальнейшему продвижению инноваций, но, очевидно, было много опасений по поводу безрассудных исследований без должного учета безопасности, даже со стороны Такие руководители, как Сатья Наделла, сравнивают ИИ с атомной энергией.

Gemini Ultra — первая модель, превзошедшая экспертов-людей по MMLU (многозадачному пониманию языка), в котором используется сочетание 57 предметов, таких как математика, физика, история, право, медицина и этика, для проверки как мировых знаний, так и решения проблем. способности.

Google

Google Gemini превзошел ChatGPT-4V в большинстве тестов, показанных Google. Иногда более чем на 4% пунктов. Тест с самым интересным названием из всех, HellaSwag, показал результаты Gemini хуже, чем ChatGPT-4V. Взгляните на полный список тестов.

Проведите пальцем по экрану для горизонтальной прокрутки

Возможность	Контрольный показатель	Описание	Близнецы Ультра	ГПТ-4В
Общий	ММЛУ	Представление вопросов по 57 предметам (в т.ч. STEM, гуманитарные науки и другие)	90,0% ЦТ@32*	86,4% 5-зарядные* (по данным)
Рассуждение	Биг-Бенч Хард	Разнообразный набор сложных задач, требующих многоэтапного рассуждения.	83,6% 3-х выстрел	83,1% 3-шот (API),
Строка 2 — ячейка 0	УРОНИТЬ	Понимание прочитанного (оценка F1)	82.4 Переменные удары	80,9 трехзарядный (сообщается)
Строка 3 – ячейка 0	HellaSwag	Здравый смысл для решения повседневных задач	87,8% 10 выстрелов*	95,3% 10 выстрелов* (по данным)
Математика	GSM8K	Основные арифметические манипуляции (в т.ч. Задачи по математике в начальной школе)	94,4% май1@32	92,0% ЦТ с 5 выстрелами (сообщается)
Строка 5 — ячейка 0	МАТЕМАТИКА	Сложные математические задачи (вкл. алгебра, геометрия, предварительное исчисление и другие)	53,2% 4 выстрела	52,9% 4-кратный (API)
Код	HumanEval	Генерация кода Python	74,4% 0-бросков (IT)*	67,0% 0 выстрелов* (по данным)
Строка 7 — ячейка 0	Natural2Code	Генерация кода Python. Новый доступный набор данных, похожий на HumanEval, в сеть не просочился.	74,9% 0 выстрелов	73,9% 0 выстрелов (API)
Строка 8 — ячейка 0	Строка 8 – Ячейка 1.	Строка 8 – Ячейка 2.	Строка 8 – Ячейка 3.	Строка 8 – Ячейка 4.

Хотя эти оценки впечатляют, они, вероятно, не имеют большого значения для среднего потребителя. Google внедряет Gemini Nano в Pixel 8 Pro для меня более интересным, поскольку это модель для задач на устройстве. Многие производители начинают добавить возможности искусственного интеллекта на устройстве, такие как NVIDIA TensorRT-LLM к устройствам, которые они производят. Для меня это более захватывающая перспектива будущего искусственного интеллекта, когда мы сможем иметь настоящих личных помощников, встроенных в наши телефоны, и настраивать нашу модель искусственного интеллекта так, чтобы она лучше всего работала в соответствии с нашими индивидуальными потребностями.

Одно из лучших и, вероятно, возможных будущих приложений для этих искусственных интеллектов LLM — это то, о чем мы все мечтали со времен «Звездного пути» более 80 лет назад. Универсальный языковой переводчик. ChatGPT уже может выступать в качестве переводчика, но обработка переводов занимает довольно много времени. Сейчас есть Модели искусственного интеллекта, которые могут переводить озвучку на другой язык, сохраняя оригинальный голос актера нетронутым.. Я большой поклонник аниме, а также японских и корейских дорам, мне бы хотелось, чтобы мир, в котором я мог нажмите кнопку на моем телевизоре и услышите оригинальный голос актеров, но просто слушайте его на английском языке в в реальном времени. Поскольку эти мегакорпорации конкурируют за то, чтобы превзойти друг друга в развитии ИИ, эта реальность приближается все ближе и ближе.