Google Gemini cenšas ievietot ChatGPT atpakaļskata spogulī

December 07, 2023
InLogi Centrālie

Kas jums jāzina

AI sacīkstes uzkarst, jo Google ir izlaidusi jaunu AI modeli (domājiet par GPT-4 pret GPT-3), lai nodrošinātu savu AI ekosistēmu.
Google etalonos ir redzams, ka Gemini vairākos veiktspējas rādītājos pārspēj GPT-4V.
Gemini būs 3 formātos: Ultra, Pro un Nano.
Pixel 8 Pro būs pirmais Pixel, kas ieviesīs Gemini, izmantojot Gemini Nano.
decembrī Gemini Pro būs pieejams, izmantojot Gemini API pakalpojumā Google AI Studio. 13.

Ar neseno satricinājums OpenAI ar Sema Altmena atlaišanu un pēc tam atkal pieņemšanu darbā, Google noteikti ir sajutusi asiņu smaku ūdenī, jo tikai dažas nedēļas vēlāk Google paziņoja par jaunu AI modeli, kas, šķiet, ir jaudīgāks par GPT-4V.

Google paziņoja Google Gemini kā Google AI nākotne, sākot ar šodienu, nodrošinās Bard, un drīzumā tas nonāks visos Google AI produktos. Izmantojot 3 dažādus modeļa izmērus: Ultra, Pro un Nano, Gemini 1.0 ir izveidots tā, lai tas būtu visuresošs tāpat kā pārējais Google.

Kas ir Google Gemini?

Google sauc Gemini par "visspējīgāko un vispārīgāko modeli, ko jebkad esam izveidojuši". Tas ir aizmugures modelis kas nodrošinās Google virkni AI produktu, lai gan lēmums izlaist modeli ar trim izmēriem.

Gemini Ultra — Google lielākais un spējīgākais modelis ļoti sarežģītiem uzdevumiem.
Gemini Pro — Google labākais modelis mērogošanai dažādos uzdevumu klāstā.
Dvīņi Nano — Google efektīvākais modelis uzdevumiem ierīcē.

Daži no Google piedāvātajiem veiktspējas rādītājiem Gemini ir diezgan iespaidīgi, taču, ja esmu iemācījies kaut ko tehnoloģiju jomā, neuzticieties ražotāju etaloniem. To sakot, ir grūti apšaubīt Dvīņu efektivitāti, redzot, kā tas darbojas tiešraidē. @rowancheung pakalpojumā X (Twitter) ievietoja video parādot Dvīņus darbībā, un rezultāti nav nekas cits kā ievērojams.

🚨 LAUKUMS: Google DeepMind tikko atklāja Gemini-ChatGPT lielāko konkurentu. Gemini ir PIRMAIS multimodālais AI, kas pārspēj cilvēku ekspertus MMLU, iegūstot vairāk nekā 90%. pic.twitter.com/A7It1hPKGQ2023. gada 6. decembris

Redzēt vairāk

Kā darbojas Google Gemini?

Google reklamē Gemini kā labāko AI modeli uz planētas, izmantojot savus publicētos etalonus. Ja šie etaloni atbilst trešās puses testēšanai, Gemini būs labākais suns tirgū vismaz līdz OpenAI izlaišanai. ChatGPT-5. Lielais noteikums ekonomikā, kāda tā pašlaik ir strukturēta, ir tāds, ka uzņēmumiem sacenšoties par labāko produktu, parasti uzvar patērētāji.

Dvīņiem vajadzētu mudināt OpenAI turpināt virzīt inovācijas, taču acīmredzami ir bijušas daudzas bažas par neapdomīgu pētniecību bez pienācīgiem drošības apsvērumiem, pat no plkst. Tādi vadītāji kā Satja Nadella salīdzina AI ar atomenerģiju.

Gemini Ultra ir pirmais modelis, kas pārspēj cilvēku ekspertus MMLU (masīvas daudzuzdevumu valodas izpratnes) jomā, kas izmanto 57 priekšmetu kombinācija, piemēram, matemātika, fizika, vēsture, tiesību zinātne, medicīna un ētika, lai pārbaudītu gan pasaules zināšanas, gan problēmu risināšanu spējas.

Google

Google Gemini pārspēja ChatGPT-4V lielākajā daļā Google rādīto etalonu. Dažreiz par vairāk nekā 4% punktiem. Etalona ar visinteresantāko nosaukumu HellaSwag bija tas, kas Gemini bija sliktāks salīdzinājumā ar ChatGPT-4V. Apskatiet pilnu etalonu sarakstu.

Velciet, lai ritinātu horizontāli

Spēja	Etalons	Apraksts	Gemini Ultra	GPT-4V
Ģenerālis	MMLU	Jautājumu attēlojums 57 priekšmetos (t.sk. STEM, humanitārās zinātnes un citas)	90,0% CoT@32*	86,4% 5-shot* (ziņots)
Spriešana	Big-Bench Hard	Daudzveidīgs sarežģītu uzdevumu kopums, kam nepieciešama daudzpakāpju spriešana	83,6% trīs sitienu	83,1% trīs kadru (API),
2. rinda — 0. šūna	NOLIETOT	Lasīšanas izpratne (F1 rezultāts)	82.4 Mainīgie metieni	80,9 3 šāvieni (ziņots)
3. rinda — 0. šūna	HellaSwag	Saprāta spriešana ikdienas uzdevumiem	87,8% 10 šāvienu*	95,3% 10 šāvienu* (ziņots)
Matemātika	GSM8K	Pamata aritmētiskās manipulācijas (t.sk. vidusskolas matemātikas uzdevumi)	94,4% maj1@32	92,0% 5-shot CoT (ziņots)
5. rinda — 0. šūna	MATH	Izaicinoši matemātikas uzdevumi (t.sk. algebra, ģeometrija, priekšaprēķins un citi)	53,2% 4 sitieni	52,9% četru kadru (API)
Kods	HumanEval	Python koda ģenerēšana	74,4% 0-shot (IT)*	67,0% 0-shot* (ziņots)
7. rinda — 0. šūna	Natural2Code	Python koda ģenerēšana. Jaunā datu kopa bija HumanEval līdzīga, nevis noplūda tīmeklī	74,9% 0-šāviens	73,9% 0-shot (API)
8. rinda — 0. šūna	8. rinda — 1. šūna	8. rinda — 2. šūna	8. rinda — 3. šūna	8. rinda — 4. šūna

Lai gan šie rādītāji ir iespaidīgi, tie, iespējams, nenozīmē tonnu vidusmēra patērētājam. Google uzspiežot Gemini Nano uz Pixel 8 Pro, man šķiet aizraujošāks, jo tas ir paraugs ierīcē veiktajiem uzdevumiem. Daudzi ražotāji sāk to darīt pievienojiet ierīces AI iespējas, piemēram, NVIDIA TensorRT-LLM to ražotajām ierīcēm. Man šī ir aizraujošāka AI nākotnes perspektīva, kur mēs varam iebūvēt īstus personīgos palīgus savos tālruņos un pielāgot mūsu AI modeli tā, lai tas vislabāk atbilstu mūsu individuālajām vajadzībām.

Viens no labākajiem un, iespējams, iespējamajiem turpmākajiem šo LLM AI lietojumiem ir kaut kas tāds, par ko mēs visi esam sapņojuši kopš Star Trek pirms 80 un vairāk gadiem. Universāls valodas tulks. ChatGPT jau var darboties kā tulkotājs, taču tulkojumu ģenerēšana prasa diezgan ilgu apstrādes laiku. Tagad tādas ir AI modeļi, kas var pārtulkot balss darbību citā valodā, saglabājot sākotnējā aktiera balsi neskartu. Esmu milzīgs anime, kā arī japāņu un korejiešu drāmu cienītājs, man patiktu pasaule, kurā es varu Nospiediet televizora pogu, lai dzirdētu oriģinālo aktieru balsi, bet tikai angļu valodā īsts laiks. Tā kā šīs mega korporācijas sacenšas, lai pārspētu viena otru AI attīstībā, šī realitāte tuvojas arvien tuvāk.