Google Gemini cenšas ievietot ChatGPT atpakaļskata spogulī
Kas jums jāzina
- AI sacīkstes uzkarst, jo Google ir izlaidusi jaunu AI modeli (domājiet par GPT-4 pret GPT-3), lai nodrošinātu savu AI ekosistēmu.
- Google etalonos ir redzams, ka Gemini vairākos veiktspējas rādītājos pārspēj GPT-4V.
- Gemini būs 3 formātos: Ultra, Pro un Nano.
- Pixel 8 Pro būs pirmais Pixel, kas ieviesīs Gemini, izmantojot Gemini Nano.
- decembrī Gemini Pro būs pieejams, izmantojot Gemini API pakalpojumā Google AI Studio. 13.
Ar neseno satricinājums OpenAI ar Sema Altmena atlaišanu un pēc tam atkal pieņemšanu darbā, Google noteikti ir sajutusi asiņu smaku ūdenī, jo tikai dažas nedēļas vēlāk Google paziņoja par jaunu AI modeli, kas, šķiet, ir jaudīgāks par GPT-4V.
Google paziņoja Google Gemini kā Google AI nākotne, sākot ar šodienu, nodrošinās Bard, un drīzumā tas nonāks visos Google AI produktos. Izmantojot 3 dažādus modeļa izmērus: Ultra, Pro un Nano, Gemini 1.0 ir izveidots tā, lai tas būtu visuresošs tāpat kā pārējais Google.
Kas ir Google Gemini?
Google sauc Gemini par "visspējīgāko un vispārīgāko modeli, ko jebkad esam izveidojuši". Tas ir aizmugures modelis kas nodrošinās Google virkni AI produktu, lai gan lēmums izlaist modeli ar trim izmēriem.
- Gemini Ultra — Google lielākais un spējīgākais modelis ļoti sarežģītiem uzdevumiem.
- Gemini Pro — Google labākais modelis mērogošanai dažādos uzdevumu klāstā.
- Dvīņi Nano — Google efektīvākais modelis uzdevumiem ierīcē.
Daži no Google piedāvātajiem veiktspējas rādītājiem Gemini ir diezgan iespaidīgi, taču, ja esmu iemācījies kaut ko tehnoloģiju jomā, neuzticieties ražotāju etaloniem. To sakot, ir grūti apšaubīt Dvīņu efektivitāti, redzot, kā tas darbojas tiešraidē. @rowancheung pakalpojumā X (Twitter) ievietoja video parādot Dvīņus darbībā, un rezultāti nav nekas cits kā ievērojams.
🚨 LAUKUMS: Google DeepMind tikko atklāja Gemini-ChatGPT lielāko konkurentu. Gemini ir PIRMAIS multimodālais AI, kas pārspēj cilvēku ekspertus MMLU, iegūstot vairāk nekā 90%. pic.twitter.com/A7It1hPKGQ2023. gada 6. decembris
Redzēt vairāk
Kā darbojas Google Gemini?
Google reklamē Gemini kā labāko AI modeli uz planētas, izmantojot savus publicētos etalonus. Ja šie etaloni atbilst trešās puses testēšanai, Gemini būs labākais suns tirgū vismaz līdz OpenAI izlaišanai. ChatGPT-5. Lielais noteikums ekonomikā, kāda tā pašlaik ir strukturēta, ir tāds, ka uzņēmumiem sacenšoties par labāko produktu, parasti uzvar patērētāji.
Dvīņiem vajadzētu mudināt OpenAI turpināt virzīt inovācijas, taču acīmredzami ir bijušas daudzas bažas par neapdomīgu pētniecību bez pienācīgiem drošības apsvērumiem, pat no plkst. Tādi vadītāji kā Satja Nadella salīdzina AI ar atomenerģiju.
Google Gemini pārspēja ChatGPT-4V lielākajā daļā Google rādīto etalonu. Dažreiz par vairāk nekā 4% punktiem. Etalona ar visinteresantāko nosaukumu HellaSwag bija tas, kas Gemini bija sliktāks salīdzinājumā ar ChatGPT-4V. Apskatiet pilnu etalonu sarakstu.
Spēja | Etalons | Apraksts | Gemini Ultra | GPT-4V |
---|---|---|---|---|
Ģenerālis | MMLU | Jautājumu attēlojums 57 priekšmetos (t.sk. STEM, humanitārās zinātnes un citas) | 90,0% CoT@32* | 86,4% 5-shot* (ziņots) |
Spriešana | Big-Bench Hard | Daudzveidīgs sarežģītu uzdevumu kopums, kam nepieciešama daudzpakāpju spriešana | 83,6% trīs sitienu | 83,1% trīs kadru (API), |
2. rinda — 0. šūna | NOLIETOT | Lasīšanas izpratne (F1 rezultāts) | 82.4 Mainīgie metieni | 80,9 3 šāvieni (ziņots) |
3. rinda — 0. šūna | HellaSwag | Saprāta spriešana ikdienas uzdevumiem | 87,8% 10 šāvienu* | 95,3% 10 šāvienu* (ziņots) |
Matemātika | GSM8K | Pamata aritmētiskās manipulācijas (t.sk. vidusskolas matemātikas uzdevumi) | 94,4% maj1@32 | 92,0% 5-shot CoT (ziņots) |
5. rinda — 0. šūna | MATH | Izaicinoši matemātikas uzdevumi (t.sk. algebra, ģeometrija, priekšaprēķins un citi) | 53,2% 4 sitieni | 52,9% četru kadru (API) |
Kods | HumanEval | Python koda ģenerēšana | 74,4% 0-shot (IT)* | 67,0% 0-shot* (ziņots) |
7. rinda — 0. šūna | Natural2Code | Python koda ģenerēšana. Jaunā datu kopa bija HumanEval līdzīga, nevis noplūda tīmeklī | 74,9% 0-šāviens | 73,9% 0-shot (API) |
8. rinda — 0. šūna | 8. rinda — 1. šūna | 8. rinda — 2. šūna | 8. rinda — 3. šūna | 8. rinda — 4. šūna |
Lai gan šie rādītāji ir iespaidīgi, tie, iespējams, nenozīmē tonnu vidusmēra patērētājam. Google uzspiežot Gemini Nano uz Pixel 8 Pro, man šķiet aizraujošāks, jo tas ir paraugs ierīcē veiktajiem uzdevumiem. Daudzi ražotāji sāk to darīt pievienojiet ierīces AI iespējas, piemēram, NVIDIA TensorRT-LLM to ražotajām ierīcēm. Man šī ir aizraujošāka AI nākotnes perspektīva, kur mēs varam iebūvēt īstus personīgos palīgus savos tālruņos un pielāgot mūsu AI modeli tā, lai tas vislabāk atbilstu mūsu individuālajām vajadzībām.
Viens no labākajiem un, iespējams, iespējamajiem turpmākajiem šo LLM AI lietojumiem ir kaut kas tāds, par ko mēs visi esam sapņojuši kopš Star Trek pirms 80 un vairāk gadiem. Universāls valodas tulks. ChatGPT jau var darboties kā tulkotājs, taču tulkojumu ģenerēšana prasa diezgan ilgu apstrādes laiku. Tagad tādas ir AI modeļi, kas var pārtulkot balss darbību citā valodā, saglabājot sākotnējā aktiera balsi neskartu. Esmu milzīgs anime, kā arī japāņu un korejiešu drāmu cienītājs, man patiktu pasaule, kurā es varu Nospiediet televizora pogu, lai dzirdētu oriģinālo aktieru balsi, bet tikai angļu valodā īsts laiks. Tā kā šīs mega korporācijas sacenšas, lai pārspētu viena otru AI attīstībā, šī realitāte tuvojas arvien tuvāk.