Google Gemini ცდილობს ჩააყენოს ChatGPT უკანა ხედვის სარკეში

click fraud protection

რაც თქვენ უნდა იცოდეთ

  • AI რბოლა თბება, რადგან Google-მა გამოუშვა ახალი AI მოდელი (იფიქრეთ GPT-4 vs GPT-3) მათი AI ეკოსისტემის გასაძლიერებლად.
  • Google-ის საორიენტაციო ნიშნები აჩვენებს, რომ Gemini აჯობებს GPT-4V-ს რამდენიმე შესრულების მეტრიკაში.
  • Gemini გამოვა 3 ფორმატში: Ultra, Pro და Nano.
  • Pixel 8 Pro იქნება პირველი Pixel, რომელიც დანერგავს Gemini-ს Gemini Nano-ს მეშვეობით.
  • Gemini Pro ხელმისაწვდომი იქნება Gemini API-ის მეშვეობით Google AI Studio-ში დეკემბერს. მე-13.

ბოლო დროს აჯანყება OpenAI-ში გათავისუფლებით და შემდეგ სემ ალტმანის ხელახალი დაქირავებითგუგლს წყალში სისხლის სუნი უნდა ეგრძნო, რადგან სულ რამდენიმე კვირის შემდეგ Google-მა გამოაცხადა ახალი AI მოდელი, რომელიც, როგორც ჩანს, უფრო ძლიერია ვიდრე GPT-4V.

Google გამოაცხადა Google Gemini რადგან Google-ისთვის ხელოვნური ინტელექტის მომავალი და დღეიდან აძლიერებს ბარდს და მალე ის Google-ის ყველა ხელოვნური ინტელექტის პროდუქტზე მოვა. მოდელის 3 განსხვავებული ზომით: Ultra, Pro და Nano, Gemini 1.0 შექმნილია ისე, რომ იყოს ყველგან, ისევე როგორც დანარჩენი Google.

რა არის Google Gemini?

Google ტყუპებს უწოდებს „ყველაზე ქმედუნარიან და ზოგად მოდელს, რომელიც ჩვენ ოდესმე შეგვიქმნია“. ეს არის backend მოდელი ეს გააძლიერებს Google-ის ხელოვნური ინტელექტის პროდუქტების დასტას, თუმცა გადაწყვეტილება მოდელის სამიდან გამოშვებას მიიღებს ზომები.

  • ტყუპები ულტრა — Google-ის უდიდესი და ყველაზე ეფექტური მოდელი უაღრესად რთული ამოცანებისთვის.
  • Gemini Pro — Google-ის საუკეთესო მოდელი ამოცანების ფართო სპექტრის მასშტაბის შესასრულებლად.
  • ტყუპები ნანო — Google-ის ყველაზე ეფექტური მოდელი მოწყობილობაზე დავალებისთვის.

ზოგიერთი შესრულების ნომრები, რომლებსაც Google რეკავს ტყუპებისთვის, საკმაოდ შთამბეჭდავია, მაგრამ თუ მე ვისწავლე ერთი რამ ტექნოლოგიაში, არ ენდოთ მწარმოებლის ეტალონებს. როგორც ითქვა, ძნელია ეჭვქვეშ დააყენო ტყუპების ეფექტურობა, როცა ხედავ, რომ ის მუშაობს პირდაპირ ეთერში. @rowancheung X-ზე (Twitter) გამოაქვეყნა ვიდეო ტყუპების ჩვენება მოქმედებაში და შედეგები არაფრით არის აღსანიშნავი.

🚨 BREAKING: Google DeepMind-მა ახლახან გამოავლინა Gemini- ChatGPT-ის ყველაზე დიდი კონკურენტი. ტყუპები არის პირველი მულტიმოდალური ხელოვნური ინტელექტი, რომელმაც აჯობა ადამიანურ ექსპერტებს MMLU-ზე და 90%-ზე მეტი ქულა აქვს. pic.twitter.com/A7It1hPKGQ2023 წლის 6 დეკემბერი

Მეტის ნახვა

როგორ მუშაობს Google Gemini?

Google ასახელებს Gemini-ს, როგორც საუკეთესო ხელოვნური ინტელექტის მოდელს პლანეტაზე, მის მიერ გამოქვეყნებული კრიტერიუმებით. თუ ეს კრიტერიუმები გამართავს მესამე მხარის ტესტირებას, Gemini იქნება ბაზარზე საუკეთესო ძაღლი, ყოველ შემთხვევაში, სანამ OpenAI არ გამოვა. ChatGPT-5. ეკონომიკის დიდი წესი, როგორც ის ამჟამად სტრუქტურირებულია, არის ის, რომ როდესაც კომპანიები კონკურენციას უწევენ საუკეთესო პროდუქტს, როგორც წესი, მომხმარებლები იმარჯვებენ.

ტყუპები უნდა უბიძგოს OpenAI-ს, გააგრძელოს ინოვაციების გააქტიურება, მაგრამ ცხადია, იყო ბევრი შეშფოთება უგუნური კვლევის შესახებ უსაფრთხოების სათანადო მოსაზრებების გარეშე, თუნდაც CEOs მოსწონს Satya Nadella, რომელიც ადარებს AI-ს ატომურ ენერგიას.

Gemini Ultra არის პირველი მოდელი, რომელიც აჯობა ადამიანურ ექსპერტებს MMLU-ში (მრავალსამუშაო ენის მასიური გაგება), რომელიც იყენებს 57 საგნის კომბინაცია, როგორიცაა მათემატიკა, ფიზიკა, ისტორია, სამართალი, მედიცინა და ეთიკა მსოფლიო ცოდნის შესამოწმებლად და პრობლემის გადაჭრისთვის. შესაძლებლობები.

Google

Google Gemini-მა აჯობა ChatGPT-4V-ს Google-ის მიერ ნაჩვენები ინდიკატორების უმეტესობაში. ზოგჯერ 4%-ზე მეტი ქულით. ჯგუფში ყველაზე საინტერესო სახელწოდების ნიშნული, HellaSwag, იყო ის, რაც Gemini-მ ნაკლებად შეასრულა ChatGPT-4V-სთან შედარებით. გადახედეთ ეტალონების სრულ ჩამონათვალს.

გადაფურცლეთ ჰორიზონტალურად გადასასვლელად
შესაძლებლობა ნიშნული აღწერა ტყუპები ულტრა GPT-4V
გენერალი MMLU კითხვების წარმოდგენა 57 საგანში (მათ. STEM, ჰუმანიტარული მეცნიერებები და სხვა) 90.0% CoT@32* 86.4% 5-დარტყმა* (მოხსენებული)
მსჯელობა Big-Bench Hard რთული ამოცანების მრავალფეროვანი ნაკრები, რომელიც მოითხოვს მრავალსაფეხურიან მსჯელობას 83.6% 3-დარტყმა 83.1% 3-shot (API),
რიგი 2 - უჯრედი 0 ვარდნა წაკითხულის გააზრება (F1 ქულა) 82.4 ცვლადი დარტყმები 80.9 3-დარტყმა (მოხსენებული)
რიგი 3 - უჯრედი 0 HellaSwag საღი მსჯელობა ყოველდღიური ამოცანებისთვის 87.8% 10-shot* 95.3% 10-shot* (მოხსენებული)
Მათემატიკა GSM8K ძირითადი არითმეტიკული მანიპულაციები (მათ. საკლასო სკოლის მათემატიკური ამოცანები) 94.4% მაი1@32 92.0% 5-shot CoT (მოხსენებული)
რიგი 5 - უჯრედი 0 ᲛᲐᲗᲔᲛᲐᲢᲘᲙᲐ მათემატიკის რთული ამოცანები (მათ. ალგებრა, გეომეტრია, წინასწარი გაანგარიშება და სხვა) 53.2% 4-დარტყმა 52.9% 4-shot (API)
კოდი HumanEval პითონის კოდის გენერაცია 74.4% 0-დარტყმა (IT)* 67.0% 0-დარტყმა* (მოხსენებული)
რიგი 7 - უჯრედი 0 Natural2Code პითონის კოდის გენერაცია. ახალი გამართული მონაცემთა ბაზა HumanEval-ის მსგავსი, არ არის გაჟონილი ინტერნეტში 74.9% 0-დარტყმა 73.9% 0-shot (API)
რიგი 8 - უჯრედი 0 რიგი 8 - უჯრედი 1 რიგი 8 - უჯრედი 2 რიგი 8 - უჯრედი 3 რიგი 8 - უჯრედი 4

მიუხედავად იმისა, რომ ეს ქულები შთამბეჭდავია, ისინი ალბათ არ ნიშნავს ტონას საშუალო მომხმარებლისთვის. Google Pixel 8 Pro-ზე Gemini Nano-ზე დაყენება უფრო ამაღელვებელია ჩემთვის, რადგან ის არის მოწყობილობაზე დავალებების მოდელი. ბევრი მწარმოებელი იწყებს დაამატეთ მოწყობილობაზე AI შესაძლებლობები, როგორიცაა NVIDIA-ს TensorRT-LLM მათ მიერ დამზადებულ მოწყობილობებზე. ჩემთვის ეს უფრო საინტერესო პერსპექტივაა ხელოვნური ინტელექტის მომავლისთვის, სადაც ჩვენ შეგვიძლია გვყავდეს ნამდვილი პერსონალური ასისტენტები ჩაშენებული ჩვენს ტელეფონებში და მოვარგოთ ჩვენი ხელოვნური ინტელექტის მოდელი, რათა საუკეთესოდ იმუშაოს ჩვენს ინდივიდუალურ საჭიროებებზე.

ამ LLM AI-ების ერთ-ერთი საუკეთესო და, სავარაუდოდ, შესაძლო, სამომავლო აპლიკაცია არის ის, რაზეც ჩვენ ყველა ვოცნებობდით Star Trek 80 და მეტი წლის წინ. უნივერსალური ენის მთარგმნელი. ChatGPT უკვე შეუძლია იმოქმედოს როგორც თარჯიმანი, მაგრამ თარგმანების გენერირებას საკმაოდ დიდი დრო სჭირდება. ახლა არიან ხელოვნური ინტელექტის მოდელები, რომლებსაც შეუძლიათ ხმოვანი მოქმედების სხვა ენაზე თარგმნა, ორიგინალური მსახიობის ხმა ხელუხლებლად შენარჩუნებით. მე ვარ ანიმეების, ასევე იაპონური და კორეული დრამების დიდი გულშემატკივარი, მე მიყვარს სამყარო, სადაც შემიძლია დააჭირე ღილაკს ჩემს ტელევიზორზე და მოისმინე ორიგინალური მსახიობების ხმა, მაგრამ უბრალოდ ისმინე ინგლისურად რეალური დრო. რამდენადაც ეს მეგა კორპორაციები ეჯიბრებიან ერთმანეთს AI წინსვლაში, ეს რეალობა სულ უფრო უახლოვდება.