يسعى Google Gemini إلى وضع ChatGPT في مرآة الرؤية الخلفية

click fraud protection

ما تحتاج إلى معرفته

  • يحتدم سباق الذكاء الاصطناعي عندما أصدرت Google نموذجًا جديدًا للذكاء الاصطناعي (مثل GPT-4 مقابل GPT-3) لتشغيل نظام الذكاء الاصطناعي البيئي الخاص بها.
  • تُظهر معايير Google تفوق Gemini على GPT-4V في العديد من مقاييس الأداء.
  • سيأتي Gemini بثلاثة أشكال: Ultra وPro وNano.
  • سيكون Pixel 8 Pro هو أول هاتف Pixel يستخدم Gemini من خلال Gemini Nano.
  • سيكون Gemini Pro متاحًا من خلال Gemini API في Google AI Studio في ديسمبر. الثالث عشر.

مع الأخيرة ثورة في OpenAI مع طرد سام التمان ثم إعادة توظيفهلا بد أن Google قد اشتمت رائحة الدم في الماء لأنه بعد بضعة أسابيع فقط أعلنت Google عن نموذج جديد للذكاء الاصطناعي يبدو أقوى من GPT-4V.

جوجل أعلن جوجل الجوزاء حيث أن مستقبل الذكاء الاصطناعي لجوجل وبدءًا من اليوم سوف يدعم Bard، وقريبًا سيصل إلى جميع منتجات الذكاء الاصطناعي من جوجل. مع 3 أحجام مختلفة للنموذج: Ultra وPro وNano، تم تصميم Gemini 1.0 ليكون موجودًا في كل مكان تمامًا مثل بقية منتجات Google.

ما هو جوجل الجوزاء؟

تصف Google الجوزاء بأنه "النموذج الأكثر قدرة وعامة الذي قمنا ببنائه على الإطلاق". إنه نموذج الواجهة الخلفية سيؤدي ذلك إلى تشغيل مجموعة منتجات الذكاء الاصطناعي الخاصة بشركة Google، على الرغم من قرار إطلاق النموذج بثلاثة الأحجام.

  • الجوزاء الترا — النموذج الأكبر والأكثر قدرة من Google للمهام شديدة التعقيد.
  • الجوزاء برو - أفضل نموذج من Google للتوسع عبر مجموعة واسعة من المهام.
  • الجوزاء نانو — النموذج الأكثر كفاءة من Google للمهام التي تتم على الجهاز.

بعض أرقام الأداء التي تروج لها Google لـ Gemini مثيرة للإعجاب جدًا، ولكن إذا تعلمت شيئًا واحدًا في مجال التكنولوجيا، فلا تثق بمعايير الشركة المصنعة. ومع ذلك، من الصعب التشكيك في فعالية الجوزاء عند رؤيته وهو يعمل على الهواء مباشرة. @roancheung على X (تويتر) نشرت فيديو إظهار الجوزاء أثناء العمل والنتائج ليست أقل من رائعة.

🚨 عاجل: كشف Google DeepMind للتو عن أكبر منافس لـ Gemini- ChatGPT. Gemini هو أول نظام ذكاء اصطناعي متعدد الوسائط يتفوق على الخبراء البشريين في MMLU، حيث سجل أكثر من 90%. pic.twitter.com/A7It1hPKGQ6 ديسمبر 2023

شاهد المزيد

كيف يعمل جوجل الجوزاء؟

تروج Google لـ Gemini كأفضل نموذج للذكاء الاصطناعي على هذا الكوكب من خلال المعايير التي نشرتها. إذا صمدت هذه المعايير حتى اختبارات الطرف الثالث، فسيكون Gemini هو الأفضل في السوق، على الأقل حتى يتم إصدار OpenAI الدردشةGPT-5. القاعدة الكبرى في الاقتصاد كما هو منظم حاليًا هي أنه بينما تتنافس الشركات للحصول على أفضل منتج، عادةً ما يفوز المستهلكون.

يجب على جيميني أن يدفع OpenAI لمواصلة دفع الابتكار، ولكن من الواضح أنه كان هناك الكثير من المخاوف بشأن الأبحاث المتهورة دون الاعتبارات المناسبة للسلامة، حتى من الرؤساء التنفيذيون مثل ساتيا ناديلا يقارنون الذكاء الاصطناعي بالطاقة الذرية.

Gemini Ultra هو النموذج الأول الذي يتفوق على الخبراء البشريين في MMLU (فهم اللغة متعدد المهام الضخم)، والذي يستخدم مزيج من 57 موضوعًا مثل الرياضيات والفيزياء والتاريخ والقانون والطب والأخلاق لاختبار المعرفة العالمية وحل المشكلات قدرات.

جوجل

تفوق Google Gemini على ChatGPT-4V في معظم المعايير التي عرضتها Google. في بعض الأحيان بنسبة تزيد عن 4% نقطة. كان المعيار ذو الاسم الأكثر إثارة للاهتمام من بين المجموعة، HellaSwag، هو المعيار الذي كان أداء Gemini فيه ضعيفًا مقارنة بـ ChatGPT-4V. ألق نظرة على القائمة الكاملة للمعايير.

اسحب للتمرير أفقيًا
الإمكانية المعيار وصف الجوزاء الترا جي بي تي-4V
عام MMLU تمثيل الأسئلة في 57 موضوعًا (بما في ذلك. العلوم والتكنولوجيا والهندسة والرياضيات (STEM) والعلوم الإنسانية وغيرها) 90.0% كوت@32* 86.4% 5 طلقات* (مبلغ عنها)
منطق مقعد كبير صعب مجموعة متنوعة من المهام الصعبة التي تتطلب تفكيرًا متعدد الخطوات 83.6% 3 طلقات 83.1% 3 لقطات (واجهة برمجة التطبيقات)،
الصف 2 - الخلية 0 يسقط فهم القراءة (درجة F1) 82.4 لقطات متغيرة 80.9 3 طلقات (تم الإبلاغ عنها)
الصف 3 - الخلية 0 هيلاسواج المنطق المنطقي للمهام اليومية 87.8% 10 طلقات* 95.3% 10 طلقات* (مبلغ عنها)
الرياضيات GSM8K التلاعب الحسابي الأساسي (بما في ذلك. مسائل الرياضيات في المدرسة الابتدائية) 94.4% ماج1@32 92.0% 5 طلقات CoT (مبلغ عنها)
الصف 5 - الخلية 0 الرياضيات مشاكل الرياضيات الصعبة (بما في ذلك. الجبر والهندسة والتفاضل والتكامل وغيرها) 53.2% 4 طلقات 52.9% 4 طلقات (واجهة برمجة التطبيقات)
شفرة HumanEval توليد كود بايثون 74.4% 0-طلقة (تكنولوجيا المعلومات)* 67.0% 0-طلقة* (تم الإبلاغ عنها)
الصف 7 - الخلية 0 Natural2Code توليد كود بايثون. مجموعة بيانات جديدة تشبه HumanEval، ولم يتم تسريبها على الويب 74.9% 0 طلقة 73.9% 0-طلقة (واجهة برمجة التطبيقات)
الصف 8 - الخلية 0 الصف 8 - الخلية 1 الصف 8 - الخلية 2 الصف 8 - الخلية 3 الصف 8 - الخلية 4

في حين أن هذه النتائج مثيرة للإعجاب، إلا أنها ربما لا تعني الكثير بالنسبة للمستهلك العادي. يعد دفع Google لـ Gemini Nano إلى Pixel 8 Pro أكثر إثارة بالنسبة لي لأنه نموذج للمهام الموجودة على الجهاز. لقد بدأ الكثير من الشركات المصنعة في ذلك إضافة إمكانات الذكاء الاصطناعي على الجهاز، مثل TensorRT-LLM من NVIDIA للأجهزة التي يصنعونها. بالنسبة لي، يعد هذا احتمالًا أكثر إثارة لمستقبل الذكاء الاصطناعي، حيث يمكننا الحصول على مساعدين شخصيين حقيقيين مدمجين في هواتفنا وتخصيص نموذج الذكاء الاصطناعي الخاص بنا ليعمل بشكل أفضل لتلبية احتياجاتنا الفردية.

أحد أفضل التطبيقات المستقبلية، والممكنة على الأرجح، لأنظمة الذكاء الاصطناعي LLM هذه هو شيء حلمنا به جميعًا منذ Star Trek منذ أكثر من 80 عامًا. مترجم لغة عالمية. يمكن لـ ChatGPT أن يعمل بالفعل كمترجم، ولكن هناك وقت معالجة طويل جدًا لإنشاء الترجمات. هناك الان نماذج الذكاء الاصطناعي التي يمكنها ترجمة التمثيل الصوتي إلى لغة أخرى، مع الحفاظ على صوت الممثل الأصلي سليمًا. أنا معجب كبير بالأنمي، وكذلك الدراما اليابانية والكورية، وأحب عالمًا حيث أستطيع ذلك اضغط على زر على جهاز التلفزيون الخاص بي واستمع إلى صوت الممثلين الأصليين ولكن فقط استمع إليه باللغة الإنجليزية في الوقت الحالى. وبينما تتنافس هذه الشركات العملاقة للتفوق على بعضها البعض في مجال تطوير الذكاء الاصطناعي، فإن هذا الواقع يقترب أكثر فأكثر.