Google Gemini מבקש לשים את ChatGPT במראה האחורית

December 07, 2023
בחלונות מרכזיים

מה שאתה צריך לדעת

מירוץ הבינה המלאכותית מתחמם כשגוגל פרסמה דגם בינה מלאכותית חדש, (חשבו על GPT-4 לעומת GPT-3) כדי להניע את מערכת ה-AI שלהם.
מדדי הביצועים של גוגל מראים ש-Gemini מתעלה על GPT-4V במספר מדדי ביצועים.
Gemini יגיע ב-3 פורמטים: Ultra, Pro וננו.
ה-Pixel 8 Pro יהיה הפיקסל הראשון שיטמיע את Gemini דרך Gemini Nano.
Gemini Pro יהיה זמין דרך Gemini API ב-Google AI Studio בדצמבר. ה-13.

עם האחרון מהפך ב-OpenAI עם הפיטורים, ולאחר מכן גיוסו מחדש של סם אלטמן, גוגל כנראה הריחה דם במים כי רק כמה שבועות לאחר מכן הכריזה גוגל על דגם AI חדש שנראה חזק יותר מ-GPT-4V.

גוגל הכריזה על Google Gemini מכיוון שהעתיד של AI עבור גוגל והחל מהיום יניע את בארד, ובקרוב הוא יגיע לכל מוצרי ה-AI של גוגל. עם 3 גדלים שונים של הדגם: Ultra, Pro וננו, Gemini 1.0 בנוי להיות בכל מקום בדיוק כמו שאר Google.

מה זה Google Gemini?

גוגל מכנה את ג'מיני "הדגם הכי מסוגל והכללי שבנו אי פעם". זה הדגם האחורי זה יניע את ערימת מוצרי הבינה המלאכותית של גוגל, אם כי ההחלטה לשחרר את הדגם עם שלושה גדלים.

ג'מיני אולטרה — המודל הגדול והמסוגל ביותר של גוגל למשימות מורכבות ביותר.

Gemini Pro — המודל הטוב ביותר של Google לשינוי קנה מידה במגוון רחב של משימות.
תאומים ננו — המודל היעיל ביותר של גוגל למשימות במכשיר.

חלק ממספרי הביצועים שמוצגים על ידי גוגל עבור תאומים הם די מרשימים, אבל אם למדתי דבר אחד בטכנולוגיה, אל תסמוך על מדדי היצרן. עם זאת, קשה להטיל ספק ביעילותו של תאומים כאשר רואים את זה עובד בשידור חי. @rowancheung ב-X(טוויטר) פרסם סרטון מראה את תאומים בפעולה והתוצאות הן לא פחות ממדהימות.

🚨 שבירה: Google DeepMind חשפה זה עתה את המתחרה הגדולה ביותר של Gemini- ChatGPT. Gemini היא הבינה המלאכותית המולטי-מודאלית הראשונה שעולה על מומחים אנושיים ב-MMLU, עם ציון של מעל 90%. pic.twitter.com/A7It1hPKGQ6 בדצמבר 2023

ראה עוד

איך Google Gemini מתפקד?

גוגל מציגה את ג'מיני כדגם הבינה המלאכותית הטוב ביותר על פני כדור הארץ באמצעות אמות המידה שהיא פרסמה. אם המדדים האלה יחזיקו מעמד לבדיקות של צד שלישי, Gemini יהיה הכלב המוביל בשוק, לפחות עד ש-OpenAI ישוחרר ChatGPT-5. הכלל הגדול בכלכלה כפי שהיא בנויה כיום הוא שכאשר חברות מתחרות על המוצר הטוב ביותר, הצרכנים בדרך כלל מנצחים.

תאומים צריכים לדחוף את OpenAI להמשיך לדחוף חדשנות, אבל ברור, היו הרבה חששות לגבי מחקר פזיז ללא שיקולים ראויים לבטיחות, אפילו מ מנכ"לים כמו Satya Nadella משווים AI לאנרגיה אטומית.

Gemini Ultra הוא הדגם הראשון שעולה על מומחים אנושיים ב-MMLU (הבנת שפה מרובת משימות מסיבית), המשתמש ב- שילוב של 57 מקצועות כגון מתמטיקה, פיזיקה, היסטוריה, משפטים, רפואה ואתיקה לבדיקת ידע עולמי ופתרון בעיות יכולות.

גוגל

Google Gemini התגבר על ChatGPT-4V ברוב המדדים שהוצגו על ידי גוגל. לפעמים במעל 4% נקודות. המדד עם השם המעניין ביותר מבין החבורה, HellaSwag, היה זה שג'מיני השיגה ביצועים לא טובים בהשוואה ל-ChatGPT-4V. עיין ברשימת המדדים המלאה.

החלק כדי לגלול אופקית

יכולת	Benchmark	תיאור	ג'מיני אולטרה	GPT-4V
כללי	MMLU	ייצוג שאלות ב-57 נושאים (כולל. STEM, מדעי הרוח ואחרים)	90.0% CoT@32*	86.4% 5 יריות* (דווח)
הַנמָקָה	Big-Bench Hard	סט מגוון של משימות מאתגרות הדורשות חשיבה רב-שלבית	83.6% 3 זריקות	83.1% 3-shot (API),
שורה 2 - תא 0	יְרִידָה	הבנת הנקרא (ציון F1)	82.4 זריקות משתנות	80.9 3 יריות (דווח)
שורה 3 - תא 0	HellaSwag	הגיון בריא למשימות יומיומיות	87.8% 10 זריקות*	95.3% 10 יריות* (דווח)
מתמטיקה	GSM8K	מניפולציות אריתמטיות בסיסיות (כולל. בעיות מתמטיקה של בית הספר לכיתה)	94.4% מאי1@32	92.0% 5-shot CoT (דווח)
שורה 5 - תא 0	מתמטיקה	בעיות מתמטיקה מאתגרות (כולל. אלגברה, גיאומטריה, טרום-חשבון ואחרים)	53.2% 4 זריקות	52.9% 4 זריקות (API)
קוד	HumanEval	יצירת קוד פייתון	74.4% 0-shot (IT)*	67.0% 0-shot* (דווח)
שורה 7 - תא 0	Natural2Code	יצירת קוד פייתון. מערך נתונים ממושך חדש דמוי HumanEval, לא דלף באינטרנט	74.9% זריקה 0	73.9% 0-shot (API)
שורה 8 - תא 0	שורה 8 - תא 1	שורה 8 - תא 2	שורה 8 - תא 3	שורה 8 - תא 4

למרות שהציונים האלה מרשימים, הם כנראה לא אומרים המון לצרכן הממוצע. גוגל דוחפת את Gemini Nano ל-Pixel 8 Pro מרגשת אותי יותר מכיוון שהיא מודל למשימות במכשיר. הרבה יצרנים מתחילים לעשות זאת הוסף יכולות AI במכשיר, כמו TensorRT-LLM של NVIDIA למכשירים שהם מייצרים. עבורי, זהו סיכוי מרגש יותר לעתיד של בינה מלאכותית, שבו נוכל לקבל עוזרים אישיים אמיתיים מובנים בטלפונים שלנו ולהתאים אישית את מודל הבינה המלאכותית שלנו כך שיעבוד בצורה הטובה ביותר עבור הצרכים האישיים שלנו.

אחד מהיישומים העתידיים הטובים ביותר, וסביר להניח שאפשרי, ל-LLM AIs אלה הוא משהו שכולנו חלמנו עליו מאז מסע בין כוכבים 80 פלוס לפני שנים. מתרגם שפה אוניברסלי. ChatGPT כבר יכול לפעול כמתרגם, אבל יש זמן עיבוד די ארוך כדי ליצור את התרגומים. יש עכשיו מודלים של AI שיכולים לתרגם משחק קול לשפה אחרת, תוך שמירה על הקול של השחקן המקורי ללא פגע. אני מעריץ ענק של אנימה, כמו גם דרמות יפניות וקוריאניות, אשמח לעולם שבו אני יכול לחץ על כפתור בטלוויזיה שלי וזכה לשמוע את קולם של השחקנים המקוריים, אבל פשוט לשמוע אותו באנגלית זמן אמת. בעוד תאגידי המגה הללו מתחרים כדי להתעלות זה על זה בקידום בינה מלאכותית, המציאות הזו מתקרבת יותר ויותר.