Google जेमिनी चैटजीपीटी को रियरव्यू मिरर में रखना चाहता है

click fraud protection

आपको क्या जानने की आवश्यकता है

  • AI की दौड़ तेज़ हो गई है क्योंकि Google ने अपने AI इकोसिस्टम को सशक्त बनाने के लिए एक नया AI मॉडल (GPT-4 बनाम GPT-3 के बारे में सोचें) जारी किया है।
  • Google के बेंचमार्क कई प्रदर्शन मेट्रिक्स में जेमिनी को GPT-4V से बेहतर प्रदर्शन करते हुए दिखाते हैं।
  • जेमिनी 3 प्रारूपों में आएगी: अल्ट्रा, प्रो और नैनो।
  • Pixel 8 Pro जेमिनी नैनो के माध्यम से जेमिनी को लागू करने वाला पहला पिक्सेल होगा।
  • जेमिनी प्रो दिसंबर में Google AI स्टूडियो में जेमिनी एपीआई के माध्यम से उपलब्ध होगा। 13वां.

हाल के साथ गोलीबारी के साथ OpenAI में उथल-पुथल, और फिर सैम ऑल्टमैन की पुनः नियुक्ति, Google को पानी में खून की गंध आ रही होगी क्योंकि कुछ ही हफ्तों बाद Google ने एक नए AI मॉडल की घोषणा की जो GPT-4V से अधिक शक्तिशाली प्रतीत होता है।

गूगल गूगल जेमिनी की घोषणा की Google के लिए AI का भविष्य और आज से बार्ड को शक्ति मिलेगी, और जल्द ही यह Google के सभी AI उत्पादों में आ जाएगा। मॉडल के 3 अलग-अलग आकारों के साथ: अल्ट्रा, प्रो और नैनो, जेमिनी 1.0 को Google के बाकी हिस्सों की तरह ही सर्वव्यापी बनाया गया है।

गूगल जेमिनी क्या है?

Google जेमिनी को "हमारे द्वारा बनाया गया अब तक का सबसे सक्षम और सामान्य मॉडल" कह रहा है। यह बैकएंड मॉडल है यह Google के AI उत्पादों को शक्ति प्रदान करेगा, हालाँकि तीन मॉडल के साथ मॉडल जारी करने का निर्णय लिया गया है आकार.

  • जेमिनी अल्ट्रा — अत्यधिक जटिल कार्यों के लिए Google का सबसे बड़ा और सबसे सक्षम मॉडल।
  • जेमिनी प्रो — कार्यों की एक विस्तृत श्रृंखला को बढ़ाने के लिए Google का सर्वोत्तम मॉडल।
  • जेमिनी नैनो — ऑन-डिवाइस कार्यों के लिए Google का सबसे कुशल मॉडल।

Google द्वारा मिथुन राशि के लिए बताए जा रहे कुछ प्रदर्शन आंकड़े बहुत प्रभावशाली हैं, लेकिन अगर मैंने तकनीक में एक चीज़ सीखी है, तो निर्माता बेंचमार्क पर भरोसा न करें। ऐसा कहा जा रहा है कि, जेमिनी को लाइव काम करते हुए देखकर उसकी प्रभावशीलता पर सवाल उठाना मुश्किल है। @rowancheung एक्स पर (ट्विटर) एक वीडियो पोस्ट किया मिथुन को क्रियान्वित करना और परिणाम उल्लेखनीय से कम नहीं हैं।

🚨 ब्रेकिंग: Google DeepMind ने अभी-अभी जेमिनी- ChatGPT के सबसे बड़े प्रतिस्पर्धी का खुलासा किया है। जेमिनी एमएमएलयू में मानव विशेषज्ञों से बेहतर प्रदर्शन करने वाला पहला मल्टीमॉडल एआई है, जिसने 90% से अधिक स्कोर किया है। pic.twitter.com/A7It1hPKGQ6 दिसंबर 2023

और देखें

Google जेमिनी कैसा प्रदर्शन करता है?

Google अपने द्वारा पोस्ट किए गए बेंचमार्क के माध्यम से जेमिनी को ग्रह पर सर्वश्रेष्ठ एआई मॉडल के रूप में पेश कर रहा है। यदि ये बेंचमार्क तीसरे पक्ष के परीक्षण पर खरे उतरते हैं, तो जेमिनी बाजार में शीर्ष पर रहेगा, कम से कम ओपनएआई जारी होने तक चैटजीपीटी-5. वर्तमान में जिस तरह से अर्थव्यवस्था की संरचना की गई है, उसका महान नियम यह है कि चूंकि कंपनियां सबसे अच्छा उत्पाद पाने के लिए प्रतिस्पर्धा करती हैं, तो उपभोक्ता आमतौर पर जीतते हैं।

जेमिनी को नवाचार को आगे बढ़ाने के लिए ओपनएआई पर जोर देना चाहिए, लेकिन जाहिर है, सुरक्षा के लिए उचित विचार किए बिना लापरवाह अनुसंधान के बारे में बहुत सारी चिंताएं हैं, यहां तक ​​कि सत्या नडेला जैसे सीईओ एआई की तुलना परमाणु ऊर्जा से कर रहे हैं.

जेमिनी अल्ट्रा एमएमएलयू (मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग) पर मानव विशेषज्ञों से बेहतर प्रदर्शन करने वाला पहला मॉडल है, जो एक का उपयोग करता है विश्व ज्ञान और समस्या-समाधान दोनों के परीक्षण के लिए गणित, भौतिकी, इतिहास, कानून, चिकित्सा और नैतिकता जैसे 57 विषयों का संयोजन क्षमताएं.

गूगल

Google जेमिनी ने Google द्वारा दिखाए गए अधिकांश बेंचमार्क में ChatGPT-4V से बेहतर प्रदर्शन किया। कभी-कभी 4% से अधिक अंक तक। समूह में से सबसे दिलचस्प नाम हेलास्वैग वाला बेंचमार्क वह था, जिसका प्रदर्शन जेमिनी ने चैटजीपीटी-4वी की तुलना में कमतर किया था। बेंचमार्क की पूरी सूची पर एक नज़र डालें।

क्षैतिज रूप से स्क्रॉल करने के लिए स्वाइप करें
क्षमता बेंचमार्क विवरण जेमिनी अल्ट्रा GPT-4V
सामान्य एमएमएलयू 57 विषयों में प्रश्नों का प्रतिनिधित्व (सहित) एसटीईएम, मानविकी, और अन्य) 90.0% CoT@32* 86.4% 5-शॉट* (रिपोर्ट किया गया)
तर्क बिग-बेंच हार्ड बहु-चरणीय तर्क की आवश्यकता वाले चुनौतीपूर्ण कार्यों का विविध सेट 83.6% 3-शॉट 83.1% 3-शॉट (एपीआई),
पंक्ति 2 - सेल 0 बूँद पढ़ने की समझ (F1 स्कोर) 82.4 परिवर्तनीय शॉट्स 80.9 3-शॉट (रिपोर्ट किया गया)
पंक्ति 3 - सेल 0 हेलास्वैग रोजमर्रा के कार्यों के लिए सामान्य ज्ञान तर्क 87.8% 10-शॉट* 95.3% 10-शॉट* (रिपोर्ट किया गया)
गणित GSM8K बुनियादी अंकगणितीय जोड़तोड़ (सहित) ग्रेड स्कूल गणित की समस्याएं) 94.4% maj1@32 92.0% 5-शॉट सीओटी (रिपोर्ट किया गया)
पंक्ति 5 - सेल 0 गणित चुनौतीपूर्ण गणित की समस्याएं (सहित) बीजगणित, ज्यामिति, पूर्व-कलन, और अन्य) 53.2% 4-शॉट 52.9% 4-शॉट (एपीआई)
कोड ह्यूमनएवल पायथन कोड जनरेशन 74.4% 0-शॉट (आईटी)* 67.0% 0-शॉट* (रिपोर्ट किया गया)
पंक्ति 7 - सेल 0 प्राकृतिक2कोड पायथन कोड जनरेशन. ह्यूमनएवल जैसा नया डेटासेट वेब पर लीक नहीं हुआ है 74.9% 0-शॉट 73.9% 0-शॉट (एपीआई)
पंक्ति 8 - सेल 0 पंक्ति 8 - सेल 1 पंक्ति 8 - कक्ष 2 पंक्ति 8 - कक्ष 3 पंक्ति 8 - सेल 4

हालाँकि ये स्कोर प्रभावशाली हैं, लेकिन संभवतः औसत उपभोक्ता के लिए इनका कोई खास मतलब नहीं है। Google द्वारा जेमिनी नैनो को Pixel 8 Pro पर धकेलना मेरे लिए अधिक रोमांचक है क्योंकि यह ऑन-डिवाइस कार्यों के लिए एक मॉडल है। बहुत सारे निर्माता शुरुआत कर रहे हैं NVIDIA की TensorRT-LLM जैसी ऑन-डिवाइस AI क्षमताएँ जोड़ें उनके द्वारा बनाए गए उपकरणों के लिए। मेरे लिए, यह एआई के भविष्य के लिए एक अधिक रोमांचक संभावना है, जहां हम अपने फोन में सच्चे निजी सहायक बना सकते हैं और अपनी व्यक्तिगत जरूरतों के लिए सर्वोत्तम काम करने के लिए अपने एआई मॉडल को अनुकूलित कर सकते हैं।

इन एलएलएम एआई के लिए सबसे अच्छे, और संभवतः संभावित, भविष्य के अनुप्रयोगों में से एक कुछ ऐसा है जिसका सपना हम सभी ने 80 से अधिक साल पहले स्टार ट्रेक के बाद से देखा है। एक सार्वभौमिक भाषा अनुवादक। चैटजीपीटी पहले से ही एक अनुवादक के रूप में कार्य कर सकता है, लेकिन अनुवाद तैयार करने में काफी लंबा प्रसंस्करण समय लगता है। अभी है एआई मॉडल जो मूल अभिनेता की आवाज को बरकरार रखते हुए आवाज अभिनय का दूसरी भाषा में अनुवाद कर सकते हैं. मैं एनीमे के साथ-साथ जापानी और कोरियाई नाटकों का बहुत बड़ा प्रशंसक हूं, मुझे ऐसी दुनिया पसंद आएगी जहां मैं कर सकूं मेरे टीवी पर एक बटन दबाएं और मूल अभिनेताओं की आवाज सुनें, लेकिन इसे केवल अंग्रेजी में सुनें रियल टाइम। जैसे-जैसे ये बड़े निगम एआई उन्नति में एक-दूसरे से आगे निकलने के लिए प्रतिस्पर्धा करते हैं, यह वास्तविकता और करीब आती जाती है।