Google Gemini พยายามใส่ ChatGPT ในกระจกมองหลัง

click fraud protection

สิ่งที่คุณต้องรู้

  • การแข่งขัน AI เริ่มร้อนแรงเมื่อ Google ได้เปิดตัวโมเดล AI ใหม่ (ลองนึกถึง GPT-4 เทียบกับ GPT-3) เพื่อขับเคลื่อนระบบนิเวศ AI ของพวกเขา
  • เกณฑ์มาตรฐานของ Google แสดงให้เห็นว่า Gemini มีประสิทธิภาพเหนือกว่า GPT-4V ในเมตริกประสิทธิภาพหลายประการ
  • Gemini จะมี 3 รูปแบบ ได้แก่ Ultra, Pro และ Nano
  • Pixel 8 Pro จะเป็น Pixel ตัวแรกที่ใช้ Gemini ผ่าน Gemini Nano
  • Gemini Pro จะพร้อมใช้งานผ่าน Gemini API ใน Google AI Studio ในวันที่ 1 ธันวาคม วันที่ 13

ด้วยล่าสุด ความวุ่นวายที่ OpenAI ด้วยการยิง และจากนั้นก็จ้าง Sam Altman อีกครั้งGoogle คงได้กลิ่นเลือดในน้ำเพราะไม่กี่สัปดาห์ต่อมา Google ก็ประกาศโมเดล AI ใหม่ที่ดูเหมือนว่าจะมีประสิทธิภาพมากกว่า GPT-4V

Google ประกาศ Google Gemini เนื่องจากอนาคตของ AI สำหรับ Google และตั้งแต่วันนี้เป็นต้นไป จะช่วยขับเคลื่อน Bard และเร็วๆ นี้ก็จะมาสู่ผลิตภัณฑ์ AI ทั้งหมดของ Google ด้วยรุ่น 3 ขนาดที่แตกต่างกัน ได้แก่ Ultra, Pro และ Nano Gemini 1.0 ถูกสร้างขึ้นมาให้แพร่หลายเช่นเดียวกับผลิตภัณฑ์อื่นๆ ของ Google

Google ราศีเมถุนคืออะไร?

Google เรียก Gemini ว่า "โมเดลที่มีความสามารถและทั่วไปที่สุดเท่าที่เราเคยสร้างมา" มันเป็นรุ่นเบื้องหลัง ซึ่งจะขับเคลื่อนกลุ่มผลิตภัณฑ์ AI ของ Google แม้ว่าจะตัดสินใจเปิดตัวโมเดลสามรายการก็ตาม ขนาด

  • เจมินี่ อัลตร้า — โมเดลที่ใหญ่ที่สุดและมีความสามารถมากที่สุดของ Google สำหรับงานที่ซับซ้อนสูง
  • ราศีเมถุนโปร — โมเดลที่ดีที่สุดของ Google สำหรับการปรับขนาดในงานที่หลากหลาย
  • ราศีเมถุนนาโน — โมเดลที่มีประสิทธิภาพสูงสุดของ Google สำหรับงานบนอุปกรณ์

ตัวเลขประสิทธิภาพบางส่วนที่ Google นำเสนอสำหรับราศีเมถุนนั้นค่อนข้างน่าประทับใจ แต่หากฉันได้เรียนรู้สิ่งหนึ่งเกี่ยวกับเทคโนโลยี อย่าเชื่อถือเกณฑ์มาตรฐานของผู้ผลิต ดังที่กล่าวไปแล้ว เป็นการยากที่จะตั้งคำถามถึงประสิทธิภาพของราศีเมถุนเมื่อเห็นว่ามันใช้งานได้จริง @rowancheung บน X(Twitter) โพสต์วิดีโอ การแสดงการทำงานของราศีเมถุนและผลลัพธ์ที่ได้ก็น่าทึ่งไม่แพ้กัน

🚨 ข่าวด่วน: Google DeepMind เพิ่งเปิดเผย Gemini- คู่แข่งรายใหญ่ที่สุดของ ChatGPT Gemini เป็น AI ต่อเนื่องหลายรูปแบบตัวแรกที่มีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ใน MMLU โดยได้คะแนนมากกว่า 90% pic.twitter.com/A7It1hPKGQ6 ธันวาคม 2023

ดูเพิ่มเติม

Google Gemini ทำงานอย่างไร?

Google ยกย่อง Gemini ว่าเป็นโมเดล AI ที่ดีที่สุดในโลกผ่านเกณฑ์มาตรฐานที่โพสต์ไว้ หากเกณฑ์มาตรฐานเหล่านี้รองรับการทดสอบของบุคคลที่สาม Gemini จะเป็นสุนัขอันดับต้น ๆ ในตลาด อย่างน้อยก็จนกว่า OpenAI จะเผยแพร่ ChatGPT-5. กฎเกณฑ์สำคัญสำหรับเศรษฐกิจตามที่มีโครงสร้างอยู่ในปัจจุบันก็คือ เมื่อบริษัทต่างๆ แข่งขันกันเพื่อให้ได้ผลิตภัณฑ์ที่ดีที่สุด ผู้บริโภคมักจะเป็นผู้ชนะ

Gemini ควรผลักดัน OpenAI ให้ผลักดันนวัตกรรมต่อไป แต่เห็นได้ชัดว่ามีข้อกังวลมากมายเกี่ยวกับการวิจัยที่ประมาทโดยไม่ได้คำนึงถึงความปลอดภัยอย่างเหมาะสม แม้แต่จาก ซีอีโออย่าง Satya Nadella เปรียบเทียบ AI กับพลังงานปรมาณู.

Gemini Ultra เป็นรุ่นแรกที่มีประสิทธิภาพเหนือกว่าผู้เชี่ยวชาญที่เป็นมนุษย์ใน MMLU (ความเข้าใจภาษามัลติทาสก์ขนาดใหญ่) ซึ่งใช้ รวม 57 วิชา เช่น คณิตศาสตร์ ฟิสิกส์ ประวัติศาสตร์ กฎหมาย การแพทย์ และจริยธรรม เพื่อทดสอบความรู้ทางโลกและการแก้ปัญหา ความสามารถ

Google

Google Gemini มีประสิทธิภาพเหนือกว่า ChatGPT-4V ในเกณฑ์มาตรฐานส่วนใหญ่ที่แสดงโดย Google บางครั้งมากกว่า 4% คะแนน เกณฑ์มาตรฐานที่มีชื่อที่น่าสนใจที่สุดในกลุ่ม HellaSwag คือเกณฑ์มาตรฐานที่ Gemini มีประสิทธิภาพต่ำกว่าเมื่อเทียบกับ ChatGPT-4V ดูรายการการวัดประสิทธิภาพทั้งหมด

ปัดเพื่อเลื่อนในแนวนอน
ความสามารถ เกณฑ์มาตรฐาน คำอธิบาย เจมินี่ อัลตร้า GPT-4V
ทั่วไป มจล ตอบคำถาม 57 วิชา (รวม... ต้นกำเนิด มนุษยศาสตร์ และอื่นๆ) 90.0% CoT@32* 86.4% 5 ช็อต* (รายงาน)
การใช้เหตุผล บิ๊กเบนช์ฮาร์ด ชุดงานที่ท้าทายหลากหลายซึ่งต้องใช้เหตุผลหลายขั้นตอน 83.6% 3 ช็อต 83.1% 3 ช็อต (API)
แถวที่ 2 - เซลล์ 0 หยด การอ่านเพื่อความเข้าใจ (คะแนน F1) 82.4 ช็อตแปรผัน 80.9 3 ช็อต (ตามรายงาน)
แถวที่ 3 - เซลล์ 0 HellaSwag การใช้เหตุผลสามัญสำนึกสำหรับงานประจำวัน 87.8% 10 ช็อต* 95.3% 10 ช็อต* (รายงาน)
คณิตศาสตร์ GSM8K การปรับเปลี่ยนทางคณิตศาสตร์ขั้นพื้นฐาน (รวม โจทย์คณิตชั้นประถมศึกษา) 94.4% maj1@32 92.0% 5-shot CoT (รายงาน)
แถวที่ 5 - เซลล์ 0 คณิตศาสตร์ โจทย์คณิตศาสตร์ที่ท้าทาย (รวม พีชคณิต เรขาคณิต พรีแคลคูลัส และอื่นๆ) 53.2% 4 ช็อต 52.9% 4 ช็อต (API)
รหัส HumanEval การสร้างโค้ด Python 74.4% 0 ช็อต (ไอที)* 67.0% 0 ช็อต* (รายงาน)
แถวที่ 7 - เซลล์ 0 Natural2Code การสร้างโค้ด Python ชุดข้อมูลใหม่จัดวางเหมือน HumanEval ไม่รั่วไหลบนเว็บ 0 ช็อต 74.9% 73.9% 0 ช็อต (API)
แถวที่ 8 - เซลล์ 0 แถวที่ 8 - เซลล์ 1 แถวที่ 8 - เซลล์ 2 แถวที่ 8 - เซลล์ 3 แถวที่ 8 - เซลล์ 4

แม้ว่าคะแนนเหล่านี้จะน่าประทับใจ แต่ก็ไม่ได้มีความหมายอะไรมากมายสำหรับผู้บริโภคทั่วไป Google การผลักดัน Gemini Nano ลงบน Pixel 8 Pro นั้นน่าตื่นเต้นสำหรับฉันมากกว่าเพราะเป็นโมเดลสำหรับงานบนอุปกรณ์ ผู้ผลิตจำนวนมากเริ่มที่จะ เพิ่มความสามารถ AI บนอุปกรณ์ เช่น TensorRT-LLM ของ NVIDIA ไปยังอุปกรณ์ที่พวกเขาทำ สำหรับฉัน นี่เป็นโอกาสที่น่าตื่นเต้นสำหรับอนาคตของ AI ซึ่งเราสามารถมีผู้ช่วยส่วนตัวที่แท้จริงในโทรศัพท์ของเรา และปรับแต่งโมเดล AI ของเราให้ทำงานได้ดีที่สุดตามความต้องการส่วนบุคคลของเรา

หนึ่งในแอปพลิเคชันที่ดีที่สุดและน่าจะเป็นไปได้ในอนาคตสำหรับ LLM AI เหล่านี้คือสิ่งที่เราทุกคนใฝ่ฝันมาตั้งแต่ Star Trek 80 กว่าปีที่แล้ว นักแปลภาษาสากล ChatGPT สามารถทำหน้าที่เป็นนักแปลได้แล้ว แต่ต้องใช้เวลาในการประมวลผลค่อนข้างนานในการสร้างคำแปล ตอนนี้ก็มี โมเดล AI ที่สามารถแปลการแสดงเสียงเป็นภาษาอื่น โดยรักษาเสียงของนักแสดงต้นฉบับไว้. ฉันเป็นแฟนตัวยงของอนิเมะ เช่นเดียวกับละครญี่ปุ่นและเกาหลี ฉันอยากจะรักโลกที่ฉันสามารถทำได้ กดปุ่มบนทีวีของฉันแล้วฟังเสียงนักแสดงต้นฉบับแต่ฟังเป็นภาษาอังกฤษเท่านั้น เรียลไทม์ ในขณะที่บริษัทขนาดใหญ่เหล่านี้แข่งขันกันเพื่อเอาชนะกันและกันในด้านความก้าวหน้าของ AI ความเป็นจริงนี้ใกล้เข้ามามากขึ้นเรื่อยๆ