Google Gemini는 백미러에 ChatGPT를 추가하려고 합니다.

click fraud protection

당신이 알아야 할 것

  • Google이 AI 생태계를 강화하기 위해 새로운 AI 모델(GPT-4 대 ​​GPT-3을 생각해 보세요)을 출시하면서 AI 경쟁이 뜨거워지고 있습니다.
  • Google의 벤치마크에 따르면 Gemini는 여러 성능 지표에서 GPT-4V보다 뛰어난 성능을 보여줍니다.
  • Gemini는 Ultra, Pro, Nano의 3가지 형식으로 제공됩니다.
  • Pixel 8 Pro는 Gemini Nano를 통해 Gemini를 구현한 최초의 Pixel이 될 것입니다.
  • Gemini Pro는 12월부터 Google AI Studio의 Gemini API를 통해 제공될 예정입니다. 13일.

최근에는 OpenAI의 해고와 Sam Altman의 재고용, Google은 불과 몇 주 후에 GPT-4V보다 더 강력해 보이는 새로운 AI 모델을 발표했기 때문에 물 속의 피 냄새를 맡았을 것입니다.

Google 구글 제미니 발표 Google을 위한 AI의 미래는 오늘부터 Bard를 뒷받침할 것이며 곧 모든 Google AI 제품에 적용될 것입니다. Ultra, Pro, Nano 등 3가지 크기의 모델을 갖춘 Gemini 1.0은 Google의 다른 제품과 마찬가지로 어디서나 사용할 수 있도록 제작되었습니다.

구글 제미니란 무엇인가요?

Google은 Gemini를 "지금까지 구축한 모델 중 가장 유능하고 일반적인 모델"이라고 부릅니다. 백엔드 모델입니다 이는 Google의 AI 제품 스택을 강화할 것입니다. 크기.

  • 제미니 울트라 — 매우 복잡한 작업을 위한 Google의 가장 크고 유능한 모델입니다.
  • 제미니 프로 — 광범위한 작업에 걸쳐 확장하기 위한 Google 최고의 모델입니다.
  • 제미니 나노 — 기기 내 작업을 위한 Google의 가장 효율적인 모델입니다.

Google이 Gemini에 대해 선전하는 일부 성능 수치는 매우 인상적이지만 기술 분야에서 한 가지 배운 것이 있다면 제조업체 벤치마크를 신뢰하지 마십시오. 즉, Gemini가 실제로 작동하는 것을 볼 때 효율성에 의문을 제기하기는 어렵습니다. X의 @rowancheung(트위터) 동영상을 게시했습니다 Gemini의 실제 활동을 보여주는 결과는 놀랍습니다.

🚨 속보: Google DeepMind는 방금 Gemini-ChatGPT의 가장 큰 경쟁자를 공개했습니다. Gemini는 MMLU에서 인간 전문가를 능가하여 90% 이상의 점수를 얻은 최초의 다중 모드 AI입니다. pic.twitter.com/A7It1hPKGQ2023년 12월 6일

더보기

Google Gemini는 어떻게 작동하나요?

Google은 게시한 벤치마크를 통해 Gemini를 지구상 최고의 AI 모델로 홍보하고 있습니다. 이러한 벤치마크가 최대 제3자 테스트를 통과한다면 Gemini는 적어도 OpenAI가 출시될 때까지 시장에서 최고의 개가 될 것입니다. 채팅GPT-5. 현재 구조화된 경제의 가장 큰 규칙은 기업이 최고의 제품을 확보하기 위해 경쟁할 때 일반적으로 소비자가 승리한다는 것입니다.

Gemini는 OpenAI가 계속해서 혁신을 추진하도록 추진해야 하지만, 분명히 안전에 대한 적절한 고려 없이 무분별한 연구에 대한 우려가 많았습니다. Satya Nadella와 같은 CEO는 AI를 원자력 에너지에 비교합니다..

Gemini Ultra는 MMLU(대량 다중 작업 언어 이해) 분야에서 인간 전문가를 능가하는 최초의 모델입니다. 수학, 물리학, 역사, 법학, 의학, 윤리학 등 57개 과목을 결합하여 세계 지식과 문제 해결 능력을 모두 테스트합니다. 능력.

Google

Google Gemini는 Google이 제시한 대부분의 벤치마크에서 ChatGPT-4V를 능가했습니다. 때로는 4% 포인트가 넘는 경우도 있습니다. 가장 흥미로운 이름을 가진 벤치마크인 HellaSwag는 Gemini가 ChatGPT-4V에 비해 성능이 저조한 벤치마크였습니다. 전체 벤치마크 목록을 살펴보세요.

가로로 스크롤하려면 스와이프하세요.
능력 기준 설명 제미니 울트라 GPT-4V
일반적인 MMLU 57개 주제의 질문 표현(포함) STEM, 인문학 등) 90.0% CoT@32* 86.4% 5샷*(보고됨)
추리 빅 벤치 하드 다단계 추론이 필요한 다양한 도전 과제 83.6% 3샷 83.1% 3샷(API),
행 2 - 셀 0 떨어지다 독해력(F1 점수) 82.4 가변샷 80.9 3발(보고)
행 3 - 셀 0 HellaSwag 일상 업무에 대한 상식적 추론 87.8% 10샷* 95.3% 10샷*(보고됨)
수학 GSM8K 기본 산술 조작(포함) 초등학교 수학 문제) 94.4% maj1@32 92.0% 5샷 CoT(보고됨)
행 5 - 셀 0 수학 어려운 수학 문제(포함) 대수학, 기하학, 기초 미적분학 등) 53.2% 4샷 52.9% 4샷(API)
암호 인간평가 Python 코드 생성 74.4% 무샷(IT)* 67.0% 무샷*(보고)
행 7 - 셀 0 내추럴2코드 Python 코드 생성. 웹에 유출되지 않은 HumanEval과 유사한 새로운 보유 데이터 세트 74.9% 무샷 73.9% 무샷(API)
8행 - 셀 0 8행 - 셀 1 8행 - 셀 2 8행 - 셀 3 8행 - 셀 4

이 점수는 인상적이지만 일반 소비자에게는 큰 의미가 없을 것입니다. Google이 Gemini Nano를 Pixel 8 Pro에 적용하는 것은 기기 내 작업을 위한 모델이기 때문에 나에게 더 흥미로웠습니다. 많은 제조사들이 시작하고 있습니다. NVIDIA의 TensorRT-LLM과 같은 온디바이스 AI 기능 추가 그들이 만드는 장치에. 나에게 이것은 AI의 미래에 대한 더욱 흥미로운 전망입니다. 진정한 개인 비서를 휴대폰에 내장하고 AI 모델을 개인의 요구에 가장 잘 맞게 맞춤화할 수 있는 곳입니다.

이러한 LLM AI를 위한 최고의 미래 응용 프로그램 중 하나는 80년 전 Star Trek 이후 우리 모두가 꿈꿔 왔던 것입니다. 만국어 번역기. ChatGPT는 이미 번역가 역할을 할 수 있지만 번역을 생성하는 데 처리 시간이 꽤 오래 걸립니다. 지금은 있습니다 성우의 목소리를 그대로 유지하면서 성우를 다른 언어로 번역할 수 있는 AI 모델. 저는 애니메이션은 물론 일본, 한국 드라마의 열렬한 팬입니다. 제가 할 수 있는 세상을 원합니다. TV 버튼을 누르면 원래 배우들의 목소리가 들리지만 영어로만 들립니다. 실시간. 이들 거대 기업들이 AI 발전에서 서로를 능가하기 위해 경쟁하면서 이러한 현실은 점점 더 가까워지고 있습니다.