Google Gemini versucht, ChatGPT in den Rückspiegel zu rücken

December 07, 2023
ImFenster Zentral

Was du wissen musst

Der KI-Wettlauf verschärft sich, da Google ein neues KI-Modell (denken Sie an GPT-4 vs. GPT-3) veröffentlicht hat, um sein KI-Ökosystem voranzutreiben.
Die Benchmarks von Google zeigen, dass Gemini GPT-4V in mehreren Leistungsmetriken übertrifft.
Gemini wird in drei Formaten erhältlich sein: Ultra, Pro und Nano.
Das Pixel 8 Pro wird das erste Pixel sein, das Gemini über Gemini Nano implementiert.
Gemini Pro wird ab Dezember über die Gemini API in Google AI Studio verfügbar sein. 13.

Mit der jüngsten Umbruch bei OpenAI mit der Entlassung und anschließenden Wiedereinstellung von Sam AltmanGoogle muss Blut im Wasser gerochen haben, denn nur wenige Wochen später kündigte Google ein neues KI-Modell an, das offenbar leistungsfähiger als GPT-4V ist.

Google kündigte Google Gemini an denn die Zukunft der KI für Google wird Bard ab heute antreiben, und bald wird sie auch für alle KI-Produkte von Google gelten. Mit drei verschiedenen Modellgrößen: Ultra, Pro und Nano ist Gemini 1.0 so konzipiert, dass es genau wie der Rest von Google allgegenwärtig ist.

Was ist Google Gemini?

Google bezeichnet Gemini als „das leistungsfähigste und umfassendste Modell, das wir je gebaut haben“. Es ist das Backend-Modell Das wird Googles Stapel an KI-Produkten antreiben, obwohl die Entscheidung getroffen wurde, das Modell mit drei herauszubringen Größen.

Zwillinge Ultra – Googles größtes und leistungsfähigstes Modell für hochkomplexe Aufgaben.
Zwillinge Pro – Googles bestes Modell zur Skalierung für ein breites Aufgabenspektrum.
Zwillinge Nano – Googles effizientestes Modell für Aufgaben auf dem Gerät.

Einige der von Google für Gemini angepriesenen Leistungszahlen sind ziemlich beeindruckend, aber wenn ich eines im technischen Bereich gelernt habe: Vertrauen Sie nicht den Benchmarks der Hersteller. Allerdings ist es schwierig, die Wirksamkeit von Gemini in Frage zu stellen, wenn man sieht, wie es live funktioniert. @rowancheung auf X(Twitter) hat ein Video gepostet Es zeigt Gemini in Aktion und die Ergebnisse sind geradezu bemerkenswert.

🚨 BREAKING: Google DeepMind hat gerade den größten Konkurrenten von Gemini – ChatGPT enthüllt. Gemini ist die ERSTE multimodale KI, die menschliche Experten im MMLU übertrifft und über 90 % erreicht. pic.twitter.com/A7It1hPKGQ6. Dezember 2023

Mehr sehen

Wie funktioniert Google Gemini?

Google preist Gemini anhand der veröffentlichten Benchmarks als das beste KI-Modell der Welt an. Wenn diese Benchmarks den Tests von Drittanbietern standhalten, wird Gemini zumindest bis zur Veröffentlichung von OpenAI der Spitzenreiter auf dem Markt sein ChatGPT-5. Die wichtigste Regel in der Wirtschaft, wie sie derzeit strukturiert ist, lautet: Wenn Unternehmen um das beste Produkt konkurrieren, gewinnen in der Regel die Verbraucher.

Gemini sollte OpenAI dazu drängen, weiterhin Innovationen voranzutreiben, aber offensichtlich gab es viele Bedenken hinsichtlich rücksichtsloser Forschung ohne angemessene Rücksicht auf die Sicherheit, selbst von CEOs wie Satya Nadella vergleichen KI mit Atomenergie.

Gemini Ultra ist das erste Modell, das menschliche Experten im Bereich MMLU (Massive Multitask Language Understanding) übertrifft, das a verwendet Kombination aus 57 Fächern wie Mathematik, Physik, Geschichte, Recht, Medizin und Ethik zur Prüfung von Weltwissen und Problemlösung Fähigkeiten.

Google

Google Gemini übertraf ChatGPT-4V in den meisten von Google gezeigten Benchmarks. Teilweise um über 4 %-Punkte. Der Benchmark mit dem interessantesten Namen aus der Gruppe, HellaSwag, war derjenige, bei dem Gemini im Vergleich zu ChatGPT-4V schlechter abschnitt. Schauen Sie sich die vollständige Liste der Benchmarks an.

Wischen Sie, um horizontal zu scrollen

Fähigkeit	Benchmark	Beschreibung	Zwillinge Ultra	GPT-4V
Allgemein	MMLU	Darstellung von Fragen in 57 Fächern (inkl. MINT, Geisteswissenschaften und andere)	90,0 % CoT@32*	86,4 % 5-Schuss* (gemeldet)
Argumentation	Big-Bench hart	Vielfältige anspruchsvolle Aufgaben, die mehrstufiges Denken erfordern	83,6 % 3-Schuss	83,1 % 3-Schuss (API),
Zeile 2 – Zelle 0	FALLEN	Leseverständnis (F1-Score)	82,4 Variable Schläge	80,9 3-Schuss (gemeldet)
Zeile 3 – Zelle 0	HellaSwag	Gesundes Denken für alltägliche Aufgaben	87,8 % 10 Schuss*	95,3 % 10 Schuss* (gemeldet)
Mathematik	GSM8K	Grundrechenarten (inkl. Matheaufgaben in der Grundschule)	94,4 % maj1@32	92,0 % 5-Schuss-CoT (gemeldet)
Zeile 5 – Zelle 0	MATHEMATIK	Anspruchsvolle Matheaufgaben (inkl. Algebra, Geometrie, Vorrechnung und andere)	53,2 % 4-Schuss	52,9 % 4-Schuss (API)
Code	HumanEval	Generierung von Python-Code	74,4 % 0-Schuss (IT)*	67,0 % 0-Schuss* (gemeldet)
Zeile 7 – Zelle 0	Natural2Code	Generierung von Python-Code. Neuer bereitgestellter Datensatz im HumanEval-Stil, nicht im Internet durchgesickert	74,9 % 0-Schuss	73,9 % 0-Schuss (API)
Zeile 8 – Zelle 0	Zeile 8 – Zelle 1	Zeile 8 – Zelle 2	Zeile 8 – Zelle 3	Zeile 8 – Zelle 4

Obwohl diese Werte beeindruckend sind, sagen sie dem Durchschnittsverbraucher wahrscheinlich nicht viel. Dass Google den Gemini Nano auf das Pixel 8 Pro bringt, finde ich spannender, da es sich um ein Modell für Aufgaben auf dem Gerät handelt. Viele Hersteller fangen damit an Fügen Sie KI-Funktionen auf dem Gerät hinzu, wie zum Beispiel NVIDIAs TensorRT-LLM zu den Geräten, die sie herstellen. Für mich ist dies eine spannendere Perspektive für die Zukunft der KI, in der wir echte persönliche Assistenten in unsere Telefone integrieren und unser KI-Modell so anpassen können, dass es am besten für unsere individuellen Bedürfnisse funktioniert.

Eine der besten und wahrscheinlich möglichen zukünftigen Anwendungen für diese LLM-KIs ist etwas, von dem wir alle seit Star Trek vor über 80 Jahren geträumt haben. Ein universeller Sprachübersetzer. ChatGPT kann bereits als Übersetzer fungieren, allerdings ist die Bearbeitungszeit für die Erstellung der Übersetzungen ziemlich lang. Es gibt jetzt KI-Modelle, die Sprachausgabe in eine andere Sprache übersetzen können, wobei die Stimme des Originalschauspielers erhalten bleibt. Ich bin ein großer Fan von Anime sowie japanischen und koreanischen Dramen und würde eine Welt lieben, in der ich das kann Drücken Sie eine Taste auf meinem Fernseher und hören Sie die Stimme des Originalschauspielers, aber hören Sie sie einfach auf Englisch Echtzeit. Während diese Megakonzerne darum konkurrieren, einander bei der Weiterentwicklung der KI zu übertreffen, rückt diese Realität immer näher.