Το Google Gemini επιδιώκει να τοποθετήσει το ChatGPT στον καθρέφτη

December 07, 2023
ΣεΠαράθυρα κεντρικά

Τι πρέπει να ξέρετε

Η κούρσα της τεχνητής νοημοσύνης θερμαίνεται καθώς η Google κυκλοφόρησε ένα νέο μοντέλο τεχνητής νοημοσύνης, (σκεφτείτε το GPT-4 έναντι του GPT-3) για να τροφοδοτήσει το οικοσύστημά της με τεχνητή νοημοσύνη.
Τα σημεία αναφοράς της Google δείχνουν ότι η Gemini υπερέχει του GPT-4V σε διάφορες μετρήσεις απόδοσης.
Το Gemini θα έρθει σε 3 μορφές: Ultra, Pro και Nano.
Το Pixel 8 Pro θα είναι το πρώτο Pixel που θα εφαρμόσει το Gemini μέσω του Gemini Nano.
Το Gemini Pro θα είναι διαθέσιμο μέσω του Gemini API στο Google AI Studio τον Δεκέμβριο. 13η.

Με το πρόσφατο αναταραχή στο OpenAI με την απόλυση και μετά την επαναπρόσληψη του Sam Altman, η Google πρέπει να μύρισε αίμα στο νερό γιατί μόλις λίγες εβδομάδες αργότερα η Google ανακοίνωσε ένα νέο μοντέλο AI που φαίνεται να είναι πιο ισχυρό από το GPT-4V.

Google ανακοίνωσε το Google Gemini καθώς το μέλλον της τεχνητής νοημοσύνης για την Google και από σήμερα θα τροφοδοτεί τον Bard και σύντομα θα έρθει σε όλα τα προϊόντα τεχνητής νοημοσύνης της Google. Με 3 διαφορετικά μεγέθη του μοντέλου: Ultra, Pro και Nano, το Gemini 1.0 έχει κατασκευαστεί για να είναι πανταχού παρόν όπως και η υπόλοιπη Google.

Τι είναι το Google Gemini;

Η Google αποκαλεί το Gemini «το πιο ικανό και γενικό μοντέλο που έχουμε κατασκευάσει ποτέ». Είναι το μοντέλο υποστήριξης που θα τροφοδοτήσει τη στοίβα προϊόντων τεχνητής νοημοσύνης της Google, αν και η απόφαση να κυκλοφορήσει το μοντέλο με τρία μεγέθη.

Gemini Ultra — Το μεγαλύτερο και πιο ικανό μοντέλο της Google για εξαιρετικά πολύπλοκες εργασίες.
Gemini Pro — Το καλύτερο μοντέλο της Google για την κλιμάκωση σε ένα ευρύ φάσμα εργασιών.
Δίδυμοι Νάνο — Το πιο αποτελεσματικό μοντέλο της Google για εργασίες στη συσκευή.

Μερικοί από τους αριθμούς απόδοσης που διαφημίζει η Google για τους Gemini είναι αρκετά εντυπωσιακοί, αλλά αν έχω μάθει ένα πράγμα στην τεχνολογία, μην εμπιστεύεστε τα σημεία αναφοράς κατασκευαστών. Τούτου λεχθέντος, είναι δύσκολο να αμφισβητήσει κανείς την αποτελεσματικότητα του Gemini όταν τον βλέπει να λειτουργεί ζωντανά. @rowancheung στο X (Twitter) δημοσίευσε ένα βίντεο δείχνοντας τους Διδύμους σε δράση και τα αποτελέσματα δεν είναι τίποτα λιγότερο από αξιοσημείωτα.

🚨 ΑΠΟΚΛΕΙΣΤΙΚΟ: Το Google DeepMind μόλις αποκάλυψε τον μεγαλύτερο ανταγωνιστή του Gemini- ChatGPT. Το Gemini είναι το ΠΡΩΤΟ πολυτροπικό AI που ξεπέρασε τους ανθρώπινους ειδικούς στο MMLU, σημειώνοντας πάνω από 90%. pic.twitter.com/A7It1hPKGQ6 Δεκεμβρίου 2023

Δείτε περισσότερα

Πώς αποδίδει το Google Gemini;

Η Google προβάλλει το Gemini ως το καλύτερο μοντέλο AI στον πλανήτη μέσω των σημείων αναφοράς που δημοσίευσε. Εάν αυτά τα σημεία αναφοράς αντέχουν έως και δοκιμές τρίτου μέρους, το Gemini θα είναι το κορυφαίο σκυλί στην αγορά, τουλάχιστον μέχρι να κυκλοφορήσει το OpenAI ChatGPT-5. Ο μεγάλος κανόνας με την οικονομία όπως είναι σήμερα δομημένη είναι ότι καθώς οι εταιρείες ανταγωνίζονται για να έχουν το καλύτερο προϊόν, συνήθως κερδίζουν οι καταναλωτές.

Το Gemini θα πρέπει να ωθήσει το OpenAI να συνεχίσει να προωθεί την καινοτομία, αλλά προφανώς, υπήρξαν πολλές ανησυχίες σχετικά με την απερίσκεπτη έρευνα χωρίς τις κατάλληλες εκτιμήσεις για την ασφάλεια, ακόμη και από Διευθύνοντες σύμβουλοι όπως ο Satya Nadella συγκρίνει την τεχνητή νοημοσύνη με την ατομική ενέργεια.

Το Gemini Ultra είναι το πρώτο μοντέλο που ξεπέρασε τους ανθρώπινους ειδικούς στο MMLU (masive multitask language κατανόηση), το οποίο χρησιμοποιεί συνδυασμός 57 θεμάτων όπως μαθηματικά, φυσική, ιστορία, νόμος, ιατρική και ηθική για τον έλεγχο τόσο της παγκόσμιας γνώσης όσο και επίλυσης προβλημάτων ικανότητες.

Google

Το Google Gemini ξεπέρασε το ChatGPT-4V στα περισσότερα σημεία αναφοράς που εμφανίστηκαν από την Google. Μερικές φορές πάνω από 4% μονάδες. Το σημείο αναφοράς με το πιο ενδιαφέρον όνομα από τη δέσμη, το HellaSwag, ήταν αυτό που το Gemini είχε χαμηλότερη απόδοση σε σύγκριση με το ChatGPT-4V. Ρίξτε μια ματιά στην πλήρη λίστα των σημείων αναφοράς.

Σύρετε για οριζόντια κύλιση

Ικανότητα	Σημείο αναφοράς	Περιγραφή	Gemini Ultra	GPT-4V
Γενικός	MMLU	Αναπαράσταση ερωτήσεων σε 57 θέματα (συμπ. STEM, ανθρωπιστικές επιστήμες και άλλα)	90,0% CoT@32*	86,4% 5 βολές* (αναφέρεται)
Αιτιολογία	Big-Bench Hard	Διαφορετικό σύνολο απαιτητικών εργασιών που απαιτούν συλλογισμό πολλών βημάτων	83,6% 3 βολές	83,1% 3 βολές (API),
Σειρά 2 - Κελί 0	ΠΤΩΣΗ	Κατανόηση ανάγνωσης (Βαθμολογία F1)	82.4 Μεταβλητές βολές	80,9 3-βολές (αναφέρεται)
Σειρά 3 - Κελί 0	HellaSwag	Κοινός συλλογισμός για καθημερινές εργασίες	87,8% 10 βολές*	95,3% 10 βολές* (αναφέρεται)
Μαθηματικά	GSM8K	Βασικοί αριθμητικοί χειρισμοί (συμπ. Προβλήματα μαθηματικών δημοτικού)	94,4% maj1@32	92,0% CoT 5 βολών (αναφέρθηκε)
Σειρά 5 - Κελί 0	ΜΑΘΗΜΑΤΙΚΑ	Προκλητικά μαθηματικά προβλήματα (συμπ. άλγεβρα, γεωμετρία, προ-λογισμός και άλλα)	53,2% 4-βολές	52,9% 4 βολών (API)
Κώδικας	HumanEval	Δημιουργία κώδικα Python	74,4% 0-σουτ (IT)*	67,0% 0-σουτ* (αναφέρθηκε)
Σειρά 7 - Κελί 0	Natural2Code	Δημιουργία κώδικα Python. Νέο συγκρατημένο σύνολο δεδομένων που μοιάζει με HumanEval, δεν έχει διαρρεύσει στον Ιστό	74,9% 0-σουτ	73,9% 0-shot (API)
Σειρά 8 - Κελί 0	Σειρά 8 - Κελί 1	Σειρά 8 - Κελί 2	Σειρά 8 - Κελί 3	Σειρά 8 - Κελί 4

Αν και αυτές οι βαθμολογίες είναι εντυπωσιακές, πιθανότατα δεν σημαίνουν έναν τόνο για τον μέσο καταναλωτή. Η Google που ωθεί το Gemini Nano στο Pixel 8 Pro είναι πιο συναρπαστικό για μένα, καθώς είναι ένα μοντέλο για εργασίες στη συσκευή. Πολλοί κατασκευαστές αρχίζουν να προσθέστε δυνατότητες AI στη συσκευή, όπως το TensorRT-LLM της NVIDIA στις συσκευές που κατασκευάζουν. Για μένα, αυτή είναι μια πιο συναρπαστική προοπτική για το μέλλον της τεχνητής νοημοσύνης, όπου μπορούμε να έχουμε αληθινούς προσωπικούς βοηθούς ενσωματωμένους στα τηλέφωνά μας και να προσαρμόσουμε το μοντέλο AI μας ώστε να λειτουργεί καλύτερα για τις ατομικές μας ανάγκες.

Μία από τις καλύτερες, και πιθανώς πιθανές, μελλοντικές εφαρμογές για αυτά τα LLM AI είναι κάτι που όλοι έχουμε ονειρευτεί από το Star Trek πριν από 80 και πλέον χρόνια. Ένας παγκόσμιος μεταφραστής γλώσσας. Το ChatGPT μπορεί ήδη να λειτουργήσει ως μεταφραστής, αλλά υπάρχει πολύ μεγάλος χρόνος επεξεργασίας για τη δημιουργία των μεταφράσεων. Υπάρχουν τώρα Μοντέλα τεχνητής νοημοσύνης που μπορούν να μεταφράσουν τη φωνητική δράση σε άλλη γλώσσα, διατηρώντας ανέπαφη τη φωνή του αρχικού ηθοποιού. Είμαι μεγάλος θαυμαστής των anime, καθώς και των ιαπωνικών και κορεατικών δραμάτων, θα ήθελα έναν κόσμο όπου μπορώ πατήστε ένα κουμπί στην τηλεόρασή μου και ακούστε τη φωνή των αρχικών ηθοποιών, αλλά απλώς την ακούστε στα Αγγλικά πραγματικός χρόνος. Καθώς αυτές οι μεγάλες εταιρείες ανταγωνίζονται για να ξεπεράσουν η μία την άλλη στην πρόοδο της τεχνητής νοημοσύνης, αυτή η πραγματικότητα πλησιάζει όλο και πιο κοντά.