AD

Άνθρωποι ξεπερνούν την τεχνητή νοημοσύνη σε διαγωνισμό μαθηματικών

Οι άνθρωποι ξεπέρασαν τα γενετικά μοντέλα τεχνητής νοημοσύνης που ανέπτυξαν η Google και η OpenAI σε έναν κορυφαίο διεθνή διαγωνισμό μαθηματικών, παρότι τα προγράμματα πέτυχαν για πρώτη φορά σκορ επιπέδου χρυσού μεταλλίου.

Κανένα μοντέλο δεν πέτυχε το απόλυτο σκορ – σε αντίθεση με πέντε νέους συμμετέχοντες στην Διεθνή Μαθηματική Ολυμπιάδα (IMO), έναν ετήσιο και υψηλού κύρους διαγωνισμό στον οποίο οι διαγωνιζόμενοι πρέπει να είναι κάτω των 20 ετών.

Η ΤΝ έφτασε το χρυσό – αλλά όχι την κορυφή

Η Google δήλωσε τη Δευτέρα ότι μια προχωρημένη εκδοχή του chatbot Gemini έλυσε πέντε από τα έξι μαθηματικά προβλήματα που τέθηκαν στην IMO, η οποία διεξήχθη αυτόν τον μήνα στο Κουίνσλαντ της Αυστραλίας.

«Μπορούμε να επιβεβαιώσουμε ότι το Google DeepMind πέτυχε το πολυπόθητο ορόσημο, κερδίζοντας 35 από τους 42 δυνατούς πόντους – σκορ χρυσού μεταλλίου», ανέφερε η αμερικανική τεχνολογική εταιρεία επικαλούμενη τον πρόεδρο της IMO, Γκρέγκορ Ντολινάρ.

«Οι λύσεις τους ήταν εντυπωσιακές από πολλές απόψεις. Οι βαθμολογητές της IMO τις θεώρησαν σαφείς, ακριβείς και ως επί το πλείστον εύκολες στην παρακολούθηση.»

Περίπου το 10% των ανθρώπινων διαγωνιζομένων κέρδισε χρυσό μετάλλιο, ενώ πέντε εξ αυτών πέτυχαν το απόλυτο σκορ των 42 πόντων.

Η κατασκευάστρια του ChatGPT, OpenAI, ανέφερε ότι το πειραματικό μοντέλο λογικής της πέτυχε σκορ 35 πόντων, δηλαδή χρυσού μεταλλίου, στη δοκιμασία.

Το αποτέλεσμα «πέτυχε μια μακροχρόνια πρόκληση της ΤΝ» στον «πιο υψηλού κύρους μαθηματικό διαγωνισμό στον κόσμο», έγραψε ο ερευνητής της OpenAI, Αλεξάντερ Γουέι, στα μέσα κοινωνικής δικτύωσης.

Ταχύτερη πρόοδος, περισσότερα ερωτήματα

«Αξιολογήσαμε τα μοντέλα μας στα προβλήματα της IMO 2025 σύμφωνα με τους ίδιους κανόνες που ισχύουν για τους ανθρώπινους διαγωνιζόμενους», είπε.

«Για κάθε πρόβλημα, τρεις πρώην κάτοχοι μεταλλίων της IMO βαθμολόγησαν ανεξάρτητα την υποβληθείσα απόδειξη του μοντέλου.»

Η Google είχε πετύχει σκορ αργυρού μεταλλίου στην περσινή IMO, η οποία έγινε στην πόλη Μπαθ του Ηνωμένου Βασιλείου, λύνοντας τέσσερα από τα έξι προβλήματα.

Αυτό είχε απαιτήσει δύο έως τρεις ημέρες υπολογισμών – πολύ περισσότερο χρόνο σε σχέση με φέτος, όπου το μοντέλο Gemini έλυσε τα προβλήματα εντός του χρονικού ορίου των 4,5 ωρών, σύμφωνα με την εταιρεία.

Η IMO δήλωσε ότι τεχνολογικές εταιρείες «δοκίμασαν ιδιωτικά μη ανοιχτού κώδικα μοντέλα ΤΝ στα φετινά προβλήματα», τα ίδια που αντιμετώπισαν οι 641 φοιτητές από 112 χώρες.

«Είναι πολύ ενθαρρυντικό να βλέπουμε πρόοδο στις μαθηματικές ικανότητες των μοντέλων τεχνητής νοημοσύνης», δήλωσε ο πρόεδρος της IMO, Ντολινάρ.

Οι διοργανωτές του διαγωνισμού δεν μπόρεσαν να επαληθεύσουν πόση υπολογιστική ισχύς χρησιμοποιήθηκε από τα μοντέλα ΤΝ ή αν υπήρξε ανθρώπινη παρέμβαση, προειδοποίησε.

 

 

Print Friendly, PDF & Email

AD

ΜΗΝ ΧΑΣΕΤΕ

ΗΠΑ: Ο Ντόναλντ Τραμπ ενδέχεται να ταξιδέψει στην Κίνα για να συναντήσει τον Σι σε ένα «όχι και τόσο μακρινό μέλλον»

Ο πρόεδρος των ΗΠΑ, Ντόναλντ Τραμπ, δήλωσε πως ενδέχεται να επισκεφθεί την Κίνα σύντομα για ένα ταξίδι ορόσημο, σε μια χρονική περίοδο εντάσεων μεταξύ των

Print Friendly, PDF & Email
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΑ >

Δημήτρης Μαρέδης: Η επιστολή παραίτησης από το Star μετά την καταδίκη για απόπειρα εκβίασης στη Ζέττα Μακρή

Ο Δημήτρης Μαρέδης γνωστοποίησε την παραίτησή του από το Star, μετά την καταδίκη του για απόπειρα εκβιασμού στη βουλευτή της Νέας Δημοκρατίας, Ζέττα Μακρή. Στην επιστολή του, που δημοσιεύεται

Print Friendly, PDF & Email
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΑ >

Ιράν: Καύσωνας με θερμοκρασίες που φθάνουν τους 53°C προκαλεί προβλήματα στην υδροδότηση και ηλεκτροδότηση

Κύμα καύσωνα που πλήττει το Ιράν προκαλεί προβλήματα στην υδροδότηση και ηλεκτροδότηση σε μεγάλο μέρος της χώρας καθώς οι δεξαμενές έχουν επηρεαστεί και η στάθμη

Print Friendly, PDF & Email
ΔΙΑΒΑΣΤΕ ΠΕΡΙΣΣΟΤΕΡΑ >