Η OpenAI έχει ανακοινώσει μια σημαντική ενημέρωση για το μοντέλο GPT-5.5 Instant, το οποίο πλέον προσφέρει αντίστοιχες επιδόσεις με τα προηγούμενα μοντέλα όσον αφορά τις απαντήσεις σε ερωτήσεις που συνδέονται με θέματα υγείας. Οι βελτιώσεις στην ικανότητα του AI να παρέχει ακριβείς και αξιόπιστες πληροφορίες είναι κρισιμότερες από ποτέ, καθώς η δημόσια ανησυχία για την ακρίβεια των πληροφοριών υγείας που παρέχονται από την τεχνητή νοημοσύνη συνεχώς αυξάνεται. Πρόσφατη έρευνα του Guardian ανέφερε ανακριβείς απαντήσεις που κινητοποίησαν την Google να αναθεωρήσει ορισμένες από τις λειτουργίες της.
Σύμφωνα με την OpenAI, το νέο μοντέλο ξεπερνά τον προκάτοχό του, GPT-5.3 Instant, σε αξιολογήσεις από τις δικές τους εσωτερικές αξιολογήσεις HealthBench και HealthBench Professional. Αξιοσημείωτο είναι ότι παρατηρήθηκε μείωση κατά 71% στους δείκτες απαντήσεων που σχετίζονται με την υγεία και εντοπίστηκαν ζητήματα τεκμηρίωσης μέσα σε μόλις δύο μήνες παρακολούθησης.
Επιπλέον, η OpenAI ανέθεσε σε μια ομάδα γιατρών να συντάξει απαντήσεις σε ερωτήματα υγείας, και τα αποτελέσματα έδειξαν ότι οι απαντήσεις του GPT-5.5 Instant αξιολογήθηκαν πιο θετικά σε σύγκριση με αυτές που δόθηκαν από τους γιατρούς, σύμφωνα με κριτήρια ακρίβειας και πληρότητας σε 3.500 αλληλεπιδράσεις που εξετάστηκαν. Οι γιατροί επισήμαναν λιγότερες παραλείψεις σε κρίσιμες πληροφορίες σε συγκριτική ανάλυση με τις προηγούμενες εκδόσεις του AI.
Το HealthBench, που αξιολογείται από την OpenAI, έχει αναπτυχθεί μέσω της συνεισφοράς πάνω από 260 ειδικών από 60 χώρες, οι οποίοι έχουν αναλύσει περισσότερα από 700.000 παραδείγματα απαντήσεων. Αν και ο αριθμός των συμμετεχόντων γιατρών παρέμεινε σταθερός από την εκκίνηση του ChatGPT Health τον Ιανουάριο, τα αποτελέσματα δεν έχουν ακόμη δημοσιοποιηθεί για εξωτερική αναθεώρηση.
Περισσότεροι από 230 εκατομμύρια χρήστες συλλέγουν εβδομαδιαία πληροφορίες για θέματα υγείας και ευεξίας μέσω του ChatGPT, καθιστώντας αυτή τη διαδικασία μία από τις πιο σημαντικές για την πλατφόρμα. Η OpenAI απαγορεύει τις διαφημίσεις σε συζητήσεις σχετικά με την υγεία, ενισχύοντας την εστίασή της στη διασφάλιση ακριβών και αξιόπιστων πληροφοριών.
Μια ανάλυση από την Ahrefs αποκάλυψε ότι οι ιατρικές ερωτήσεις έχουν την υψηλότερη έκθεση σε περιεχόμενο που δημιουργείται από AI, δείχνοντας μια πιθανή αύξηση της ζήτησης για την δωρεάν έκδοση του ChatGPT. Η έμφαση στην ακρίβεια και η αξιοπιστία των απαντήσεων παραμένει αμφιλεγόμενη, καθώς οι ισχυρισμοί της OpenAI βασίζονται σε εσωτερικές μόνες διασφαλίσεις, αφήνοντας ανοιχτό το ενδεχόμενο προκλήσεων για εγκυρότητα.

