Το AI διαγνώσει καλύτερα από γιατρό; Η μεγαλύτερη μελέτη που έγινε ποτέ έδωσε απάντηση

Ένα νέο benchmark / πείραμα / έρευνα δοκιμάστηκε στη μεγαλύτερη μελέτη σύγκρισης και γιατρών που έχει γίνει ποτέ — και το αποτέλεσμα ήταν αρκετά ενοχλητικό για αρκετούς ειδικούς. Το μοντέλο δεν απλώς «τα κατάφερε καλά». Σε πολλές κατηγορίες, ξεπέρασε τους γιατρούς.

Η μελέτη δημοσιεύτηκε στις 30 Απριλίου 2026 στο επιστημονικό περιοδικό Science, από ομάδα ερευνητών του Harvard Medical School και του Beth Israel Deaconess Medical Center. Δεν μιλάμε για θεωρητικό πείραμα σε ελεγχόμενο εργαστήριο. Μιλάμε για πραγματικά ηλεκτρονικά αρχεία ασθενών από τμήματα επειγόντων — και ένα LLM που αξιολογούσε, διέγνωσε, πρότεινε επόμενα βήματα.

Αν αυτό δεν σε κάνει να σκεφτείς δύο φορές την επόμενη φορά που θα ψάξεις συμπτώματα στο , τότε ίσως αξίζει να διαβάσεις τι βρήκαν ακριβώς.

Τι δοκιμάστηκε — και πώς ακριβώς λειτούργησε το πείραμα

Η ομάδα χρησιμοποίησε ένα μεγάλο γλωσσικό μοντέλο (LLM) και το έβαλε απέναντι σε εκατοντάδες κλινικούς γιατρούς. Το framework δεν ήταν καινούργιο — βασίστηκε σε standards αξιολόγησης ιατρικής εκπαίδευσης που δημιουργήθηκαν στη δεκαετία του 1950. Αυτό που άλλαξε είναι ότι το AI αντιμετώπισε πραγματικές συνθήκες: δεδομένα από πραγματικά επείγοντα, με ατελείς πληροφορίες, ακριβώς όπως ένας γιατρός θα είχε διαθέσιμα.

Σε κάθε φάση της εξέτασης ασθενή — από την αρχική διαλογή (triage) έως την απόφαση εισαγωγής — το μοντέλο έλαβε μόνο τα δεδομένα που ήταν διαθέσιμα εκείνη τη στιγμή. Κανένα «απόρρητο» στοιχείο, κανένα πλεονέκτημα. Πρέπει να πούμε ότι αυτό είναι μια μεθοδολογική επιλογή που κάνει τη μελέτη ιδιαίτερα αξιόπιστη — και ιδιαίτερα δύσκολη να αμφισβητηθεί.

Τα αποτελέσματα που δεν περίμενε κανείς — ούτε οι ίδιοι οι ερευνητές

Το LLM ξεπέρασε τους γιατρούς σε τρεις βασικές κατηγορίες: λήψη αποφάσεων σε επείγοντα, αναγνώριση πιθανών διαγνώσεων, και πρόταση επόμενων θεραπευτικών βημάτων. «Δοκιμάσαμε το μοντέλο AI σε σχεδόν κάθε benchmark, και ξεπέρασε τόσο τα προηγούμενα μοντέλα όσο και τους γιατρούς που χρησιμοποιήσαμε ως baseline», δήλωσε ο συν-επικεφαλής συγγραφέας Arjun Manrai, αναπληρωτής καθηγητής Βιοϊατρικής Πληροφορικής στο Harvard Medical School.

Ακόμα πιο αποκαλυπτικό είναι το εξής: τα παλιά εργαλεία αξιολόγησης ιατρικού AI έχουν φτάσει στο ceiling τους. «Τα μοντέλα σκοράρουν κοντά στο 100% σε multiple-choice tests — δεν μπορούμε πλέον να μετρήσουμε πρόοδο γιατί έχουμε ήδη φτάσει στο ανώτατο όριο», εξήγησε ο συν-πρώτος συγγραφέας Peter Brodeur, κλινικός ερευνητής στο Beth Israel Deaconess. Αυτό δεν είναι μικρή λεπτομέρεια — σημαίνει ότι το πεδίο χρειάζεται νέα εργαλεία μέτρησης, και γρήγορα.

Το συμπέρασμα της έρευνας δεν είναι «το AI αντικαθιστά τους γιατρούς». Είναι κάτι πιο συγκεκριμένο: το medical AI έχει φτάσει σε σημείο που δικαιολογεί κλινικές δοκιμές — τις ίδιες αυστηρές δοκιμές που υποβάλλεται κάθε νέο φάρμακο ή χειρουργική τεχνική πριν εισαχθεί στην πράξη.

Τα όρια που το AI δεν ξεπερνά ακόμα — και δεν πρέπει να ξεχνάμε

Η μελέτη δεν αξιολόγησε αν το AI μπορεί να αντικαταστήσει τον γιατρό στο σύνολο της κλινικής πρακτικής. Δεν εξετάστηκαν η φυσική εξέταση ασθενή, η επικοινωνία με ασθενείς και οικογένειες, η διαχείριση έκτακτων καταστάσεων που δεν αποτυπώνονται σε αρχεία. Κι αυτά δεν είναι μικρά πράγματα.

Επιπλέον, η έρευνα έγινε σε ένα μεγάλο αμερικανικό νοσοκομείο με πλούσια ηλεκτρονικά αρχεία ασθενών. Η απόδοση σε συστήματα υγείας με λιγότερο δομημένα δεδομένα — όπως σε μεγάλο μέρος της Νότιας Ευρώπης — παραμένει άγνωστη. Επίσης, κανένα LLM δεν έχει ακόμα δοκιμαστεί σε prospective κλινική δοκιμή, δηλαδή σε πραγματικό νοσοκομείο, σε πραγματικό χρόνο, με πραγματικές συνέπειες για τον ασθενή.

Τρίτος περιορισμός: το ζήτημα της ευθύνης. Αν ένα AI διαγνώσει λάθος, ποιος είναι υπεύθυνος; Ο γιατρός που το χρησιμοποίησε; Ο κατασκευαστής του μοντέλου; Η νομοθεσία — ευρωπαϊκή και ελληνική — δεν έχει απαντήσει ακόμα σε αυτό.

Τι σημαίνει αυτό για την Ελλάδα και τον ευρωπαϊκό Νότο

Σύμφωνα με στοιχεία της Eurostat (2024), η Ελλάδα εμφανίζει έλλειψη 2.500–3.000 γιατρών σε αγροτικές και νησιωτικές περιοχές, ενώ ο μέσος χρόνος αναμονής για ειδικότητες στο ΕΣΥ ξεπερνά τους 4,5 μήνες σε αρκετές περιφέρειες. Σε αυτό το πλαίσιο, ένα αξιόπιστο διαγνωστικό AI εργαλείο δεν είναι θέμα τεχνολογικής πρόοδου — είναι θέμα πρόσβασης σε βασική υγειονομική φροντίδα.

Ήδη στην Ευρώπη αναπτύσσονται εργαλεία όπως το Meditron (EPFL) και διάφορες εκδόσεις βασισμένες σε GPT-4 για κλινική υποστήριξη. Ο EU AI Act, που τέθηκε σε ισχύ το 2024, κατατάσσει τα ιατρικά AI συστήματα στην κατηγορία «high-risk» — γεγονός που σημαίνει αυστηρές απαιτήσεις διαφάνειας και ανθρώπινης εποπτείας πριν από οποιαδήποτε κλινική εφαρμογή στην ΕΕ. Το Google COSMO είναι χαρακτηριστικό παράδειγμα του πώς η τεχνολογία AI ενσωματώνεται σταδιακά στην καθημερινότητα — από το smartphone ως το ιατρείο, η ίδια αρχιτεκτονική εξελίσσεται.

Η άποψη του TechNoid.gr: Ώρα να σταματήσουμε να τρεμοπαίζουμε

Η συζήτηση «θα μας αντικαταστήσει το AI;» είναι η λάθος ερώτηση — και μάλιστα βαρετή. Η σωστή ερώτηση είναι: πότε και υπό ποιες συνθήκες θα ενσωματωθεί το medical AI στο ΕΣΥ; Και για αυτό δεν χρειαζόμαστε φόβο ή ενθουσιασμό, χρειαζόμαστε πολιτική βούληση και ρυθμιστικό πλαίσιο.

Η μελέτη του Harvard δεν λέει ότι τα LLMs είναι «καλύτερα από γιατρούς» με τον τρόπο που ένα smartphone είναι καλύτερο από ένα φιλμ. Λέει ότι είναι αρκετά καλά ώστε να δικαιολογείται η επόμενη φάση δοκιμών. Ακριβώς όπως η ΕΕ απαιτεί αποδείξεις πριν επιτρέψει νέα ψηφιακά εργαλεία για ευπαθείς ομάδες, το ίδιο πρέπει να ισχύει και για το medical AI — με αξιολογήσεις σε ευρωπαϊκά, όχι μόνο αμερικανικά δεδομένα.

Κι αν κάποιο ελληνικό νοσοκομείο δεν έχει ακόμα δει αίτηση χρηματοδότησης από το Horizon Europe για AI-υποστηριζόμενη διάγνωση, αξίζει να ρωτήσει γιατί.

Συχνές Ερωτήσεις για το AI στην Ιατρική Διάγνωση

Μπορεί το AI να διαγνώσει ασθένειες καλύτερα από γιατρό;

Σύμφωνα με τη μελέτη του Harvard Medical School που δημοσιεύτηκε στο Science (Απρίλιος 2026), ένα LLM ξεπέρασε γιατρούς σε συγκεκριμένες κλινικές εργασίες, όπως διάγνωση και λήψη αποφάσεων σε επείγοντα. Ωστόσο, δεν έχει δοκιμαστεί ακόμα σε πραγματικές κλινικές συνθήκες με prospective trials.

Πότε θα χρησιμοποιείται AI στα ελληνικά νοσοκομεία;

Δεν υπάρχει επίσημο χρονοδιάγραμμα για το ΕΣΥ. Στην ΕΕ, ο AI Act (2024) ορίζει αυστηρές προϋποθέσεις για «high-risk» ιατρικά AI συστήματα, που σημαίνει ότι οποιαδήποτε κλινική εφαρμογή απαιτεί διαδικασία πιστοποίησης.

Ποιο AI χρησιμοποιήθηκε στη μελέτη του Harvard;

Η μελέτη δεν αποκαλύπτει δημόσια το συγκεκριμένο LLM που χρησιμοποιήθηκε, αλλά η ομάδα εργάστηκε με σύγχρονα μεγάλα γλωσσικά μοντέλα που τροφοδοτήθηκαν με πραγματικά ηλεκτρονικά αρχεία ασθενών από το Beth Israel Deaconess Medical Center.

Το medical AI αντικαθιστά τους γιατρούς;

Όχι με βάση τα σημερινά δεδομένα. Η έρευνα υποστηρίζει τη χρήση AI ως βοηθητικό εργαλείο — ειδικά για την ταχεία επεξεργασία πληροφοριών — υπό ανθρώπινη εποπτεία, και όχι ως αυτόνομο σύστημα λήψης αποφάσεων.

Ποιοι κίνδυνοι υπάρχουν από τη χρήση AI στην ιατρική;

Βασικοί κίνδυνοι περιλαμβάνουν: λανθασμένες διαγνώσεις σε μη αντιπροσωπευτικούς πληθυσμούς, ανεπαρκή δεδομένα εκπαίδευσης για μη αγγλόφωνα συστήματα υγείας, ζητήματα ευθύνης και απουσία φυσικής εξέτασης. Τα ζητήματα ψηφιακής ασφάλειας και ευθύνης είναι κεντρικά και σε άλλες τεχνολογικές εφαρμογές, όπως έχουμε δει και με πρόσφατες κυβερνοεπιθέσεις σε κρίσιμες υποδομές.

Πηγές:

Dimitris Marizas
Dimitris Marizashttps://technoid.gr
Μεταφράζω bits και bytes σε απλά ελληνικά. Λατρεύω την τεχνολογία που λύνει προβλήματα και αναζητώ πάντα το επόμενο "big thing" πριν γίνει mainstream.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -
- Advertisement -