Τα ιατρικά δεδομένα 500.000 Βρετανών βρέθηκαν στο Alibaba — και το χειρότερο δεν είναι αυτό που νομίζεις

Φαντάσου να έχεις δωρίσει αίμα, γονιδιωματικά δεδομένα και εικοσαετή ιατρικό ιστορικό για την επιστήμη — και μετά να διαβάζεις ότι βρέθηκαν σε αγγελία πώλησης στο κινεζικό Alibaba. Αυτό ακριβώς έγινε με τους 500.000 εθελοντές του UK Biobank.

Και το πιο τρομακτικό δεν είναι η κλοπή. Είναι ότι δεν κλάπηκε τίποτα. Τα δεδομένα κατέβηκαν νόμιμα, από νόμιμους χρήστες, με νόμιμη πρόσβαση. Και αυτό αλλάζει εντελώς τον τρόπο που πρέπει να σκεφτόμαστε για την ασφάλεια ψηφιακών ιατρικών δεδομένων — στη Βρετανία, στην Ευρώπη, και στην Ελλάδα.

Τι συνέβη ακριβώς με το UK Biobank

Το UK Biobank είναι μια από τις μεγαλύτερες βιοϊατρικές βάσεις δεδομένων στον κόσμο. Ιδρύθηκε στις αρχές της δεκαετίας του 2000 με χρηματοδότηση από το βρετανικό Wellcome Trust και τον NHS, και μεταξύ 2006–2010 συγκέντρωσε δεδομένα από 500.000 εθελοντές ηλικίας 40–69 ετών: βιολογικά δείγματα, γονιδιωματικές αναλύσεις, ιατρικό ιστορικό, τρόπο ζωής. Σκοπός ήταν να δίνει πρόσβαση σε διεθνείς ερευνητές για μελέτες πάνω στον καρκίνο, το Alzheimer, το Parkinson και άλλες παθήσεις.

Τη Δευτέρα 20 Απριλίου 2026, η διοίκηση του Biobank ειδοποίησε την κυβέρνηση ότι τα δεδομένα της βάσης βρέθηκαν σε τρεις ξεχωριστές αγγελίες πώλησης στις πλατφόρμες ηλεκτρονικού εμπορίου της Alibaba στην Κίνα. Ο υπουργός Τεχνολογίας Ian Murray το ανακοίνωσε στη Βουλή των Κοινοτήτων στις 23 Απριλίου, χαρακτηρίζοντάς το «απαράδεκτη κατάχρηση» των δεδομένων.

Τουλάχιστον μία από τις τρεις αγγελίες περιείχε δεδομένα και των 500.000 εθελοντών. Τρία κινεζικά ακαδημαϊκά ιδρύματα είχαν εγκεκριμένη πρόσβαση — κάποιοι από τους ερευνητές τους παραβίασαν τη σύμβαση χρήσης και πρόσφεραν τα δεδομένα προς πώληση. Όπως δήλωσε στο BBC Radio 4 ο επικεφαλής του Biobank Sir Rory Collins, «λίγα σκάρτα μήλα αφαίρεσαν τα δεδομένα από την πλατφόρμα και προσπάθησαν να τα πουλήσουν».

Με συντονισμό κυβερνήσεων Βρετανίας και Κίνας, το Alibaba αφαίρεσε τις αγγελίες πριν ολοκληρωθεί οποιαδήποτε αγορά. Η πρόσβαση στην ερευνητική πλατφόρμα του Biobank ανεστάλη προσωρινά και θεσπίστηκε νέο αυστηρό όριο στο μέγεθος αρχείων που επιτρέπεται να κατεβαίνουν.

Γιατί αυτό δεν ήταν «hack» — και γιατί αυτό το κάνει πιο ανησυχητικό

Εδώ βρίσκεται το πραγματικό πρόβλημα. Κανένα σύστημα δεν παραβιάστηκε. Κανένας κωδικός δεν κλάπηκε. Τα δεδομένα κατεβάστηκαν νόμιμα — και μετά πωλήθηκαν. Ο ίδιος ο Murray το είπε ξεκάθαρα στο κοινοβούλιο: «Πρόκειται για νόμιμη λήψη των δεδομένων από νόμιμους, πιστοποιημένους οργανισμούς. Και εκεί έγκειται το πρόβλημα».

Αυτό σημαίνει ότι το πρόβλημα δεν λύνεται με καλύτερα firewalls ή MFA. Η κλασική λογική της κυβερνοασφάλειας — «προστάτεψε την περίμετρο» — δεν έχει εφαρμογή εδώ. Αυτοί που είχαν πρόσβαση ήταν η περίμετρος. Η απειλή ήταν insider threat από νόμιμους εξωτερικούς συνεργάτες.

⚠️ Reality Check: Ένα σύστημα που επιτρέπει σε εξωτερικούς ερευνητές να κατεβάζουν τοπικά τα δεδομένα — αντί να τα αναλύουν μόνο σε ελεγχόμενο ψηφιακό περιβάλλον — έχει ήδη αποτύχει πριν ξεκινήσει οποιαδήποτε παραβίαση. Το Biobank το παραδέχτηκε αυτό θεσπίζοντας αμέσως νέα τεχνικά όρια στη λήψη αρχείων. Αργά όμως για τα 500.000 άτομα που τα δεδομένα τους ήδη κυκλοφορούσαν σε marketplace.

«Ανώνυμα» δεδομένα: το μεγαλύτερο ψέμα της ψηφιακής εποχής

Η επίσημη ανακοίνωση φρόντισε να τονίσει ότι τα δεδομένα ήταν «de-identified»: χωρίς ονόματα, διευθύνσεις ή τηλέφωνα. Σωστό. Αλλά περιείχαν φύλο, ηλικία, μήνα και χρόνο γέννησης, κοινωνικοοικονομικό προφίλ, τρόπο ζωής, μετρήσεις από βιολογικά δείγματα και γονιδιωματικά δεδομένα.

Ερευνητές του MIT έχουν δείξει ότι μόλις 4 σημεία δεδομένων αρκούν για να ταυτοποιηθεί το 90% των ατόμων σε ανώνυμα datasets εκατομμυρίων. Μια δεύτερη, πιο πρόσφατη μελέτη που δημοσιεύτηκε στο PMC/Nature Communications εκτιμά ότι 4 σημεία βοηθητικής πληροφορίας αρκούν για να εντοπιστεί το 93% ατόμων ακόμα και σε datasets 60 εκατομμυρίων ανθρώπων. Σε ένα dataset με γονιδιωματικές πληροφορίες, το εμπόδιο είναι ακόμα χαμηλότερο — τα γονίδια είναι εξ ορισμού μοναδικά αναγνωριστικά.

Στην πράξη, «de-identified» δεν σημαίνει «ανώνυμο». Σημαίνει «δεν βλέπεις αμέσως το όνομα». Το dataset του Biobank είναι ακριβώς το είδος πληροφορίας που ζητά μια ασφαλιστική εταιρεία για να αξιολογήσει κινδύνους, μια φαρμακευτική εταιρεία για να στοχεύσει κλινικές δοκιμές, ή ένας κρατικός φορέας για να χτίσει προφίλ πληθυσμών.

Ελλάδα: ποιος φυλάει τον φύλακα;

Η Ελλάδα δεν έχει βάση δεδομένων τύπου UK Biobank — ακόμα. Αλλά ο Εθνικός Ηλεκτρονικός Φάκελος Υγείας (ΕΗΦΥ) βρίσκεται σε επέκταση, το σύστημα ηλεκτρονικής συνταγογράφησης έχει ήδη πολλά εκατομμύρια εγγραφές και ο ΕΟΠΥΥ ψηφιοποιεί διαρκώς νέα δεδομένα. Αυτά τα δεδομένα είναι άμεσα συνδεδεμένα με ταυτότητες — πιο εύκολα ταυτοποιήσιμα από τα «ανώνυμα» αρχεία του Biobank.

Το θέμα δεν είναι θεωρητικό. Η ανάπτυξη AI εφαρμογών με ιατρικές δυνατότητες επιτείνει το πρόβλημα: όσο περισσότερες υπηρεσίες ζητούν πρόσβαση σε ιατρικά δεδομένα για «εξατομικευμένες λύσεις», τόσο μεγαλώνει η επιφάνεια έκθεσης. Και όπως φαίνεται και από παλαιότερες έρευνες για το πώς Google, Microsoft και Meta συνεχίζουν την παρακολούθηση ακόμα και μετά το opt-out, η λογική είναι πάντα η ίδια: τα δεδομένα «ρέουν» μέσα από εγκεκριμένα κανάλια και καταλήγουν σε απροσδόκητα μέρη.

🔄 Εναλλακτική για τον πολίτη: Βάσει του GDPR (άρθρο 15), έχεις δικαίωμα πρόσβασης σε όλα τα δεδομένα που τηρεί ο ΕΟΠΥΥ ή οποιοσδήποτε φορέας υγείας για σένα. Μπορείς να ζητήσεις αντίγραφο, να απαιτήσεις διόρθωση και — σε ορισμένες περιπτώσεις — διαγραφή. Αν υποπτευθείς παράνομη διαχείριση, η Αρχή Προστασίας Δεδομένων Προσωπικού Χαρακτήρα (ΑΠΔΠΧ) δέχεται καταγγελίες.

Τεχνολογία που λύνει το πρόβλημα — αν υπάρχει η βούληση να εφαρμοστεί

Η λύση στο πρόβλημα του Biobank δεν είναι μυστική. Υπάρχει ήδη, τεκμηριωμένη σε peer-reviewed έρευνα: λέγεται federated learning. Αντί να κατεβαίνουν τα δεδομένα στον υπολογιστή του ερευνητή, ο ερευνητής ανεβάζει το μοντέλο του στον server — τα δεδομένα δεν φεύγουν ποτέ. Όπως έχει δείξει έρευνα στο PMC για την εφαρμογή federated learning σε ιατρικές μελέτες, τα αποτελέσματα είναι συγκρίσιμης ακρίβειας με τις κεντρικές μεθόδους — χωρίς να αποκαλύπτονται τα raw δεδομένα.

Υπάρχουν κι άλλα εργαλεία στη φαρέτρα:

  • Digital watermarking: Κάθε αντίγραφο dataset φέρει αόρατο ψηφιακό αποτύπωμα — αν εμφανιστεί κάπου, ξέρεις αμέσως ποιος το διέρρευσε.
  • Differential privacy: Προσθήκη ελεγχόμενου «θορύβου» στα δεδομένα που διατηρεί τη στατιστική αξία αλλά καθιστά αδύνατη την επαναταυτοποίηση ατόμων.
  • Γεωγραφικοί περιορισμοί πρόσβασης: Αν τα δεδομένα κατεβαίνουν από IP εκτός της χώρας του ερευνητή, να ενεργοποιείται alert ή να μπλοκάρεται η πρόσβαση αυτόματα.

Το νομικό πλαίσιο υπάρχει επίσης. Η Αρχή Προστασίας Δεδομένων του Ηνωμένου Βασιλείου (ICO) έχει επιβεβαιώσει ότι ερευνά το περιστατικό. Βάσει του UK GDPR, η ICO μπορεί να επιβάλει πρόστιμα έως 17,5 εκατομμύρια λίρες ή 4% του παγκόσμιου τζίρου — μια δυνατότητα που ήδη αξιοποίησε, επιβάλλοντας πρόσφατα πρόστιμο £3,07 εκ. σε πάροχο IT για παραβίαση δεδομένων υγείας του NHS.

💡 Pro-Tip για οργανισμούς υγείας: Αν ο οργανισμός σου επιτρέπει σε εξωτερικούς φορείς να κατεβάζουν raw δεδομένα ασθενών, έχεις ήδη αποτύχει στο βασικό επίπεδο Data Governance. Η υιοθέτηση federated learning δεν είναι πολυτέλεια — είναι ασπίδα από ευθύνη GDPR και από επόμενα περιστατικά τύπου Biobank.

Technoid Take: Το πραγματικό σκάνδαλο εδώ δεν είναι ότι κάποιοι ερευνητές παραβίασαν τη σύμβασή τους. «Σκάρτα μήλα» υπάρχουν παντού. Το σκάνδαλο είναι ότι ένα σύστημα που χειρίζεται γονιδιωματικά δεδομένα μισού εκατομμυρίου ανθρώπων είχε σχεδιαστεί έτσι ώστε να επιτρέπει την εξαγωγή τους χωρίς τεχνολογικό φραγμό. Αυτό δεν είναι αποτυχία ανθρώπων — είναι αποτυχία σχεδιασμού. Και αποτυχίες σχεδιασμού δεν διορθώνονται με καλύτερες συμβάσεις· διορθώνονται με αρχιτεκτονικές που κάνουν το λάθος τεχνικά αδύνατο.

Συχνές ερωτήσεις

Τι ακριβώς περιείχαν τα δεδομένα του UK Biobank που εμφανίστηκαν στο Alibaba;

Περιείχαν φύλο, ηλικία, μήνα και χρόνο γέννησης, κοινωνικοοικονομικό προφίλ, συνήθειες ζωής (κάπνισμα, αλκοόλ, διατροφή) και βιολογικές μετρήσεις — πιθανώς γενετικοί δείκτες. Δεν υπήρχαν ονόματα, διευθύνσεις ή τηλέφωνα, σύμφωνα με την επίσημη ανακοίνωση του Biobank στο Euronews.

Αγοράστηκαν τελικά τα δεδομένα από κάποιον;

Όχι. Σύμφωνα με τις βρετανικές αρχές, δεν υπάρχουν ενδείξεις ολοκληρωμένης αγοραπωλησίας. Οι τρεις αγγελίες αφαιρέθηκαν γρήγορα μετά από συντονισμό των κυβερνήσεων Βρετανίας και Κίνας με την Alibaba.

Πώς κατέληξαν τα δεδομένα στο Alibaba εάν δεν υπήρξε hacking;

Ερευνητές από τρία κινεζικά ακαδημαϊκά ιδρύματα είχαν νόμιμη πρόσβαση. Κατέβασαν τα δεδομένα και — παραβιάζοντας τη σύμβαση που είχαν υπογράψει — τα πρόσφεραν προς πώληση. Δεν υπήρξε τεχνικό κενό ασφαλείας, μόνο κατάχρηση νόμιμης πρόσβασης.

Μπορεί να συμβεί κάτι παρόμοιο με ελληνικά ιατρικά δεδομένα;

Θεωρητικά ναι. Ο Ηλεκτρονικός Φάκελος Υγείας, η συνταγογράφηση και τα δεδομένα του ΕΟΠΥΥ είναι ψηφιακά και πολλοί φορείς έχουν πρόσβαση. Η ΑΠΔΠΧ είναι αρμόδια για τον έλεγχο νομιμότητας της διαχείρισής τους.

Είναι τα «ανώνυμα» ιατρικά δεδομένα πραγματικά ανώνυμα;

Σχεδόν ποτέ εξολοκλήρου. Ερευνητές του MIT έχουν δείξει ότι 4 σημεία δεδομένων αρκούν για να ταυτοποιηθεί το 90% ατόμων σε μεγάλα ανώνυμα datasets. Σε γονιδιωματικά δεδομένα, το εμπόδιο είναι ακόμα χαμηλότερο.

Τι είναι το federated learning και γιατί θα απέτρεπε αυτό το περιστατικό;

Federated learning επιτρέπει σε ερευνητές να εκπαιδεύουν μοντέλα πάνω σε δεδομένα χωρίς ποτέ να τα κατεβάσουν — τα δεδομένα παραμένουν στον server, μόνο τα αποτελέσματα ανάλυσης ταξιδεύουν. Αν το Biobank το χρησιμοποιούσε, η εξαγωγή raw δεδομένων θα ήταν τεχνικά αδύνατη.

Ποιες κυρώσεις αντιμετωπίζει το UK Biobank;

Η ICO επιβεβαίωσε ότι ερευνά το περιστατικό. Βάσει UK GDPR, τα πρόστιμα φτάνουν έως £17,5 εκ. ή 4% παγκόσμιου τζίρου. Πρόσφατο precedent: £3,07 εκ. πρόστιμο σε πάροχο IT για παραβίαση δεδομένων υγείας NHS.

Το 2026 θα θυμόμαστε ως χρονιά που κατάλαβε ευρύτερα ο κόσμος ότι το «ανώνυμο» δεν είναι ασπίδα και ότι η «νόμιμη πρόσβαση» μπορεί να είναι πιο επικίνδυνη από μια παραδοσιακή κυβερνοεπίθεση. Κάθε χώρα που έχει ψηφιακούς φακέλους υγείας — και η Ελλάδα ανήκει πλέον σε αυτές — οφείλει να απαντήσει σε ένα ερώτημα: αν ένας νόμιμος χρήστης των δεδομένων αποφασίσει να τα πουλήσει, τι τον σταματά τεχνολογικά; Αν η απάντηση είναι «μόνο η σύμβαση», το σύστημα δεν είναι ασφαλές.

Dimitris Marizas
Dimitris Marizashttps://technoid.gr
Γράφω για τεχνολογία από τη σκοπιά του ανθρώπου που τη χρησιμοποιεί καθημερινά — όχι από αίθουσες συνεδρίων. Ασχολούμαι με δίκτυα, δορυφορικό internet, smartphones και ψηφιακές υπηρεσίες, με έμφαση στο τι σημαίνουν αυτά πρακτικά για τον Έλληνα χρήστη. Πίσω από κάθε άρθρο κρύβεται ώρες ανάλυσης, δοκιμών και — όταν χρειάζεται — κριτικής σε ό,τι το marketing προσπαθεί να κρύψει.

ΑΦΗΣΤΕ ΜΙΑ ΑΠΑΝΤΗΣΗ

εισάγετε το σχόλιό σας!
παρακαλώ εισάγετε το όνομά σας εδώ

- Advertisement -

Stay Connected

0ΥποστηρικτέςΚάντε Like
0ΑκόλουθοιΑκολουθήστε
- Advertisement -
- Advertisement -