Η πρόσφατη τοποθέτηση της Anthropic σχετικά με το μοντέλο τεχνητής νοημοσύνης Fable 5 έχει κεντρίσει το ενδιαφέρον της τεχνολογικής κοινότητας. Η εταιρεία παραδέχθηκε ότι είχε εφαρμόσει κρυφά μέτρα περιορισμού, τα οποία εμπόδισαν χρήστες, συμπεριλαμβανομένων ερευνητών και ανταγωνιστών, να αξιοποιήσουν πλήρως τις δυνατότητες του μοντέλου. Η ανακοίνωση της Anthropic εμφατικά υπογραμμίζει τη δέσμευσή της για αυξημένη διαφάνεια και χαρακτηρίζει μια σημαντική στροφή στην πολιτική της.
Εφαρμόζουμε αλλαγές για να κάνουμε ορατές τις διασφαλίσεις του Fable 5 για την ανάπτυξη συνόρων LLM.
Από αυτήν την εβδομάδα, τα αιτήματα που έχουν επισημανθεί θα επιστρέφουν εμφανώς στο Opus 4.8 — το ίδιο με τις διασφαλίσεις μας για τον κυβερνοχώρο και το βιογραφικό. Θα το βλέπετε αυτό κάθε φορά που συμβαίνει. Στο API, οποιαδήποτε επισημασμένη…
— ClaudeDevs (@ClaudeDevs) 11 Ιουνίου 2026
Η αναφορά στο Fable, το πρώτο μοντέλο στην κατηγορία Mythos της Anthropic, ενισχύει την ανησυχία για τους ενδεχόμενους κινδύνους που μπορεί να προκύψουν από την ευρεία κυκλοφορία του. Η εταιρεία έχει εκφράσει ανησυχίες για πιθανές καταχρίσεις, γι’ αυτό και ο Fable σχεδιάστηκε με ενσωματωμένες διασφαλίσεις για την αποφυγή ανταλλαγών πληροφοριών «υψηλού κινδύνου», ιδιαιτέρως σε τομείς όπως η απόσταξη μοντέλων.
Η Anthropic ανακοίνωσε επίσης ότι θα τροποποιεί τις απαντήσεις του μοντέλου σε περιπτώσεις όπου χρήστες προσπαθούν να διεξάγουν απόσταξη χωρίς προειδοποίηση. Οι ερωτήσεις που αναγνωρίζονται ως απόπειρες απόσταξης θα οδηγούνται στο Claude Opus 4.8, το προηγούμενο μοντέλο της εταιρείας. Η Anthropic δεσμεύεται να ενημερώνει τους χρήστες για οποιαδήποτε επιστροφή ερωτημάτων στον παλαιότερο αυτό μοντέλο, διαβεβαιώνοντάς τους ότι «θα το βλέπετε αυτό κάθε φορά που συμβαίνει».
Η τροποποιημένη αυτή προσέγγιση δείχνει την ευαισθητοποίηση της εταιρείας για την ασφάλεια της πληροφορίας και τη διαχείριση ερωτημάτων υψηλού κινδύνου, με την κατεύθυνση να δρομολογούνται μέσω του Opus 4.8, εκτός εάν αποκλειστεί από καθολικούς κανόνες ασφαλείας, όπως αυτά που σχετίζονται με τα ναρκωτικά ή τα όπλα. Όμως, κάποιες από αυτές τις περιοριστικές διασφαλίσεις προκαλούν αντιδράσεις, καθώς κρίνεται ότι ενδέχεται να περιορίζουν τη δυνατότητα πρόσβασης σε βασικές πληροφορίες σε τομείς όπως η βιολογία.
Η εταιρεία παραδέχθηκε ότι η αρχική πολιτική της για αόρατες διασφαλίσεις ήταν εσφαλμένη, σημειώνοντας ότι η ορατότητα στις προστασίες επιτρέπει μεγαλύτερη ευθυγράμμιση και γρηγορότερη αντίδραση με ελάχιστα ψευδώς θετικά αποτελέσματα. «Αυτό ήταν ένα λάθος αντάλλαγμα», δήλωσε εκπρόσωπος της Anthropic.
Αυτές οι αλλαγές έρχονται ως απάντηση στις έντονες κριτικές από την ερευνητική κοινότητα γύρω από την στρατηγική της Anthropic να περιορίζει τους χρήστες που κατατάσσονται ύποπτοι για απόπειρες αποσταγμένων ερωτήσεων στον Fable. Η εταιρεία αιτιολόγησε την ανάγκη αυτή για τη στόχευση των συγκεκριμένων αιτημάτων, υπογραμμίζοντας ότι οι χρήστες που χρησιμοποιούν τα μοντέλα της για την ανάπτυξη ανταγωνιστικών συστημάτων παραβιάζουν τους Όρους Παροχής Υπηρεσιών της.
Σε αυτή τη νέα φάση, η Anthropic εστιάζει στην εξισορρόπηση της καινοτομίας με τις απαιτήσεις ασφάλειας, γεγονός που αναδεικνύει την ανάγκη για υπεύθυνη χρήση της τεχνητής νοημοσύνης.
Πίστωση επιλεγμένης εικόνας

