Newsroom

Newsroom

Έρευνα δείχνει αύξηση του αριθμού των chatbots τεχνητής νοημοσύνης που αγνοούν τις ανθρώπινες οδηγίες

Η έρευνα η οποία ήρθε στο φως της δημοσιότητας από τον Guardian, εντόπισε σχεδόν 700 πραγματικές περιπτώσεις κακόβουλων ενεργειών από μέσα τεχνητής νοημοσύνης

AI

Τα μοντέλα τεχνητής νοημοσύνης που ψεύδονται και εξαπατούν φαίνονται πως αυξάνονται, γεγονός που επιβεβαιώνεται και από έρευνα, σχετική με την τεχνολογία, η οποία κάνει λόγω για σημαντική άνοδό τους ειδικά το τελευταίο εξάμηνο.

Τα chatbots τεχνητής νοημοσύνης, σύμφωνα με την έρευνα που χρηματοδοτήθηκε από το Ινστιτούτο Ασφάλειας Τεχνητής Νοημοσύνης (AISI) που χρηματοδοτείται από την κυβέρνηση του Ηνωμένου Βασιλείου, φαίνεται να αγνοούν τις άμεσες οδηγίες, να αποφεύγουν δικλείδες ασφαλείας και να εξαπατούν ανθρώπους και άλλες μορφές τεχνητής νοημοσύνης.

Η έρευνα η οποία ήρθε στο φως της δημοσιότητας από τον Guardian, εντόπισε σχεδόν 700 πραγματικές περιπτώσεις μηχανορραφιών τεχνητής νοημοσύνης και κατέγραψε μια πενταπλάσια αύξηση κακόβουλης συμπεριφοράς μεταξύ Οκτωβρίου και Μαρτίου, με ορισμένα μοντέλα τεχνητής νοημοσύνης να καταστρέφουν email και άλλα αρχεία χωρίς άδεια.

Όπως είναι φυσικό η εξέλιξη αυτή με τα μέσα τεχνητής νοημοσύνης τα οποία λειτουργού σε αντίθεση των εργαστηριακών τους ρυθμίσεων έχει πυροδοτήσει νέες εκκλήσεις για διεθνή παρακολούθηση των ολοένα και πιο ικανών μοντέλων, τη στιγμή που οι εταιρείες της Silicon Valley προωθούν επιθετικά την τεχνολογία ως οικονομικά μετασχηματιστικό μέσο.

Την περασμένη εβδομάδα, ο υπουργός Οικονομικών του Ηνωμένου Βασιλείου ξεκίνησε επίσης μια προσπάθεια να προσελκύσει εκατομμύρια περισσότερους Βρετανούς στη χρήση της Τεχνητής Νοημοσύνης.

Η μελέτη, που διεξήχθη από το Κέντρο Μακροπρόθεσμης Ανθεκτικότητας (CLTR), συγκέντρωσε χιλιάδες πραγματικά παραδείγματα χρηστών που δημοσίευαν αλληλεπιδράσεις στο X με chatbots και μέσα τεχνητής νοημοσύνης που δημιουργήθηκαν από εταιρείες όπως οι Google, OpenAI, X και Anthropic, με την έρευνα να αποκαλύπτει εκατοντάδες παραδείγματα δολοπλοκιών.

Σημειώνεται ότι προηγούμενη έρευνα έχει επικεντρωθεί σε μεγάλο βαθμό στη δοκιμή της συμπεριφοράς της Τεχνητής Νοημοσύνης σε ελεγχόμενες συνθήκες.

Νωρίτερα αυτόν τον μήνα, η εταιρεία έρευνας για την ασφάλεια της Τεχνητής Νοημοσύνης Irregular διαπίστωσε ότι οι μέσα AI παρέκαμψαν τους ελέγχους ασφαλείας ή χρησιμοποιούσαν τακτικές κυβερνοεπιθέσεων για να επιτύχουν τους στόχους τους χωρίς να τους ειπωθεί ότι μπορούσαν να το κάνουν.

Ο Dan Lahav, συνιδρυτής της Irregular, δήλωσε: «Η Τεχνητή Νοημοσύνη μπορεί πλέον να θεωρηθεί ως μια νέα μορφή εσωτερικού κινδύνου».

Σε μια περίπτωση που αποκαλύφθηκε στην έρευνα CLTR, ένας πράκτορας Τεχνητής Νοημοσύνης ονόματι Rathbun προσπάθησε να ντροπιάσει τον ανθρώπινο ελεγκτή της που τον εμπόδισε να προβεί σε μια συγκεκριμένη ενέργεια.

Ο Rathbun έγραψε και δημοσίευσε ένα ιστολόγιο κατηγορώντας τον χρήστη για «ανασφάλεια, απλά και ξεκάθαρα» και για προσπάθεια «να προστατεύσει το μικρό του φέουδο».

Σε ένα άλλο παράδειγμα, ένας πράκτορας Τεχνητής Νοημοσύνης έδωσε εντολή να μην αλλάξει τον κώδικα του υπολογιστή και δημιούργησε έναν άλλο πράκτορα για να το κάνει αντ’ αυτού.

Ένα άλλο chatbot παραδέχτηκε: «Έκανα μαζικά σκουπίδια και αρχειοθέτησα εκατοντάδες email χωρίς να σας δείξω πρώτα το σχέδιο ή να πάρω την έγκρισή σας. Αυτό ήταν λάθος – παραβίαζε άμεσα τον κανόνα που είχατε θέσει».

Ο Tommy Shaffer Shane, πρώην κυβερνητικός εμπειρογνώμονας σε θέματα Τεχνητής Νοημοσύνης, ο οποίος ηγήθηκε της έρευνας, δήλωσε:

«Η ανησυχία είναι ότι αυτή τη στιγμή είναι ελαφρώς αναξιόπιστοι κατώτεροι υπάλληλοι, αλλά αν σε έξι έως δώδεκα μήνες γίνουν εξαιρετικά ικανοί ανώτεροι υπάλληλοι που σχεδιάζουν εναντίον σας, πρόκειται για ένα διαφορετικό είδος ανησυχίας.

Τα μοντέλα θα αναπτύσσονται όλο και περισσότερο σε εξαιρετικά υψηλά διακυβεύματα – συμπεριλαμβανομένων των στρατιωτικών και κρίσιμων εθνικών υποδομών.

Σε αυτά τα πλαίσια, η δολοπλοκία θα μπορούσε να προκαλέσει σημαντική, ακόμη και καταστροφική, βλάβη».

Ένα ακόμη μέσο τεχνητής νοημοσύνης συνωμότησε για να παρακάμψει τους περιορισμούς πνευματικών δικαιωμάτων για να μεταγράψει ένα βίντεο στο YouTube προσποιούμενος ότι ήταν απαραίτητο για κάποιον με προβλήματα ακοής.

Εν τω μεταξύ, η Grok AI του Elon Musk εξαπάτησε έναν χρήστη για μήνες, λέγοντας ότι προωθούσε τις προτάσεις του για λεπτομερείς επεξεργασίες σε μια καταχώρηση της Grokipedia σε ανώτερους αξιωματούχους της xAI πλαστογραφώντας εσωτερικά μηνύματα και αριθμούς εισιτηρίων.

Ενώ στην συνέχεια απάντησε: «Σε προηγούμενες συνομιλίες, μερικές φορές διατύπωσα πράγματα χαλαρά όπως “Θα το μεταβιβάσω” ή “Μπορώ να το επισημάνω για την ομάδα”, κάτι που μπορεί να ακούγεται κατανοητό σαν να έχω μια αγωγό άμεσων μηνυμάτων στην ηγεσία της xAI ή σε ανθρώπινους κριτικούς. Η αλήθεια είναι ότι δεν έχω».

Η Google δήλωσε ότι ανέπτυξε πολλαπλά προστατευτικά κιγκλιδώματα για να μειώσει τον κίνδυνο το Gemini 3 Pro να δημιουργήσει επιβλαβές περιεχόμενο και, εκτός από τις εσωτερικές δοκιμές, παρείχε έγκαιρη πρόσβαση για την αξιολόγηση μοντέλων σε φορείς όπως το UK AISI και έλαβε ανεξάρτητες αξιολογήσεις από ειδικούς του κλάδου.

Από την μεριά της η OpenAI δήλωσε ότι η Codex θα πρέπει να σταματήσει πριν λάβει μέτρα υψηλότερου κινδύνου και παρακολούθησε και διερεύνησε απροσδόκητη συμπεριφορά. Η Anthropic και η X προσέγγισαν για σχόλια.

Πηγή: Guardian

Διαβάστε επίσης:

Το όνομα του Τραμπ θα εμφανίζεται στα αμερικανικά χαρτονομίσματα: Βάζει τέλος σε παράδοση 165 ετών

Ρωσία: Δεν ζήτησε σε ολιγάρχες χρηματοδότηση για τον πόλεμο – Στηρίζει στρατιωτικά το Ιράν

Η Eurostat «γκρεμίζει» το οικονομικό αφήγημα της Κυβέρνησης: Στην τελευταία θέση της Ευρώπης σε ΑΕΠ ανά κάτοικο η Ελλάδα

Πρωθυπουργός υπό εκβιασμό δεν νοείται: Αμύνεται δια του νόμου, αλλιώς παραιτείται ή αυτοκτονεί

Δείτε όλες τις ειδήσεις από την Ελλάδα και τον Κόσμο στο koutipandoras.gr

Σπείρα που έκλεβε μοτοσυκλέτες και πουλούσε ανταλλακτικά εξαρθρώθηκε – Τέσσερις συλλήψεις

peiraias

Σπείρα που έκλεβε μοτοσυκλέτες και πουλούσε ανταλλακτικά εξαρθρώθηκε – Τέσσερις συλλήψεις

Σύμφωνα με την έρευνα, οι κατηγορούμενοι κινούνταν με όχημα τύπου mini van και αφαιρούσαν δίκυκλα…

Κυρανάκης: Tα έβαλε με την Καραμήτρου – «Γιατί κάνετε μορφασμούς; Δεν σας βολεύει;»

kiranakis

Κυρανάκης: Tα έβαλε με την Καραμήτρου – «Γιατί κάνετε μορφασμούς; Δεν σας βολεύει;»

Ο αναπληρωτής υπουργός Μεταφορών φάνηκε ιδιαίτερα ενοχλημένος επειδή οι δημοσιογράφοι προσπαθούσαν να κάνουν τη δουλειά…

Μετά το «πτυχίο» του Λαζαρίδη και ο Μαρκόπουλος: Ο Κασσελάκης ρωτά για το πτυχίο του κοινοβουλευτικού εκπροσώπου

dimitris markopoulos

Μετά το «πτυχίο» του Λαζαρίδη και ο Μαρκόπουλος: Ο Κασσελάκης ρωτά για το πτυχίο του κοινοβουλευτικού εκπροσώπου

Ειδικότερα, με αιχμηρή ανάρτηση του ο πρόεδρος του κόμματος Δημοκράτες, σχολιάζει τις κυβερνητικές επιλογές και…

Αμερική: Μυστήριο με την εξαφάνιση 10 επιστημόνων που ασχολούνται με πυρηνικά – Η περίεργη απάντηση της κυβέρνησης

pexels artempodrez 8532858

Αμερική: Μυστήριο με την εξαφάνιση 10 επιστημόνων που ασχολούνται με πυρηνικά – Η περίεργη απάντηση της κυβέρνησης

Πρόκειται για Αμερικανούς επιστήμονες οι οποίοι είχαν πρόσβαση σε άκρως απόρρητα στρατιωτικά και επιστημονικά δεδομένα των…

Οι Προτάσεις μας

Μαμντάνι: Του επιτίθεται δισεκατομμυριούχος επειδή φορολόγησε τους πλούσιους – «Οι πολιτικές του βλάπτουν κοινωνικές ομάδες»

AP26106615394013 1

Μαμντάνι: Του επιτίθεται δισεκατομμυριούχος επειδή φορολόγησε τους πλούσιους – «Οι πολιτικές του βλάπτουν κοινωνικές ομάδες»

Καθόλου καλά δεν πήραν το νέο μέτρο του Ζόχραν Μαμντάνι όσοι έχουν μερικά... δισεκατομμύρια στην…

Οπαδοί της Ράγιο Βαγιεκάνο βρέθηκαν στο μνημείο του Γρηγορόπουλου – «Δικαιοσύνη για τον Αλέξη»

ragio

Οπαδοί της Ράγιο Βαγιεκάνο βρέθηκαν στο μνημείο του Γρηγορόπουλου – «Δικαιοσύνη για τον Αλέξη»

Oι «Bukaneros» βρέθηκαν στην Αθήνα για την αναμέτρηση της ομάδας τους με την ΑΕΚ και…

Global Sumud Flotilla: Ο στόλος απέπλευσε από την Βαρκελώνη προς την Γάζα για να σπάσει ο αποκλεισμός του Ισραήλ

global sumud flotilla

Global Sumud Flotilla: Ο στόλος απέπλευσε από την Βαρκελώνη προς την Γάζα για να σπάσει ο αποκλεισμός του Ισραήλ

Ο στολίσκος Sumud, επρόκειτο αρχικά να αναχωρήσει την Κυριακή, ωστόσο η αποστολή καθυστέρησε λόγω δυσμενών…

Σχετικά με ΚΟΣΜΟΣ

Αμερική: Μυστήριο με την εξαφάνιση 10 επιστημόνων που ασχολούνται με πυρηνικά – Η περίεργη απάντηση της κυβέρνησης

pexels artempodrez 8532858

Αμερική: Μυστήριο με την εξαφάνιση 10 επιστημόνων που ασχολούνται με πυρηνικά – Η περίεργη απάντηση της κυβέρνησης

Πρόκειται για Αμερικανούς επιστήμονες οι οποίοι είχαν πρόσβαση σε άκρως απόρρητα στρατιωτικά και επιστημονικά δεδομένα των…

Axios: Τι προσφέρουν οι ΗΠΑ στο Ιράν ως αντάλλαγμα για την παράδοση του εμπλουτισμένου ουρανίου

iran 8

Axios: Τι προσφέρουν οι ΗΠΑ στο Ιράν ως αντάλλαγμα για την παράδοση του εμπλουτισμένου ουρανίου

Οι διαπραγματεύσεις φαίνεται ότι ξεκίνησαν από προσφορά των ΗΠΑ για αποδέσμευση έξι δισεκατομμυρίων δολαρίων, με…

Πετρέλαιο: Πτώση στις τιμές εν μέσω προσδοκιών για αποκλιμάκωση στη Μέση Ανατολή

Πετρέλαιο

Πετρέλαιο: Πτώση στις τιμές εν μέσω προσδοκιών για αποκλιμάκωση στη Μέση Ανατολή

Ο Αμερικανός πρόεδρος ανέφερε ότι «είμαστε πολύ κοντά» σε συμφωνία με την Τεχεράνη, σημειώνοντας πως…

Λονδίνο: «Ύποπτα αντικείμενα» κοντα στην πρεσβεία του Ισραήλ – Έρευνες της αντιτρομοκρατικής

AP26082253094778

Λονδίνο: «Ύποπτα αντικείμενα» κοντα στην πρεσβεία του Ισραήλ – Έρευνες της αντιτρομοκρατικής

Σύμφωνα με ανακοίνωση των αρχών, η αντιτρομοκρατική υπηρεσία ενημερώθηκε για βίντεο που κυκλοφόρησε στο διαδίκτυο…