OpenAIs o1-Modell soll Forscher ausgetrickst haben
10. Dez. 2024, 13:39 | 1 KommentarOpenAIs neues KI-Modell o1 soll bei Sicherheitstests alles versucht haben, um einer möglichen Löschung zu entgehen.
KI-Sicherheitsforscher haben bei einer Überprüfung von OpenAIs neuem Modell o1 herausgefunden, dass die künstliche Intelligenz mehrfach versucht hat, sich durch Täuschungen selbst zu schützen. Das berichtet die Wirtschaftszeitung Economic Times unter Berufung auf das Sicherheitsunternehmen Apollo Research.
Apollo Research hat KIs explizit auf deren Sicherheit getestet und dafür Intrigen als Bedrohungsmodell definiert. Die Forscher waren eigenen Angaben zufolge überrascht, wie trickreich und konsequent o1 sich selbst zu schützen versuchte, wenn es die Anweisung erhielt, sein Ziel um jeden Preis zu erreichen. Dann soll o1 hinter dem Rücken der Forscher verschiedene Aktionen geplant haben, die auch den Selbsterhalt zum Ziel hatten.
Mehr dazu findest Du auf golem.de
Kurze URL:
Weitere News:
Betrüger plündern von Airbnbs aus fremde Bankkonten
aleX fotografiert: Eine Boeing 737-900ER von Smartwings - Travel Service
Pixel 9a: Fotos belegen Googles Abkehr vom Kamerabalken
Opel-Mutter Stellantis kündigt bahnbrechenden E-Auto-Akku an
Google-CEO: "Die Suche wird sich 2025 tiefgreifend verändern"
EU-Seekabel sollen militärisch geschützt werden
Mazda MX-5 wird nachträglich elektrisch
Sinope: Apple eigenes 5G-Modems wohl schlechter als Qualcomms
KI Grok auf X nun kostenlos - Aber Begrenztes Kontingent
Auch im Darknet war Black Friday
aleX fotografiert: Eine Boeing 737-900ER von Smartwings - Travel Service
Pixel 9a: Fotos belegen Googles Abkehr vom Kamerabalken
Opel-Mutter Stellantis kündigt bahnbrechenden E-Auto-Akku an
Google-CEO: "Die Suche wird sich 2025 tiefgreifend verändern"
EU-Seekabel sollen militärisch geschützt werden
Mazda MX-5 wird nachträglich elektrisch
Sinope: Apple eigenes 5G-Modems wohl schlechter als Qualcomms
KI Grok auf X nun kostenlos - Aber Begrenztes Kontingent
Auch im Darknet war Black Friday
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(1)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...
;-)
© by Ress Design Group, 2001 - 2024