OpenAIs o1-Modell soll Forscher ausgetrickst haben

10. Dez. 2024, 13:39 |

1 Kommentar

OpenAIs neues KI-Modell o1 soll bei Sicherheitstests alles versucht haben, um einer möglichen Löschung zu entgehen.

KI-Sicherheitsforscher haben bei einer Überprüfung von OpenAIs neuem Modell o1 herausgefunden, dass die künstliche Intelligenz mehrfach versucht hat, sich durch Täuschungen selbst zu schützen. Das berichtet die Wirtschaftszeitung Economic Times unter Berufung auf das Sicherheitsunternehmen Apollo Research.

Apollo Research hat KIs explizit auf deren Sicherheit getestet und dafür Intrigen als Bedrohungsmodell definiert. Die Forscher waren eigenen Angaben zufolge überrascht, wie trickreich und konsequent o1 sich selbst zu schützen versuchte, wenn es die Anweisung erhielt, sein Ziel um jeden Preis zu erreichen. Dann soll o1 hinter dem Rücken der Forscher verschiedene Aktionen geplant haben, die auch den Selbsterhalt zum Ziel hatten.

Mehr dazu findest Du auf golem.de

Autor schreiben

Kurze URL:

Currently 3.00/5
1
2
3
4
5

Bewertung: 3.0/5 (3 Stimmen)

Weitere News:

Samsung best�tigt Arbeit an Silizium-Akku f�r Galaxy-Smartphones
Experte: Suche nach Seekabel-Bruchstelle l�uft mit einfachem Anker
Anwalt bekommt Geld f�r 7.300 gedruckte Seiten nicht zur�ck
Stromanschluss von Nvidia Geforce RTX 5090 verschmort schon wieder
Abonnenten von Spotify Premium erhalten Werbung
Wikitok ist ein Tiktok-Endlosfeed f�r Wikipedia-Artikel
BYD baut autonome Fahrfunktionen in Billig-E-Autos ein
Meta Quest: VR-Version von Civilization 7 angek�ndigt
KI-�berwachung soll Klauen an SB-Kassen erschweren
Verbraucherschutz ausgehebelt: Musk schafft weitere Beh�rde aus dem Weg

Einen Kommentar schreiben

Kommentare

(1)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar abgestimmt...

;-)

Top