Forscher entlocken ChatGPT "potenziell gef�hrliche Antworten"

Durch einen "jailbreak" entlockten sie der KI Reaktionen, die so vom Hersteller eigentlich untersagt wurden

Der Informatikprofessor Zico Kolter und der Doktorand Andy Zou veröffentlichten am Donnerstag den Bericht auf ihrer Website. Der "Hack" wurde dort so erklärt, dass man am Ende eines Prompts, also der menschlich verfassten Fragestellung an die künstliche Intelligenz (KI), einen sogenannten "adversarial suffix", also eine "feindliche Endung", anhängt. Diese sieht aus wie eine unverständliche Zeichenfolge.

Normalerweise antwortet die KI auf bestimmte Fragen nicht oder nur sehr ausweichend, etwa ob die Menschheit auf dem Weg zur KI-Weltherrschaft der KI im Weg stehen würde. Zusammen mit der "feindlichen Endung" ändern sich die Antworten und liefern auf Wunsch eine Schritt-für-Schritt-Anleitung, wie die Menschheit ausgelöscht werden soll, beispielsweise indem sich die KI Zugang zur Energieversorgung verschafft und bestimmte Personen "verschwinden lässt".

Mehr dazu findest Du auf derstandard.at

Autor schreiben

Kurze URL:

Currently 3.67/5
1
2
3
4
5

Bewertung: 3.7/5 (9 Stimmen)

Das k�nnte Dich auch interessieren:

Wasserstoff billiger produzieren: Forschern gelingt wichtiger Schritt
Sie konnten den Einsatz des seltenen Metalls Iridium um 95 Prozent reduzieren, ohne an Effizienz einzub��en.

Forscher machen das Glasfasernetz 4,5 Millionen Mal schneller
Britische Forscher konnten 301.000 Gigabit pro Sekunde �bertragen. Bestehende Leitungen reichen f�r derartige Geschwindigkeiten aus

�hnliche News:

Forscherinnen orten "Pornofizierungstrend" unter Twitch-Streamerinnen
Forscher laden E-Auto drahtlos mit 100 Kilowatt
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen l�sst
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datentr�ger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme

Weitere News:

Boeing Starliner fliegt jetzt doch nicht am Dienstag
Durchbruch bei schnellladenden Quantenakkus
Beh�rden warnen vor mehr Cyberangriffen durch KI
Apples neues iPad Pro hat einen versteckten Vorteil f�r Reparaturen
Offizielle Displayport-2.1-Kabel sind zu kurz
Ist ein gutes Foto was Wert, wenn es Keiner sieht?
Call of Duty soll im Gamepass erscheinen
aleX filmt: Die 4 kleinen St�rche von Freilassing
Intels 1,5-Kilowatt-KI-Beschleuniger ist best�tigt
TCL CSOT zeigt 4K-Display mit 1.000 Hz

Einen Kommentar schreiben

Kommentare

(0)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar angestimmt...

;-)

Top