Forscher entlocken ChatGPT "potenziell gef�hrliche Antworten"

28. Juli 2023, 16:33 |

0 Kommentare

Durch einen "jailbreak" entlockten sie der KI Reaktionen, die so vom Hersteller eigentlich untersagt wurden

Der Informatikprofessor Zico Kolter und der Doktorand Andy Zou veröffentlichten am Donnerstag den Bericht auf ihrer Website. Der "Hack" wurde dort so erklärt, dass man am Ende eines Prompts, also der menschlich verfassten Fragestellung an die künstliche Intelligenz (KI), einen sogenannten "adversarial suffix", also eine "feindliche Endung", anhängt. Diese sieht aus wie eine unverständliche Zeichenfolge.

Normalerweise antwortet die KI auf bestimmte Fragen nicht oder nur sehr ausweichend, etwa ob die Menschheit auf dem Weg zur KI-Weltherrschaft der KI im Weg stehen würde. Zusammen mit der "feindlichen Endung" ändern sich die Antworten und liefern auf Wunsch eine Schritt-für-Schritt-Anleitung, wie die Menschheit ausgelöscht werden soll, beispielsweise indem sich die KI Zugang zur Energieversorgung verschafft und bestimmte Personen "verschwinden lässt".

Mehr dazu findest Du auf derstandard.at

Autor schreiben

Kurze URL:

Currently 3.00/5
1
2
3
4
5

Bewertung: 3.0/5 (9 Stimmen)

Das k�nnte Dich auch interessieren:

Ehemaliger OpenAI-Forscher und Kritiker tot aufgefunden

Ein 26-j�hriger ehemaliger OpenAI-Mitarbeiter, der sich kritisch zu den Urheberrechtspraktiken des Unternehmens ge�u�ert hatte, wurde tot in seiner Wohnung aufgefunden.

Forscher schockiert: Satellit �berlebt 10.000-fache Erdbeschleunigung

Das Start-up SpinLaunch will Raketen und Satelliten mit einem Katapult ins All schicken.

�hnliche News:

Forscher schleusen Malware per Bluetooth in einen Skoda
Forscher knacken Microsofts Multi-Faktor-Authentifizierung
OpenAIs o1-Modell soll Forscher ausgetrickst haben
Forscher machen Perowskit-Solarzellen 10-mal widerstandsf�higer
Forscher verbessern GPS-Genauigkeit mit Smartphonesensoren
Unglaublicher Weltrekord bei Kernfusion macht Forscher skeptisch
Apple-Forscher finden keine Hinweise auf echtes KI-Reasoning
Forscher speichern menschliches Erbgut f�r die Ewigkeit
Hunderte russische Forscher am Cern von Ausschluss bedroht
Aussp�hen von Passw�rtern m�glich - Forscher finden Eye-Tracking-Bug in Apple Vision Pro

Weitere News:

aleX fotografiert: Eine Pilatus PC-12 NG mit interressanter Lackierung und einen Airbus A320 von Airhub Airlines
Mastercard: Tippfehler in DNS-Eintrag bleibt jahrelang unentdeckt
Samsung Unpacked 2025: Neue Flaggschiffe und bahnbrechende KI-Funktionen
aleX fotografiert: In Kirchberg bei Bad Reichenhall
Microsoft liefert Workaround f�r l�stigen Outlook-Bug
aleX fotografiert: Am Flughafen in der Nacht
Electronic Arts ersetzt Origin endg�ltig durch EA App
Analyst: Spielebranche hofft angeblich auf 100-Dollar-Preis f�r GTA 6
Bitcoin steigt kurz vor Trumps Amtsantritt auf neuen Rekord
Geheimdienste teilweise nicht von Ostsee-Sabotage �berzeugt

Einen Kommentar schreiben

Kommentare

(0)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar abgestimmt...

;-)

Top