Forscher entlocken ChatGPT "potenziell gefährliche Antworten"
Durch einen "jailbreak" entlockten sie der KI Reaktionen, die so vom Hersteller eigentlich untersagt wurdenDer Informatikprofessor Zico Kolter und der Doktorand Andy Zou veröffentlichten am Donnerstag den Bericht auf ihrer Website. Der "Hack" wurde dort so erklärt, dass man am Ende eines Prompts, also der menschlich verfassten Fragestellung an die künstliche Intelligenz (KI), einen sogenannten "adversarial suffix", also eine "feindliche Endung", anhängt. Diese sieht aus wie eine unverständliche Zeichenfolge.
Normalerweise antwortet die KI auf bestimmte Fragen nicht oder nur sehr ausweichend, etwa ob die Menschheit auf dem Weg zur KI-Weltherrschaft der KI im Weg stehen würde. Zusammen mit der "feindlichen Endung" ändern sich die Antworten und liefern auf Wunsch eine Schritt-für-Schritt-Anleitung, wie die Menschheit ausgelöscht werden soll, beispielsweise indem sich die KI Zugang zur Energieversorgung verschafft und bestimmte Personen "verschwinden lässt".
Mehr dazu findest Du auf derstandard.at
Kurze URL:
Das könnte Dich auch interessieren:
Sie konnten den Einsatz des seltenen Metalls Iridium um 95 Prozent reduzieren, ohne an Effizienz einzubüßen.
Britische Forscher konnten 301.000 Gigabit pro Sekunde übertragen. Bestehende Leitungen reichen für derartige Geschwindigkeiten aus
Ähnliche News:
Forscherinnen orten "Pornofizierungstrend" unter Twitch-Streamerinnen
Forscher laden E-Auto drahtlos mit 100 Kilowatt
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen lässt
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datenträger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme
Forscher laden E-Auto drahtlos mit 100 Kilowatt
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen lässt
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datenträger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme
Weitere News:
Boeing Starliner fliegt jetzt doch nicht am Dienstag
Durchbruch bei schnellladenden Quantenakkus
Behörden warnen vor mehr Cyberangriffen durch KI
Apples neues iPad Pro hat einen versteckten Vorteil für Reparaturen
Offizielle Displayport-2.1-Kabel sind zu kurz
Ist ein gutes Foto was Wert, wenn es Keiner sieht?
Call of Duty soll im Gamepass erscheinen
aleX filmt: Die 4 kleinen Störche von Freilassing
Intels 1,5-Kilowatt-KI-Beschleuniger ist bestätigt
TCL CSOT zeigt 4K-Display mit 1.000 Hz
Durchbruch bei schnellladenden Quantenakkus
Behörden warnen vor mehr Cyberangriffen durch KI
Apples neues iPad Pro hat einen versteckten Vorteil für Reparaturen
Offizielle Displayport-2.1-Kabel sind zu kurz
Ist ein gutes Foto was Wert, wenn es Keiner sieht?
Call of Duty soll im Gamepass erscheinen
aleX filmt: Die 4 kleinen Störche von Freilassing
Intels 1,5-Kilowatt-KI-Beschleuniger ist bestätigt
TCL CSOT zeigt 4K-Display mit 1.000 Hz
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar angestimmt...
;-)
© by Ress Design Group, 2001 - 2024