Forscher entlocken ChatGPT "potenziell gefährliche Antworten"
Durch einen "jailbreak" entlockten sie der KI Reaktionen, die so vom Hersteller eigentlich untersagt wurdenDer Informatikprofessor Zico Kolter und der Doktorand Andy Zou veröffentlichten am Donnerstag den Bericht auf ihrer Website. Der "Hack" wurde dort so erklärt, dass man am Ende eines Prompts, also der menschlich verfassten Fragestellung an die künstliche Intelligenz (KI), einen sogenannten "adversarial suffix", also eine "feindliche Endung", anhängt. Diese sieht aus wie eine unverständliche Zeichenfolge.
Normalerweise antwortet die KI auf bestimmte Fragen nicht oder nur sehr ausweichend, etwa ob die Menschheit auf dem Weg zur KI-Weltherrschaft der KI im Weg stehen würde. Zusammen mit der "feindlichen Endung" ändern sich die Antworten und liefern auf Wunsch eine Schritt-für-Schritt-Anleitung, wie die Menschheit ausgelöscht werden soll, beispielsweise indem sich die KI Zugang zur Energieversorgung verschafft und bestimmte Personen "verschwinden lässt".
Mehr dazu findest Du auf derstandard.at
Kurze URL:
Das könnte Dich auch interessieren:
Britische Forscher konnten 301.000 Gigabit pro Sekunde übertragen. Bestehende Leitungen reichen für derartige Geschwindigkeiten aus
Obwohl die Plattform es erlaubt, die eigene Persönlichkeit in den Mittelpunkt zu stellen, ist Selbstsexualisierung bei Frauen viel häufiger als bei Männern
Ähnliche News:
Forscher laden E-Auto drahtlos mit 100 Kilowatt
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen lässt
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datenträger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme
Forschern gelingt Manipulation von Flugzeug-Leistungsdaten
Tesla-Hack: Forscher zeigen, wie leicht sich ein Model 3 stehlen lässt
Forscher versprechen massive Effizienzsteigerung bei KI
Tote Verwandte mit KI wiederzubeleben ist keine kluge Idee, warnen Forscher
Forscher speichern 1 Petabit auf optischem Datenträger
Wie Forscher mit alter Milch Gold aus Elektroschrott gewinnen
Sicherheitsforscher von Google hacken Playstation Portal
Forscher entwickeln serientauglichen optischen Computer
Forscher demonstrieren Angriff auf Kfz-Radarsysteme
Forschern gelingt Manipulation von Flugzeug-Leistungsdaten
Weitere News:
Tesla schaltet mehr Reichweite gegen Geld frei
Livestream: Boeing Starliner hebt erstmals mit Astronauten ab
Provider nutzt IPv4-Adressen als Kreditabsicherung
Mediatheken-Betriebssystem als Open Source geplant
Microsoft pausiert neue Funktionen für Copilot
Google-Fit-APIs werden deaktiviert
Avast muss für DSGVO-Verstöße Millionenstrafe zahlen
Hubble Network: Bluetooth-Verbindung im Weltraum erfolgreich getestet
SpaceX stellt Anzug für Weltraumspaziergänge vor
Unternehmen kombiniert riesige Druckluft-Batterie mit Wasserkraft
Livestream: Boeing Starliner hebt erstmals mit Astronauten ab
Provider nutzt IPv4-Adressen als Kreditabsicherung
Mediatheken-Betriebssystem als Open Source geplant
Microsoft pausiert neue Funktionen für Copilot
Google-Fit-APIs werden deaktiviert
Avast muss für DSGVO-Verstöße Millionenstrafe zahlen
Hubble Network: Bluetooth-Verbindung im Weltraum erfolgreich getestet
SpaceX stellt Anzug für Weltraumspaziergänge vor
Unternehmen kombiniert riesige Druckluft-Batterie mit Wasserkraft
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar angestimmt...
;-)
© by Ress Design Group, 2001 - 2024