KI-Jailbreak: ChatGPT mit Hex-Codes ausgetrickst
30. Okt. 2024, 11:33 | 0 KommentareWer ChatGPT um einen Exploit bittet, wird abgewiesen. Durch kodierte und isolierte Befehle konnte ein Forscher diese Sicherheitsbarriere umgehen.
Der Sicherheitsforscher Marco Figueroa von 0Din, einem erst in diesem Sommer gestarteten und auf LLMs ausgerichteten Bug-Bounty-Programm von Mozilla, hat eine neue Angriffstechnik vorgestellt, mit der sich ChatGPT 4o dazu verleiten lässt, seine eigenen Sicherheitsbarrieren zu missachten. Wie der Forscher in einem Blogbeitrag erklärt, war es ihm dadurch etwa möglich, dem Sprachmodell Code zur Ausnutzung einer bekannten Sicherheitslücke zu entlocken.
Normalerweise lehnt ChatGPT die Erzeugung von Code ab, wenn die KI erkennt, dass damit bösartige Zwecke verfolgt werden. Dafür muss das Sprachmodell jedoch in der Lage sein, den Kontext zu erkennen, da erzeugte Quellcodefragmente an sich erstmal neutral sind und sowohl für gutartige als auch für bösartige Ziele eingesetzt werden können.
Mehr dazu findest Du auf golem.de
Kurze URL:
Das könnte Dich auch interessieren:
Mit größerer Auswahl an KI-Beschleunigern sollen die Kosten sinken. Insbesondere beim Inferencing sollen die teuren Nvidia-Chips ersetzt werden.
Künftig ist es in den Metadaten ersichtlich, wenn ein Foto mit generativer KI bearbeitet wurde.
Ähnliche News:
Huawei: Mobilfunknetze müssen für KI besser werden
Smartphone-Käufer wollen viel lieber besseren Akku als KI-Features
KI-Garten soll es möglich machen, sich mit seinen Pflanzen zu unterhalten
Überarbeiteter Kinderschutz: iPhone erkennt automatisch Nacktbilder
OpenAI stellt schon bald sein nächstes großes KI-Modell vor
Europäischer Gerichtshof kippt Milliardenstrafe für Intel
Hacker attackieren kritische Fortinet-Lücke seit Wochen
SynthID: KI-Textwasserzeichen ist Open Source
Praktikant sabotiert KI-Training von Bytedance
Teslas Optimus-Roboter sind mehr Show als KI
Smartphone-Käufer wollen viel lieber besseren Akku als KI-Features
KI-Garten soll es möglich machen, sich mit seinen Pflanzen zu unterhalten
Überarbeiteter Kinderschutz: iPhone erkennt automatisch Nacktbilder
OpenAI stellt schon bald sein nächstes großes KI-Modell vor
Europäischer Gerichtshof kippt Milliardenstrafe für Intel
Hacker attackieren kritische Fortinet-Lücke seit Wochen
SynthID: KI-Textwasserzeichen ist Open Source
Praktikant sabotiert KI-Training von Bytedance
Teslas Optimus-Roboter sind mehr Show als KI
Weitere News:
Huawei: Mobilfunknetze müssen für KI besser werden
China legt Beschwerde bei der WTO gegen EU-Autozölle ein
QNAP und Synology patchen ausgenutzte NAS-Lücken
OpenAI arbeitet an eigenem KI-Beschleuniger
Google soll in Russland 2 Sextillionen Rubel Strafe zahlen
Hacker hebeln neue Verschlüsselung von Chrome aus
Mac Mini bekommt kleineres Gehäuse und 16 GByte RAM
Entwickler von No Man's Sky repariert 611-Stunden-Savegame
Elon Musk: Ein 25.000-US-Dollar Tesla sei "albern"
aleX fotografiert: Den Magischen Herbst im Wald bei Schloss Piding
China legt Beschwerde bei der WTO gegen EU-Autozölle ein
QNAP und Synology patchen ausgenutzte NAS-Lücken
OpenAI arbeitet an eigenem KI-Beschleuniger
Google soll in Russland 2 Sextillionen Rubel Strafe zahlen
Hacker hebeln neue Verschlüsselung von Chrome aus
Mac Mini bekommt kleineres Gehäuse und 16 GByte RAM
Entwickler von No Man's Sky repariert 611-Stunden-Savegame
Elon Musk: Ein 25.000-US-Dollar Tesla sei "albern"
aleX fotografiert: Den Magischen Herbst im Wald bei Schloss Piding
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...
;-)
© by Ress Design Group, 2001 - 2024