KI-Jailbreak: ChatGPT mit Hex-Codes ausgetrickst

30. Okt. 2024, 11:33 |

0 Kommentare

Wer ChatGPT um einen Exploit bittet, wird abgewiesen. Durch kodierte und isolierte Befehle konnte ein Forscher diese Sicherheitsbarriere umgehen.

Der Sicherheitsforscher Marco Figueroa von 0Din, einem erst in diesem Sommer gestarteten und auf LLMs ausgerichteten Bug-Bounty-Programm von Mozilla, hat eine neue Angriffstechnik vorgestellt, mit der sich ChatGPT 4o dazu verleiten lässt, seine eigenen Sicherheitsbarrieren zu missachten. Wie der Forscher in einem Blogbeitrag erklärt, war es ihm dadurch etwa möglich, dem Sprachmodell Code zur Ausnutzung einer bekannten Sicherheitslücke zu entlocken.

Normalerweise lehnt ChatGPT die Erzeugung von Code ab, wenn die KI erkennt, dass damit bösartige Zwecke verfolgt werden. Dafür muss das Sprachmodell jedoch in der Lage sein, den Kontext zu erkennen, da erzeugte Quellcodefragmente an sich erstmal neutral sind und sowohl für gutartige als auch für bösartige Ziele eingesetzt werden können.

Mehr dazu findest Du auf golem.de

Autor schreiben

Kurze URL:

Currently 3.00/5
1
2
3
4
5

Bewertung: 3.0/5 (2 Stimmen)

Das könnte Dich auch interessieren:

OpenAI plant KI-Rechenzentren in den VAE

OpenAI will Rechenzentren in den Vereinigten Arabischen Emiraten bauen, was eine erhebliche internationale Expansion bedeuten würde.

Papst Leo XIV. sieht Herausforderungen durch KI

Der neue Papst Leo XIV. hat künstliche Intelligenz als eine entscheidende Herausforderung für die Menschheit bezeichnet.

Weitere News:

RTL8127: Neuer Realtek-Chip soll 10-GBit-Netzwerk bezahlbar machen
Onlyfans vor Milliardendeal
Möglicher Zwergplanet am Rande des Sonnensystems entdeckt
Oracle kauft Nvidia-KI-Chips für 40 Milliarden US-Dollar
Digg zeigt Interesse an Übernahme an Firefox Pocket
Seltener Blick auf streng geheime Boeing 737
OpenAI eröffnet ersten deutschen Standort in München
Internet Archive startet Livestream der Mikrofilm-Digitalisierung
Steam Deck: SteamOS-Image für Konkurrenzprodukte ist da
Tesla-Mitarbeiter berichten von Überwachung

Einen Kommentar schreiben

Kommentare

(0)

Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne über das Forum Newskommentare schreiben...

Du hast bereits für diesen Kommentar abgestimmt...

;-)