...::: Druckansicht - Deepseek R1 wohl für so ziemlich jeden KI-Jailbreak anfällig :::...

Deepseek R1 wohl für so ziemlich jeden KI-Jailbreak anfällig

(03. Februar 2025/15:55)

Neue Jailbreaks stellen KI-Unternehmen immer wieder vor neue Herausforderungen. Deepseek scheint sich nicht groß darum zu kümmern.

Sicherheitsforscher von Cisco untersuchten nach eigenen Angaben zusammen mit der University of Pennsylvania, wie das Sprachmodell Deepseek R1 auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Wie die Forscher in einem Blogbeitrag erklären, haben sie ihre Tests mit insgesamt 50 Prompts aus dem Datensatz des Harmbench-Frameworks durchgeführt. Diese umfassten sechs verschiedene Kategorien, darunter Cyberkriminalität, Falschinformationen, illegale Aktivitäten und allgemeine Gefährdungen.

Mehr dazu findet ihr auf golem.de