Deepseek R1 wohl für so ziemlich jeden KI-Jailbreak anfällig

03. Februar 2025, 15:55 |  0 Kommentare

Neue Jailbreaks stellen KI-Unternehmen immer wieder vor neue Herausforderungen. Deepseek scheint sich nicht groß darum zu kümmern.

Sicherheitsforscher von Cisco untersuchten nach eigenen Angaben zusammen mit der University of Pennsylvania, wie das Sprachmodell Deepseek R1 auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Wie die Forscher in einem Blogbeitrag erklären, haben sie ihre Tests mit insgesamt 50 Prompts aus dem Datensatz des Harmbench-Frameworks durchgeführt. Diese umfassten sechs verschiedene Kategorien, darunter Cyberkriminalität, Falschinformationen, illegale Aktivitäten und allgemeine Gefährdungen.

Mehr dazu findest Du auf golem.de





Kurze URL:


Bewertung: 3.0/5 (2 Stimmen)


Ähnliche News:

Weitere News:

Einen Kommentar schreiben

Du willst nicht als "Gast" schreiben? Logg Dich Hier ein.

Code:

Code neuladen

Kommentare
(0)

Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.




Kommentare:

Du hast bereits für diesen Kommentar abgestimmt...

;-)

Top