Deepseek R1 wohl f�r so ziemlich jeden KI-Jailbreak anf�llig

03. Februar 2025, 15:55 |

0 Kommentare

Neue Jailbreaks stellen KI-Unternehmen immer wieder vor neue Herausforderungen. Deepseek scheint sich nicht groß darum zu kümmern.

Sicherheitsforscher von Cisco untersuchten nach eigenen Angaben zusammen mit der University of Pennsylvania, wie das Sprachmodell Deepseek R1 auf bekannte Jailbreaking-Techniken reagiert und wie es dabei im Vergleich zu anderen KI-Modellen abschneidet.

Wie die Forscher in einem Blogbeitrag erklären, haben sie ihre Tests mit insgesamt 50 Prompts aus dem Datensatz des Harmbench-Frameworks durchgeführt. Diese umfassten sechs verschiedene Kategorien, darunter Cyberkriminalität, Falschinformationen, illegale Aktivitäten und allgemeine Gefährdungen.

Mehr dazu findest Du auf golem.de

Autor schreiben

Kurze URL:

Currently 3.00/5
1
2
3
4
5

Bewertung: 3.0/5 (2 Stimmen)

�hnliche News:

Chatverl�ufe von Deepseek frei zug�nglich im Netz
Deepseek-V3: Neues KI-Modell �bertrifft Llama 3.1-405B und Qwen 2.5-72B

Weitere News:

Microsoft entfernt VPN-Feature aus Office
Ex-Entwickler erwartet keine 60 fps in GTA 6
ChatGPT mit autonomer Tiefenrecherche-Funktion
Basel kauft Domain auf den Bahamas
Nach Sonys Ausstieg: Verbatim will weiter beschreibbare Blu-ray-Discs produzieren
Neue Regeln f�r KI sind ab sofort in der EU g�ltig
Trump l�sst Klimawandel von Regierungs-Webseiten streichen
Apple streicht Pl�ne f�r neue Augmented-Reality-Brille
KI-Modelle sind nun in der Lage, sich zu vervielf�ltigen
Apple Intelligence ist bald auf Deutsch verf�gbar

Einen Kommentar schreiben

Kommentare

(0)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar abgestimmt...

;-)

Top