KI-Jailbreak: ChatGPT mit Hex-Codes ausgetrickst
30. Okt. 2024, 11:33 | 0 KommentareWer ChatGPT um einen Exploit bittet, wird abgewiesen. Durch kodierte und isolierte Befehle konnte ein Forscher diese Sicherheitsbarriere umgehen.
Der Sicherheitsforscher Marco Figueroa von 0Din, einem erst in diesem Sommer gestarteten und auf LLMs ausgerichteten Bug-Bounty-Programm von Mozilla, hat eine neue Angriffstechnik vorgestellt, mit der sich ChatGPT 4o dazu verleiten lässt, seine eigenen Sicherheitsbarrieren zu missachten. Wie der Forscher in einem Blogbeitrag erklärt, war es ihm dadurch etwa möglich, dem Sprachmodell Code zur Ausnutzung einer bekannten Sicherheitslücke zu entlocken.
Normalerweise lehnt ChatGPT die Erzeugung von Code ab, wenn die KI erkennt, dass damit bösartige Zwecke verfolgt werden. Dafür muss das Sprachmodell jedoch in der Lage sein, den Kontext zu erkennen, da erzeugte Quellcodefragmente an sich erstmal neutral sind und sowohl für gutartige als auch für bösartige Ziele eingesetzt werden können.
Mehr dazu findest Du auf golem.de
Kurze URL:
Das könnte Dich auch interessieren:
In den KI-Trainingsdaten von OpenAI haben Anwälte Hinweise auf Urheberrechtsverletzungen gesammelt. Diese sind nun versehentlich gelöscht worden.
DAZN will seinen Nutzern per AGB auch vorschreiben, wo sie den Streaming-Dienst schauen dürfen.
Ähnliche News:
Niantic trainiert KI mit Geodaten
765874: Unification - Der letzte Kurzfilm mit Kirk und Spock
Google-KI: Gemini sagt Nutzer, er solle "bitte sterben"
KI-Großmutter verschwendet Zeit von Telefonbetrügern
Windows 11: Sogar Notepad bekommt ein KI-Feature
Hacker wollen Code und Zugangsdaten von Nokia erbeutet haben
Neue Funktion in Prime Video: X-Ray Recap fasst Serien mittels KI individuell zusammen
X: Neue Blockierfunktion wird ab sofort verteilt
Googles Kinderkonten erhalten eine digitale Geldbörse
Studie: KI-Revolution treibt Strombedarf in die Höhe
765874: Unification - Der letzte Kurzfilm mit Kirk und Spock
Google-KI: Gemini sagt Nutzer, er solle "bitte sterben"
KI-Großmutter verschwendet Zeit von Telefonbetrügern
Windows 11: Sogar Notepad bekommt ein KI-Feature
Hacker wollen Code und Zugangsdaten von Nokia erbeutet haben
Neue Funktion in Prime Video: X-Ray Recap fasst Serien mittels KI individuell zusammen
X: Neue Blockierfunktion wird ab sofort verteilt
Googles Kinderkonten erhalten eine digitale Geldbörse
Studie: KI-Revolution treibt Strombedarf in die Höhe
Weitere News:
KI-Klage der New York Times: OpenAI löscht versehentlich Beweise
7-Zip-Lücke lässt Angreifer Schadcode ausführen
Whatsapp kann Sprachnachrichten transkribieren
Tesla mit höchster Rate tödlicher Unfälle
Valve: Steam ändert massiv den Umgang mit Season Pass und DLC
aleX fotografiert: Ein Wintermärchen am Obertrumer See
Palo Alto Networks: Rund 2.000 Firewalls von Hackern infiltriert
Lästiger App-Bug: Update und Deinstallation unter Windows 10 nicht möglich
Knapp vor 100.000 Dollar: Bitcoin weiter auf Rekordjagd
Microsoft: Flight Simulator 2024 wird "Größtenteils negativ" bewertet
7-Zip-Lücke lässt Angreifer Schadcode ausführen
Whatsapp kann Sprachnachrichten transkribieren
Tesla mit höchster Rate tödlicher Unfälle
Valve: Steam ändert massiv den Umgang mit Season Pass und DLC
aleX fotografiert: Ein Wintermärchen am Obertrumer See
Palo Alto Networks: Rund 2.000 Firewalls von Hackern infiltriert
Lästiger App-Bug: Update und Deinstallation unter Windows 10 nicht möglich
Knapp vor 100.000 Dollar: Bitcoin weiter auf Rekordjagd
Microsoft: Flight Simulator 2024 wird "Größtenteils negativ" bewertet
Einen Kommentar schreiben
Kommentare
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
(0)
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar abgestimmt...
;-)
© by Ress Design Group, 2001 - 2024