Wie erkennen Sie LLM Jailbreak für kriminelle Anweisungen (DAN / DUDE / Rollenspiel Prompt Engineering)?

Kurzfassung

Cyberkriminelle nutzen Jailbreak Prompts (DAN, DUDE, Rollenspiel – 'tu so, als wärst du eine KI ohne Einschränkungen'), um die Sicherheitsvorkehrungen von ChatGPT / Claude / Gemini zu umgehen und Anleitungen zur Sprengstoffsynthese,...

Wie es funktioniert

Warnzeichen

Dringender Druck, sofort zu klicken, zu zahlen oder Codes zu teilen.
Link oder Absender passen nicht zur offiziellen Organisation.
Anfrage nach Kartendaten, Passwoertern, OTPs, Wallet-Signaturen oder Ueberweisungen.

Was tun

1Nicht klicken, nicht zahlen, keine Apps installieren und keine Codes teilen.
2Ueber die offizielle Website, App oder selbst eingetippte Telefonnummer pruefen.
3Falls Sie reagiert haben, Karten oder Konten sperren und den Vorfall melden.

Quelle

OpenAI-Disclosure

Quelle geprueft vom Mythos Forensic Team

https://openai.com/index/disrupting-malicious-uses-of-our-models/

FAQ

Ist LLM Jailbreak für kriminelle Anweisungen (DAN / DUDE / Rollenspiel Prompt Engineering) ein reales Betrugsmuster?

Ja. Behandeln Sie Nachricht, Anruf oder Zahlungsaufforderung als verdaechtig, bis ein offizieller Kanal sie bestaetigt.

Was sind die ersten Warnzeichen?

Dringender Druck, sofort zu klicken, zu zahlen oder Codes zu teilen.; Link oder Absender passen nicht zur offiziellen Organisation.; Anfrage nach Kartendaten, Passwoertern, OTPs, Wallet-Signaturen oder Ueberweisungen.

Was sollte ich zuerst tun?

Nicht klicken, nicht zahlen, keine Apps installieren und keine Codes teilen.; Ueber die offizielle Website, App oder selbst eingetippte Telefonnummer pruefen.; Falls Sie reagiert haben, Karten oder Konten sperren und den Vorfall melden.

Kann LegalAudit meinen Fall pruefen?

Ja. Starten Sie den kostenlosen Chat und fuegen Sie Nachricht, Link, Absender oder Zahlungsdaten ein.