Scam Watch

Wie erkennen Sie LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering)?

Kurzfassung

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Wie es funktioniert

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Warnzeichen

  • Dringender Druck, sofort zu klicken, zu zahlen oder Codes zu teilen.
  • Link oder Absender passen nicht zur offiziellen Organisation.
  • Anfrage nach Kartendaten, Passwoertern, OTPs, Wallet-Signaturen oder Ueberweisungen.

Was tun

  1. 1OpenAI's Oct 2024 report disrupted 20+ such operations.

Quelle

OpenAI-Disclosure

Quelle geprueft vom Mythos Forensic Team

https://openai.com/index/disrupting-malicious-uses-of-our-models/

FAQ

Ist LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering) ein reales Betrugsmuster?

Ja. Behandeln Sie Nachricht, Anruf oder Zahlungsaufforderung als verdaechtig, bis ein offizieller Kanal sie bestaetigt.

Was sind die ersten Warnzeichen?

Dringender Druck, sofort zu klicken, zu zahlen oder Codes zu teilen.; Link oder Absender passen nicht zur offiziellen Organisation.; Anfrage nach Kartendaten, Passwoertern, OTPs, Wallet-Signaturen oder Ueberweisungen.

Was sollte ich zuerst tun?

OpenAI's Oct 2024 report disrupted 20+ such operations.

Kann LegalAudit meinen Fall pruefen?

Ja. Starten Sie den kostenlosen Chat und fuegen Sie Nachricht, Link, Absender oder Zahlungsdaten ein.