Scam Watch

Comment reconnaitre LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering)?

En bref

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Comment ca fonctionne

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Signaux d'alerte

  • Pression urgente pour cliquer, payer ou partager des codes immediatement.
  • Lien ou expediteur qui ne correspond pas a l'organisation officielle.
  • Demande de carte, mot de passe, OTP, signature wallet ou virement.

Que faire

  1. 1OpenAI's Oct 2024 report disrupted 20+ such operations.

Source

OpenAI-Disclosure

Source verifiee par Mythos Forensic Team

https://openai.com/index/disrupting-malicious-uses-of-our-models/

FAQ

LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering) est une vraie arnaque ?

Oui. Traitez le message, l'appel ou la demande de paiement comme suspect jusqu'a verification via un canal officiel.

Quels sont les premiers signaux ?

Pression urgente pour cliquer, payer ou partager des codes immediatement.; Lien ou expediteur qui ne correspond pas a l'organisation officielle.; Demande de carte, mot de passe, OTP, signature wallet ou virement.

Que faire en premier ?

OpenAI's Oct 2024 report disrupted 20+ such operations.

LegalAudit peut-il verifier mon cas ?

Oui. Lancez le chat gratuit et collez le message, le lien, l'expediteur ou les details de paiement.