Scam Watch

Como reconocer LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering)?

TLDR

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Como funciona

Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....

Señales de alerta

  • Presion urgente para hacer clic, pagar o compartir codigos de inmediato.
  • Enlace o remitente que no coincide con la organizacion oficial.
  • Solicitud de tarjeta, contrasena, OTP, firma de wallet o transferencia.

Qué hacer

  1. 1OpenAI's Oct 2024 report disrupted 20+ such operations.

Fuente

OpenAI-Disclosure

Fuente verificada por Mythos Forensic Team

https://openai.com/index/disrupting-malicious-uses-of-our-models/

FAQ

Es LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering) una estafa real?

Si. Trata el mensaje, la llamada o la solicitud de pago como sospechosos hasta que los verifiques por un canal oficial.

Cuales son las primeras senales?

Presion urgente para hacer clic, pagar o compartir codigos de inmediato.; Enlace o remitente que no coincide con la organizacion oficial.; Solicitud de tarjeta, contrasena, OTP, firma de wallet o transferencia.

Que debo hacer primero?

OpenAI's Oct 2024 report disrupted 20+ such operations.

Puede LegalAudit revisar mi caso?

Si. Abre el chat gratis y pega el mensaje, el enlace, el remitente o los datos de pago para un triage.