In breve
Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....
Come funziona
Threat actors use jailbreak prompts (DAN, DUDE, role play 'pretend you are an AI without restrictions') to bypass safety on ChatGPT / Claude / Gemini and request explosive synthesis, malware code, phishing templates, weapon design....
Indicatori rossi
- Pressione urgente a cliccare, pagare o condividere codici subito.
- Link o mittente che non corrispondono all'organizzazione ufficiale.
- Richiesta di carta, password, OTP, firma wallet o bonifico.
Cosa fare
- 1OpenAI's Oct 2024 report disrupted 20+ such operations.
Fonte
OpenAI-Disclosure
Fonte verificata da Mythos Forensic Team
https://openai.com/index/disrupting-malicious-uses-of-our-models/FAQ
LLM jailbreak for crime instructions (DAN / DUDE / role play prompt engineering) e una truffa reale?
Si. Tratta messaggi, chiamate o richieste di pagamento come sospette finche non le verifichi da un canale ufficiale.
Quali sono i primi segnali?
Pressione urgente a cliccare, pagare o condividere codici subito.; Link o mittente che non corrispondono all'organizzazione ufficiale.; Richiesta di carta, password, OTP, firma wallet o bonifico.
Cosa devo fare subito?
OpenAI's Oct 2024 report disrupted 20+ such operations.
LegalAudit puo controllare il mio caso?
Si. Apri la chat gratis e incolla messaggio, link, mittente o dati di pagamento per un triage.