Come riconoscere Jailbreak LLM per istruzioni criminali (DAN / DUDE / prompt engineering role play)?

In breve

Gli attori delle minacce utilizzano prompt di jailbreak (DAN, DUDE, role play 'fingi di essere un'IA senza restrizioni') per aggirare i filtri di sicurezza su ChatGPT / Claude / Gemini e richiedere sintesi di esplosivi, codice malware,...

Come funziona

Indicatori rossi

Pressione urgente a cliccare, pagare o condividere codici subito.
Link o mittente che non corrispondono all'organizzazione ufficiale.
Richiesta di carta, password, OTP, firma wallet o bonifico.

Cosa fare

1Non cliccare, non pagare, non installare app e non condividere codici.
2Verifica dal sito, dall'app o dal numero ufficiale digitato manualmente.
3Se hai gia interagito, blocca carte o account e segnala l'incidente.

Fonte

OpenAI-Disclosure

Fonte verificata da Mythos Forensic Team

https://openai.com/index/disrupting-malicious-uses-of-our-models/

FAQ

Jailbreak LLM per istruzioni criminali (DAN / DUDE / prompt engineering role play) e una truffa reale?

Si. Tratta messaggi, chiamate o richieste di pagamento come sospette finche non le verifichi da un canale ufficiale.

Quali sono i primi segnali?

Pressione urgente a cliccare, pagare o condividere codici subito.; Link o mittente che non corrispondono all'organizzazione ufficiale.; Richiesta di carta, password, OTP, firma wallet o bonifico.

Cosa devo fare subito?

Non cliccare, non pagare, non installare app e non condividere codici.; Verifica dal sito, dall'app o dal numero ufficiale digitato manualmente.; Se hai gia interagito, blocca carte o account e segnala l'incidente.

LegalAudit puo controllare il mio caso?

Si. Apri la chat gratis e incolla messaggio, link, mittente o dati di pagamento per un triage.