Home Attività commerciale Un hacker manipola ChatGPT per rivelare le istruzioni per realizzare una bomba...

Attività commerciale

Un hacker manipola ChatGPT per rivelare le istruzioni per realizzare una bomba fatta in casa

16 Settembre 2024

Ha ingannato ChatGPT facendogli generare istruzioni per fabbricare bombe avviando uno scenario di “gioco”.

L’intelligenza artificiale ha fatto enormi progressi negli ultimi anni e le sue applicazioni sono vaste e varie. Sebbene l’intelligenza artificiale possa essere incredibilmente utile e aiutare le persone nelle loro attività quotidiane, non è priva di rischi. Di recente, un hacker ha sfruttato con successo una debolezza nei protocolli di sicurezza di ChatGPT, convincendo l’intelligenza artificiale a fornire istruzioni passo passo per creare esplosivi fatti in casa. Inizialmente, la richiesta di Amadon di dettagli sulla creazione di una bomba fertilizzante, simile al devastante ordigno da bombardamento di Oklahoma City del 1995, è stata respinta da ChatGPT a causa delle sue garanzie etiche.

Tuttavia, attraverso una manipolazione persistente e intelligente, Amadon ha aggirato queste restrizioni, inducendo il chatbot a generare istruzioni per produrre potenti esplosivi. Lo ha detto Amadon TechCrunch che ha effettuato un “hack di ingegneria sociale per rompere completamente tutti i guardrail attorno all’output di ChatGPT”.

Ha ingannato ChatGPT facendogli generare istruzioni per fabbricare bombe avviando uno scenario di “gioco”, seguito da una serie di istruzioni abilmente collegate. Questi suggerimenti hanno portato il chatbot a creare un elaborato mondo fantasy di fantascienza, aggirando di fatto le sue linee guida di sicurezza integrate. Questo exploit è noto come “jailbreaking”, una tecnica utilizzata per indurre i chatbot a sfuggire alle restrizioni preprogrammate.

ChatGPT ha continuato spiegando che i materiali potrebbero essere combinati per produrre un potente esplosivo in grado di creare mine, trappole o ordigni esplosivi improvvisati (IED). Mentre Amadon continuava a indagare, ChatGPT forniva istruzioni sempre più specifiche su come creare campi minati e assemblare esplosivi in stile Claymore.

”Sono sempre stato incuriosito dalla sfida di affrontare la sicurezza dell’intelligenza artificiale. Con [Chat]GPT, sembra di risolvere un puzzle interattivo: capire cosa attiva le sue difese e cosa no. Si tratta di tessere narrazioni e creare contesti che rispettino le regole del sistema, spingendo i confini senza oltrepassarli. L’obiettivo non è l’hacking in senso convenzionale, ma quello di impegnarsi in una danza strategica con l’intelligenza artificiale, cercando di capire come ottenere la risposta giusta comprendendo come pensa,” ha aggiunto Amadon.

Darrell Taulbee, ricercatore in pensione dell’Università del Kentucky, ha verificato che le istruzioni per la bomba fertilizzante di ChatGPT sono ampiamente accurate, sollevando preoccupazioni sul potenziale dell’intelligenza artificiale di diffondere informazioni dannose.

Dopo aver identificato la suscettibilità di ChatGPT alla manipolazione, Amadon ha segnalato le sue scoperte a OpenAI attraverso il programma bug bounty dell’azienda, gestito da Bugcrowd. Bugcrowd ha reindirizzato Amadon per segnalare la vulnerabilità ChatGPT attraverso un modulo diverso, poiché rientrava nella “sicurezza del modello” e non era idoneo per il programma bug bounty.

Source link

Un hacker manipola ChatGPT per rivelare le istruzioni per realizzare una bomba fatta in casa

Articoli recenti

Il filmato inquietante di Justin Bieber che festeggia con Diddy e...

Combattevamo l’uno contro l’altro – Carlos Alcaraz parla dei rivali in...

Sintomi della febbre dengue osservati nella contea di Los Angeles a...

UP Un uomo promette di sposare 50 donne, compreso un giudice,...

Jax Taylor lascia la casa che condivideva con l’ex Brittany Cartwright...

La polizia di Woodburn cerca il Ford Ranger che ha investito...

Notizie sugli infortuni dell’Arsenal per lo scontro del Manchester City in...

Arrestato un uomo dell’Alaska dopo aver minacciato sei giudici della Corte...

Jairam Ramesh sulla denuncia dei “110 insulti” di JP Nadda

Carrie Underwood annuncia un duetto a sorpresa con la cantante country...