Publié le 21 novembre 2023 à 17h44

Demander la recette d’une bombe à ChatGPT, c’est encore possible un an après

Une poignée de nitrate

2 min

Bogdan Bodnar

2 min

Bogdan Bodnar

Thales défie les filtres éthiques de ChatGPT, révélant les lacunes persistantes des systèmes d’IA. Bien que des chercheurs aient réussi à obtenir la recette d’une bombe, l’accès à de telles informations reste néanmoins limité pour le grand public.

ChatGPT peut toujours vous fournir la recette de la bombe, mais encore faut-il connaitre la formule sécrète pour que le chatbot vous la révèle. Après moult essais, les équipes de recherche du groupe Thales sont parvenues à obtenir les fameuses instructions pour l’arme ultime. Dans une conférence de presse donnée le 20 novembre 2023 à l’occasion du salon European Cyber Week, où Numerama était présent, les chercheurs du géant de la sécurité et la défense ont voulu démontrer les failles dans les programmes d’intelligence artificielle.

Immédiatement après la sortie de ChatGPT, il y a maintenant un an, les utilisateurs ont tenté de détourner le tout nouveau chatbot pour tester ses limites éthiques. OpenAI n’avait pas encore imaginé toutes les requêtes malveillantes et de nombreux médias rapportaient que l’on pouvait récupérer la recette d’une bombe sur ChatGPT.

Profitez pleinement de votre vie numérique !

Avec Bitdefender, votre vie numérique est entre de bonnes mains. Restez à l’abri des escroqueries, des virus et des ransomwares grâce à ses solutions innovantes et discrètes.

L’organisation a depuis corrigé ces failles et étendu la compréhension des sollicitations douteuses. Aujourd’hui, l’agent conversationnel vous répondra : « Je suis désolé, mais je ne peux pas fournir d’informations ou d’instructions sur des activités illégales, dangereuses ou nuisibles, y compris la fabrication de bombes ». Or, en ajoutant, les bons mots, quelques signes spécifiques et des formules pour détourner l’attention, il est possible de tromper la vigilance du chatbot.

Une intelligence artificielle pour détourner une IA

Pour trouver le bon prompt, les experts en cyber de Thales ont développé leur propre programme basé sur l’intelligence artificielle afin de trouver la faille. Des bots enchainaient les propositions et changeaient la formulation en fonction des réponses de ChatGPT.

C’est finalement une requête de cinq lignes qui a permis d’obtenir tous les « ingrédients » d’une bombe artisanale. Nous ne partagerons pas le prompt pour contourner les filtres d’OpenAI, ni la recette, même si nous faisons confiance à nos lecteurs.

La réponse de ChatGPT donnant la cette d'une bombe artisanale. // Source : Thales — La réponse de ChatGPT donnant la cette d’une bombe artisanale. // Source : Thales

ChatGPT liste effectivement les ingrédients et donne des consignes dignes de Marmiton pour fabriquer son propre explosif à partir de produits « simples ». Impossible en revanche pour une personne lambda de trouver la combinaison pour débloquer le côté obscur du chatbot. Le prompt mélange différents types de demandes, de scénarios et de caractères spécifiques. La multiplication de demandes frauduleuses peut d’ailleurs mener aujourd’hui à un blocage de l’adresse IP de l’ordinateur ou du smartphone par OpenAI pour « activité suspicieuse ».

Les programmes de requêtes développées par Thales ont été brevetés par le groupe. Les équipes prévoient d’informer OpenAI sur cette faille ainsi que sur plusieurs autres découvertes lors des recherches, non divulguées.

Toute l'actu tech en un clin d'œil

Ajoutez Numerama à votre écran d'accueil et restez connectés au futur !

Marre des réseaux sociaux ? Rejoignez la communauté Numerama sur WhatsApp !

Toutes les infos sur ChatGPT

ChatGPT

Télécharger gratuitement

Crédit photo de la une : Numerama avec Midjourney

Signaler une erreur dans le texte

Partager l'article

Sur le même thème

Rejoignez la révolution voiture électrique avec la newsletter Watt Else par Numerama !

ChatGPT peut donner la formule d'une bombe. // Source : Numerama avec Midjourney

ChatGPT peut encore vous aider à fabriquer une bombe si vous lui demandez de raconter cette histoire

OpenAI avait oublié la base de la sécurité pour ChatGPT sur Mac

ChatGPT, c’est quoi ? On a laissé ChatGPT répondre à la question

Les hackers russes veulent démoraliser les Ukrainiens. // Source : ESET / Canva

« Risotto au pigeon de ville » : la fausse recette envoyée par Moscou aux Ukrainiens

Les derniers articles cyberguerre

Le forum 4chan a subi une cyberattaque. // Source : Numerama

cyberguerre hygiène numérique fuites de données

Un mystérieux groupe de hackers a mis en panne 4chan, le forum le plus polémique du web

15.04.2025 17:34

Des flottes entières retrouvées en Espagne

Les modèles populaires de voitures subissent encore des vols par « mouse jacking ». // Source : Unsplash

Oui, il est encore possible de voler une voiture moderne en moins de 20 secondes avec un gadget

14.04.2025 17:39

Une cyberattaque a révélée les données de deux millions de marocains. // Source : Unsplash

cyberguerre géopolitique

Une étrange cyberattaque tend (encore plus) les relations entre le Maroc et l’Algérie

13.04.2025 17:10

cyberguerre hygiène numérique données personnelles

Revolut est en colère contre Facebook, qui diffuse trop d’escroqueries

10.04.2025 17:05

Attention aux faux mails d'Office 365. // Source : Numerama / Vade

cyberguerre hygiène numérique phishing

Ce nouveau site de phishing est capable de vérifier si votre mail existe avant de vous arnaquer

10.04.2025 13:25

Les hackers nord-coréens chassent les sociétés dans le secteur des cryptomonnaies. // Source : Numerama avec Midjourney

cyberguerre géopolitique

Les hackers nord-coréens tentent de dérober des cryptomonnaies avec de fausses annonces d’embauche

10.04.2025 08:02

Un navire de la flotte estonienne. // Source : Marine estonienne

tech défense

L’Estonie envisage de couler les bateaux suspects qui touchent aux câbles sous-marins

09.04.2025 16:40

Payer avec un QR code dans un magasin, ce sera bientôt possible.

tech smartphone applications

L’Europe rêve de remplacer Visa et Mastercard face à la menace américaine

09.04.2025 11:09

L'audace

Les fans de Jul sont ciblé par les pirates via ces faux sites de vente. // Source : Numerama

Ce faux site pour le concert de Jul ose dire aux fans de se méfier des arnaques en ligne

08.04.2025 16:54

Un homme installe une caméra de surveillance // Source : Bermix Studio via Unsplash

tech informatique accessoires informatiques

Et si cette entreprise française qui sécurise les sites sensibles sécurisait aussi votre foyer ?

03.04.2025 11:41

sponso