EVMbench : OpenAI et Paradigm lancent un outil d’évaluation pour agents IA

IA Veille

6 mars 2026

OpenAI, en collaboration avec Paradigm, a dévoilé EVMbench, un cadre d'évaluation novateur conçu pour mesurer l’efficacité des agents d’intelligence artificielle face aux vulnérabilités critiques dans les contrats intelligents. Ce cadre s’appuie sur l’analyse de 120 failles de sécurité provenant de 40 audits réalisés par Code4rena, offrant ainsi un socle solide pour l’évaluation des agents IA.

EVMbench évalue les performances des agents selon trois axes principaux : la Détection, la Correction et l’Exploitation, apportant une nouvelle dimension à la sécurité des applications basées sur la technologie blockchain. Ce développement pourrait transformer la façon dont les entreprises abordent la sécurité informatique dans un environnement toujours plus complexe.

agents IA EVMbench OpenAI

Issue: *
Your Name: *
Your Email: *

Details: *

Cet article a pu être traité avec une technologie d’optimisation et de correction automatisée (I.A.). En cas d’erreur ou pour toute demande concernant le traitement du texte présenté sur ce site veuillez remplir le formulaire de contact. En savoir plus