OpenAI, en collaboration avec Paradigm, a dévoilé EVMbench, un cadre d'évaluation novateur conçu pour mesurer l’efficacité des agents d’intelligence artificielle face aux vulnérabilités critiques dans les contrats intelligents. Ce cadre s’appuie sur l’analyse de 120 failles de sécurité provenant de 40 audits réalisés par Code4rena, offrant ainsi un socle solide pour l’évaluation des agents IA.
EVMbench évalue les performances des agents selon trois axes principaux : la Détection, la Correction et l’Exploitation, apportant une nouvelle dimension à la sécurité des applications basées sur la technologie blockchain. Ce développement pourrait transformer la façon dont les entreprises abordent la sécurité informatique dans un environnement toujours plus complexe.