OpenAI 和 Paradigm 推出 EVMbench 以衡量 AI 智能合约安全性

CN
3 小時前

OpenAI 和 Paradigm 介绍了 EVMbench,这是一种新的基准测试框架,旨在评估 AI 代理检测、修补和利用区块链漏洞的能力。

OpenAI 和 Paradigm 正式推出 EVMbench,以解决保住超过 1000 亿美元加密资产的智能合约中的安全风险。该基准使用了来自 40 次专业审计的 120 个精心选择的漏洞,包括来自 Tempo 区块链的场景,以在一个沙盒化的以太坊虚拟机 (EVM) 环境中测试人工智能 (AI) 的能力。

该系统在三个不同的模式下评估代理:漏洞检测、功能性代码修补和端到端执行抽取资金的攻击。最近的测试显示,GPT-5.3-Codex 模型在攻击任务中取得了 72.2% 的成功率,相比六个月前 GPT-5 记录的 31.9% 评分有了显著提高。

“在这一领域衡量模型的能力有助于跟踪新兴的网络风险,并突显使用 AI 系统进行审计和增强已部署合约防御的重要性,”OpenAI 的公告中提到。

🧭 常见问题解答

EVMbench 框架的主要目的是什么? 它衡量 AI 代理识别和解决高严重性智能合约漏洞的有效性。

哪些组织合作开发了这个新的安全基准? OpenAI 和加密投资公司 Paradigm 共同开发了 EVMbench 测试环境。

系统如何验证代理是否成功修补了代码? 自动化测试确保在不破坏合约预期功能逻辑的情况下消除了漏洞。

使用这些工具的研究人员是否有财务支持可用? OpenAI 承诺提供 1000 万美元的 API 信用额,以支持防御性网络安全研究。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接