OpenAI 和 Paradigm 推出 EVMbench 以衡量 AI 智能合约安全性

OpenAI 和 Paradigm 介绍了 EVMbench，这是一种新的基准测试框架，旨在评估 AI 代理检测、修补和利用区块链漏洞的能力。

OpenAI 和 Paradigm 正式推出 EVMbench，以解决保住超过 1000 亿美元加密资产的智能合约中的安全风险。该基准使用了来自 40 次专业审计的 120 个精心选择的漏洞，包括来自 Tempo 区块链的场景，以在一个沙盒化的以太坊虚拟机 (EVM) 环境中测试人工智能 (AI) 的能力。

该系统在三个不同的模式下评估代理：漏洞检测、功能性代码修补和端到端执行抽取资金的攻击。最近的测试显示，GPT-5.3-Codex 模型在攻击任务中取得了 72.2% 的成功率，相比六个月前 GPT-5 记录的 31.9% 评分有了显著提高。

“在这一领域衡量模型的能力有助于跟踪新兴的网络风险，并突显使用 AI 系统进行审计和增强已部署合约防御的重要性，”OpenAI 的公告中提到。

🧭 常见问题解答

• EVMbench 框架的主要目的是什么？ 它衡量 AI 代理识别和解决高严重性智能合约漏洞的有效性。

• 哪些组织合作开发了这个新的安全基准？ OpenAI 和加密投资公司 Paradigm 共同开发了 EVMbench 测试环境。

• 系统如何验证代理是否成功修补了代码？ 自动化测试确保在不破坏合约预期功能逻辑的情况下消除了漏洞。

• 使用这些工具的研究人员是否有财务支持可用？ OpenAI 承诺提供 1000 万美元的 API 信用额，以支持防御性网络安全研究。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

OpenAI 和 Paradigm 推出 EVMbench 以衡量 AI 智能合约安全性

🧭 常见问题解答

bitcoin.com的精選文章

目錄

相關文章