让AI自证清白:透明度应成为架构而非事后补丁

CN
11 小時前

观点作者:Avinash Lakshman,Weilliptic创始人兼首席执行官


当今的科技文化喜欢首先解决令人兴奋的部分——巧妙的模型、讨人喜欢的功能——并将问责制和道德规范视为未来的附加功能。但当AI的底层架构不透明时,任何事后故障排除都无法阐明和从结构上改进输出的生成或操纵方式。


这就是为什么我们会遇到Grok将自己称为"假埃隆·马斯克"以及Anthropic的Claude Opus 4在意外删除公司代码库后诉诸谎言和勒索的案例。自这些头条新闻曝光以来,评论员将责任归咎于提示工程、内容政策和企业文化。虽然所有这些因素都发挥了作用,但根本缺陷是架构性的。


我们要求从未为审查而设计的系统表现得好像透明度是原生功能一样。如果我们想要人们可以信任的AI,基础设施本身必须提供证明,而不是保证。


当透明度被设计到AI的基础层时,信任就会成为推动者而非约束。


在消费者技术方面,道德问题通常被视为产品规模化后需要解决的发布后考虑因素。这种方法类似于在聘请工程师确认地基符合规范之前建造一座30层的办公大楼。你可能会幸运一段时间,但隐藏的风险会悄悄积累,直到出现问题。


当今的中心化AI工具也不例外。当一个模型批准欺诈性信贷申请或产生医疗诊断幻觉时,利益相关者将要求并理应获得审计追踪。哪些数据产生了这个答案?谁微调了模型,如何微调的?哪个防护措施失效了?


当今大多数平台只能混淆和转移责任。它们所依赖的AI解决方案从未被设计为保留此类记录,因此不存在或无法追溯生成这些记录。


好消息是,使AI值得信赖和透明的工具是存在的。在AI系统中强制执行信任的一种方法是从确定性沙盒开始。相关:密码朋克AI:2025年无审查、无偏见、匿名AI指南


每个AI代理都在WebAssembly内运行,因此如果你明天提供相同的输入,就会收到相同的输出,这对于监管机构询问为什么做出某个决定时至关重要。


每次沙盒发生变化时,新状态都会被加密哈希并由一小群验证者签名。这些签名和哈希被记录在区块链账本中,任何单方都无法重写。因此,账本成为不可变的日志:任何有权限的人都可以重放链并确认每一步都完全按记录发生。


由于代理的工作内存存储在同一账本上,它可以在崩溃或云迁移后继续存在,而无需通常的附加数据库。训练产物(如数据指纹、模型权重和其他参数)也以类似方式提交,因此任何给定模型版本的确切血统都是可证明的,而不是传闻性的。然后,当代理需要调用外部系统(如支付API或医疗记录服务)时,它会通过策略引擎,该引擎会在请求中附加加密凭证。凭据保持锁定在保险库中,凭证本身与允许它的策略一起记录在链上。


在这种面向证明的架构下,区块链账本确保不可变性和独立验证,确定性沙盒消除不可重现的行为,策略引擎将代理限制在授权操作范围内。它们共同将可追溯性和策略合规性等道德要求转变为可验证的保证,有助于催化更快、更安全的创新。


考虑一个数据生命周期管理代理,它对生产数据库进行快照、加密并在链上存档,并在几个月后处理客户的删除权请求,同时掌握这些上下文。


每个快照哈希、存储位置和数据删除确认都会实时写入账本。IT和合规团队可以通过检查一个可证明的工作流程来验证备份是否运行、数据是否保持加密以及是否完成了适当的数据删除,而不是筛选分散的、孤立的日志或依赖供应商仪表板。


这只是自主的、面向证明的AI基础设施如何简化企业流程的无数例子之一,在保护企业及其客户的同时,开启全新形式的成本节约和价值创造。


最近AI的头条失败案例并没有揭示任何单个模型的缺陷。相反,它们是"黑盒"系统的无意但不可避免的结果,在这种系统中,问责制从未成为核心指导原则。


一个携带自身证据的系统将对话从"相信我"转变为"自己检查"。这种转变对监管机构、个人和专业使用AI的人以及名字最终出现在合规信函上的高管都很重要。


下一代智能软件将以机器速度做出重大决策。


如果这些决策仍然不透明,每个新模型都是新的责任来源。


如果透明度和可审计性是原生的、硬编码的属性,AI自主性和问责制就可以无缝共存,而不是处于紧张状态。


观点作者:Avinash Lakshman,Weilliptic创始人兼首席执行官。


相关推荐:Grok、DeepSeek在加密交易竞赛中超越ChatGPT、Gemini


本文仅供一般信息参考,不应被视为法律或投资建议。此处表达的观点、想法和意见仅代表作者个人,不一定反映或代表Cointelegraph的观点和意见。


原文: 《 让AI自证清白:透明度应成为架构而非事后补丁 》

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接