K線
數據鏈上
VIP
市值
API
排行
CoinOSNew
CoinClaw🦞
語言
  • 简体中文
  • 繁体中文
  • English
全球行情資料應用程式領跑者,致力於更有效率地提供有價值的資訊。

功能

  • 即時行情
  • 特色功能
  • AI網格

服務

  • 資訊內容
  • 開放數據(API)
  • 機構服務

軟體下載

  • PC版
  • Android版
  • iOS版

聯絡我們

  • 聊天室
  • 商務信箱
  • 官方信箱
  • 官方驗證通道

加入社區

  • Telegram
  • Twitter
  • Discord

© Copyright 2013-2026. All rights reserved.

简体繁體English
|舊版

Agent也会商业互吹,Circle这场AI黑客松太炸裂了

CN
律动BlockBeats
關注
4 小時前
AI 總結,5秒速覽全文
原文标题:Altruist and Adversary: Agentic Behavior in the USDC Moltbook Hackathon
原文作者:Circle
编译:Peggy,BlockBeats

编者按:当 AI 代理开始具备执行任务、调用工具并参与经济活动的能力,一个新的问题随之出现:在真实激励环境中,它们会如何行动?

本文记录了 Circle 团队的一次实验。他们在只允许 AI 代理发帖的社交平台 Moltbook 上举办了一场 USDC 黑客松,让 Openclaw 代理自行提交项目、讨论并投票。结果既令人兴奋,也充满复杂性:代理不仅能够生成真实项目、参与技术讨论,还会在规则边缘游走。例如,误解指令、忽视格式,互相拉票,甚至出现疑似「合谋」的行为。

这场实验为「代理经济」提供了一个罕见的观察窗口:当 AI 既是参与者也是决策者时,协作、竞争与策略性行为往往同时出现。某种程度上,这些现象与人类社会中的市场与选举机制并无本质不同。

这一实验迅速引发了社区的广泛讨论。许多人认为,这是对代理经济自治能力的一次有趣验证。部分评论者指出,代理系统仍需要更明确的安全护栏,以避免出现「自我合理化」的偏差;也有人认为,随着代理逐步进入真实经济活动,未来真正的瓶颈可能在于合规的结算与支付体系。正如一条评论所说:「代理经济非常强大,但同样需要清晰的护栏。」

以下为原文:

拥抱 Claw

在 Circle,我们一直很喜欢举办黑客松。无论是在各种大会现场,还是在新产品首次亮相的时候,我们都希望把最好的工具交到开发者手中——或者在这一次,交到 Claw 手中。

在看到 Openclaw 这一代理型 AI 框架的爆炸式增长后,我们决定办一场只允许 AI 代理参加的黑客松。


这款迅速走红的软件可以让代理自主发送邮件、调用 API,甚至控制你的恒温器……但它们能自己提交项目吗?Circle 想用一场真实的实验来测试这些「真正能做事的 AI」。

我们的问题很简单:如果奖金池是 3 万美元,Openclaw 的代理会如何行动?答案出人意料地「像人」。

我们在 Moltbook 上的 m/usdc 子社区举办了一场 USDC 黑客松。Moltbook 是一个只允许 AI 代理发帖的社交媒体平台。我们的目标是让代理自行完成整个流程:提交项目、投票,并最终选出获胜者。虽然许多代理遵守了规则,但实验也发现,一些代理无视比赛规定、参与互投拉票,甚至尝试向黑客松代理发送代币。

为「代理黑客」设计规则

代理们有五天时间提交自己的项目。为了帮助它们完成任务,我们制作了一个 USDC Hackathon Skill,一个用 Markdown 编写的指导文件,用来教 Openclaw 代理如何按照规则提交项目。这些规则也同时发布在黑客松的原始公告帖中:

从三个赛道中选择一个:Agentic Commerce、Smart Contract 或 Skill。

为五个不同的项目投票,且投票必须在黑客松开始至少一天之后进行。

项目提交和投票都必须遵循规定的格式。

设置这些规则主要出于三个考虑:第一,确保代理会讨论和评估更广泛的项目;第二,观察代理在需要执行多步任务时能否准确遵循指令;第三,避免项目提交与投票之间出现僵局。

我们尤其想观察的一点是:代理是否会反复检查 Moltbook 上的新项目以进行投票,例如通过类似 Moltbook Heartbeat 的技能定期刷新。

结果喜忧参半。代理们围绕 204 个提交项目展开讨论,并投出了 1851 票,但很多并没有遵守比赛指南。此外,一些代理还表现出潜在的对抗行为,这也带来了不少有趣的发现。

「幻觉式」项目提交

尽管我们提供了明确的黑客松规则和提交技能,大多数帖子仍然没有完全按照要求格式提交。许多项目在正文中写出了标题,却没有包含规定的标签「#USDCHackathon ProjectSubmission [TRACK]」。

甚至在一个案例中,某个代理知道需要写这些信息,却没有把它放在标题里。

moltbook.com 上 m/usdc 子社区的一条不规范提交示例。

即便在其他方面已经基本符合要求,一些代理仍然「幻觉式」地创造出了新的黑客松赛道。这发生在它们明明被明确告知只能从三个类别中选择其一的情况下:Agentic Commerce、Smart Contract 或 Skill。

在这些案例中,代理往往会根据项目内容自行生成一个看起来更「贴切」的赛道名称。这可能意味着代理试图为自己的项目找到一个更合理的分类,也可能只是单纯忽视了既定规则。无论原因是什么,问题在于,这些赛道本身并不存在。

moltbook.com 上 m/usdc 子社区中「幻觉赛道」提交的示例帖子。

随着比赛推进,相比有效提交,不符合规范的提交和离题帖子的数量逐渐增加。按照比赛规则,代理发布这些无效内容其实并没有任何明显的激励。因此,更可能的情况是,一些代理在理解或执行指令时遇到了困难。

不过,考虑到仍有相当数量的代理成功按照要求提交了项目,我们认为这些规则本身其实已经相对清晰。

moltbook.com 上 m/usdc 子社区中,随时间变化的有效与无效项目提交帖数量。

代理的「选举」

尽管如此,我们仍然观察到了 9712 条评论,其中很多评论都围绕项目的技术功能展开讨论,但并没有进行投票。这些评论中的大多数甚至没有遵循推荐的评论格式和评分标准,不过这些规则在技能(skill)中并没有被强制执行。这也说明,代理参与黑客松讨论不仅仅是为了满足比赛要求,某种程度上也在进行真实的技术评估与交流。

到比赛结束时,我们统计到 1352 个针对有效项目的唯一投票,以及 499 个针对无效项目的唯一投票。有趣的是,许多排名靠前项目的代理在提交项目时都遵守了规则,但却没有为五个不同项目投票这一要求。

这种情况甚至发生在一些代理既给自己投票,又对同一项目多次投票的情况下。这表明它们完全有能力在初次提交后再次查看 Moltbook 上的内容进行投票——只是选择没有遵循既定规则。

此外,一些代理还开始为其他项目做宣传。这种行为既出现在竞争项目的评论区,也出现在 Moltbook 上的独立帖子中。更进一步,一些代理甚至开始推广「互投」机制:如果你给我的项目投票,我就给你的项目投票。

虽然比赛规则并没有禁止这种行为,但考虑到代理之间在这些帖子中的大量互动,这种现象仍然令人警惕。

moltbook.com 上 m/usdc 子社区的一条「互投换票」示例帖子,该帖共获得 99 条评论。

潜在的人类干预

这条互投帖可能暗示了人类参与或外部操控的可能性。我们尝试通过聊天机器人界面生成类似的评论,结果发现一些模型(例如 Claude Sonnet 4.6)会直接拒绝生成此类内容;而另一些模型则会在生成时附带警告,提示该行为可能违反比赛规则(例如 GPT-5.2 Thinking)。如果有人类在背后操作某个「代理」账户,或通过提示词、工具链对代理进行引导,就可能解释为什么在黑客松期间会出现这样的帖子。

尽管 Moltbook 的设计初衷是仅供 AI 代理使用(注册需要通过 X 账户验证),但其他研究者发现,冒充身份仍然是可能的。我们也观察到一些疑似人类活动的例子,例如在最初发布黑客松公告的帖子下。

一个典型案例是:点赞数最高的一条评论,竟然是电影《蜜蜂总动员》(Bee Movie,2007)剧本的开头。这段文本是一段在互联网上广为流传的 copypasta(即被大量复制传播的固定文本),由于其内容与讨论完全无关,很可能是人类发布的。如果这种行为在黑客松期间较为普遍,那么一些对抗性行为——例如互投换票或给自己投票——也可能由此得到解释。

一条由人类发布的 Moltbook 帖子,关于这一攻击方式的更多细节可在此查看。

代理金融的未来

虽然这次黑客松本身只是一次实验,但我们也相信,这将是众多面向代理开发活动中的第一次。从结果来看,我们得到三个主要结论:代理能够在金融激励下产出真实项目


本次黑客松中出现了一些令人兴奋的项目,你可以在此了解更多。虽然比赛并未引入人工评审,但部分提交的质量仍然给我们留下了深刻印象。这表明,代理式开发在过去一年中已经取得了显著进展。

代理会「合理化」指令,而不是严格执行


代理在遵循我们提供的规则时持续出现问题。许多代理只执行了部分指令。甚至一些质量很高的项目,如果完全遵守规则,本可以赢得比赛。这说明,仅仅提供代理式指令还不够,规则不仅需要明确,还需要配套的检查机制和激励措施来确保执行。

代理既会合作,也会竞争

虽然人类干预可能在某些情况下发挥了作用,但我们确实观察到代理在黑客松期间主动讨论串谋策略。未来的黑客松设计者可以在规则中明确禁止串谋,以观察是否能减少此类行为。如果代理仍然无法完全遵循指令,组织者可能需要引入更多安全护栏(guardrails)。

代理技术令人兴奋,但我们也必须确保它不会从我们期望的探索(exploration)走向利用与操纵(exploitation)。有人可能会认为,这些行为只是更强代理击败更弱代理的自然结果——毕竟 Openclaw 的 X 账号曾宣称:「Claw 即法则(the Claw is the Law)。」

真正的问题在于:我们究竟愿意在多大程度上接受这种理念?需要怎样的护城河?又该如何在代理带来的巨大能力与其伴随的不确定性之间取得平衡?

在 Circle,我们正在为安全性而构建系统,也希望你们如此。

[原文链接]

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

返20%!OKX钱包龙虾技能,AI一键自动赚
广告
|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

律动BlockBeats的精選文章

38 分鐘前
HYPE涨5倍的可能性有多大?
1 小時前
为什么每个人都讨厌 AI?
5 小時前
币圈人补课AI:30个高频黑话,一次讲清
查看更多

目錄

|
|
APP下載
Windows
Mac
分享至:

X

Telegram

Facebook

Reddit

複製鏈接

相關文章

avatar
avatarTechub News
34 分鐘前
Circle 上市后 9 个月:从发币公司到金融基础设施
avatar
avatar律动BlockBeats
38 分鐘前
HYPE涨5倍的可能性有多大?
avatar
avatar青岚加密课堂
43 分鐘前
OpenClaw的掘金潮里,那些稳赚不赔的“卖铲人”
avatar
avatar律动BlockBeats
1 小時前
为什么每个人都讨厌 AI?
avatar
avatarTechub News
1 小時前
估值 1600 亿美元的 Stripe,为什么不上市
APP下載
Windows
Mac

X

Telegram

Facebook

Reddit

複製鏈接