当钱包开始嵌入 AI Agent:ERC-8211 的新交互范式,为什么值得关注?

Favoritecollect
Shareshare

2025 年开始,很多人或许逐渐开始习惯一种新的交互方式:对 GPT 或 Gemini 说一句「帮我规划下周去香港的行程,并推荐合适的机票酒店」,它就会在后台默默完成信息搜索、条件筛选、路线选择、价格比较等一连串步骤,最后只把结果交给你确认。

只不过,把同样的期待带到链上,故事却完全变了。

譬如你对一个 DeFi Agent 下达指令:「把钱包里的 ETH 换成 USDC,跨到 Base 链,再全额存进 Aave」,客观而言,从「理解需求」和「规划路径」来看,今天的 Agent 并不一定做不到,真正的断层出现在执行环节:

你依然很可能要逐步完成签名、授权、兑换、跨链与存款等操作,,而且每一步都暴露在滑点变化、Gas 波动、桥接延迟和链上状态变化的风险之下,这也意味着只要中间有一环偏离预期,前面的动作未必能撤回,后面的动作又可能接不上,最后留在链上的,往往只是一段没做完的半成品流程。

问题不在于 AI 不够聪明,而在于链上执行层至今还缺少一种真正适配 Agent 的表达方式。

也正因为如此,2026 年 4 月初,Biconomy 与以太坊基金会共同发布的 ERC-8211,旨在解决当前智能合约执行中的「静态限制」问题,为 AI 代理及复杂 DeFi 工作流提供更具表现力的执行层,试图补上这块缺失的拼图。

一、AI Agent 接入链上的「最后一道断层」

过去一到两年里,加密行业的注意力焦点正在从 L2 扩容、RWA 流动性,明显转向 AI Agent 如何真正接管链上操作这个颇具颠覆性的选题。

客观而言,从「用自然语言下达多步 DeFi 策略」到「让自主 Agent 托管一整条跨链投资组合」,近期我们也见到了诸多实践,且大部分构想在 demo 层面已经成熟,无论是自然语言生成多步 DeFi 策略、自主执行再平衡、自动收益迁移、跨链仓位调整,甚至是更复杂的组合管理。

从推理和编排的角度看,AI 的能力已经跑得相当快了,只不过当真正把它放进生产环境,执行层的短板却越来越明显。

真要落到生产环境,这一短板可以概括成一句话:DeFi 是动态的,但今天的大多数 batch(批处理) 仍然是静态的。

ERC-8211 官网和讨论帖都把这个问题说得很清楚,即现有的 ERC-4337 与 EIP-5792,确实已经把「一次签名对应一笔调用」的旧模式,推进到了「一次签名可打包多笔调用」的新阶段,但这些调用中的参数,本质上仍然大多是在签名那一刻被冻结的。

也就是说,用户在签名时填进去的金额、目标值、预期输出,到了真正执行时,并不会因为链上状态变化而自动调整。

可 DeFi 本身恰恰是充满不确定性的。一次 Swap 的实际输出,取决于执行那个区块里的滑点和流动性;一次 Bridge 的到账时间和最终到账金额,取决于桥本身的机制和费用;借贷协议或 Vault 的 share-to-asset 比率,也会在不断变化。

毕竟用户或 Agent 在签名时看到的数值,很多时候只是一个当下的预估,而不是执行时的真实结果。

要理解 ERC-8211 解决了什么,先看一个最典型的例子,就是假设 Agent 想做一件看起来很普通的事——把账户里的 ETH 换成 USDC,然后全额存入 Spark 赚取利息。

在现有静态 batch 处理模型下,Agent 必须在签名前预估 Swap 之后会拿到多少 USDC,往往迫使你在签名时提前写死第二步的输入金额,且估得太高,真实到账数字不够,整个批次直接回滚;估得太低,又会留下一部分资金闲置在钱包里做不了事。

换言之,基本就陷入了所谓的两难处境,要么承担失败风险,要么承担机会成本。这就是为什么,很多看起来并不复杂的链上流程,一旦步骤拉长到 5 步、8 步,甚至跨两条链,就会迅速变得脆弱,这不是因为策略本身复杂到无法描述,而是现有执行范式太依赖预先写死的参数。

简言之,静态 batch 的能力上限,事实上决定了 Agent 能真正安全执行的策略上限。

从这个角度看,ERC-8211 想解决的,并不是 AI Agent 怎么做决策,而是当 Agent 已经做出决策之后,链上有没有一种更自然、更稳定、更安全的方式来执行它。从而让链上执行第一次拥有一种为 AI Agent 原生设计的表达形式。

二、ERC-8211 到底改了什么?

ERC-8211 的核心突破,不在于把更多步骤塞进一次签名,而是把 batch 处理从一段参数写死的交易序列,升级成一段「参数在执行现场动态求值的程序」。

听起来确实很抽象,但并不难理解,官方用了一句话来描述它:From transactions to programs。

这意味着 ERC-8211 不再把 batch 看作一份按顺序执行的动作清单,而是把它视为一段运行时求值、并带安全条件的执行程序,具体拆解的话,它通过三种可组合的原语实现这一点:

  • Fetchers(取值器):定义了这个参数从哪里取值,它可以是一次对某个地址当前余额的查询,使得参数不再是签名时的快照,而是执行瞬间从链上状态中抓取的实时读数;
  • Constraints(约束器):参数被解出来之后,还要通过内联约束检查——例如「换得的 USDC 至少要 ≥ 2500」,或「滑点不能超过 0.5%」,这些约束在值被路由进下一笔调用之前完成校验,任何一项不通过,整个批次立即回滚;
  • Predicates(触发条件):可以理解为介于步骤之间的守门人,不负责产生值,而是负责判断是否继续执行,比如跨链场景里,以太坊这一侧的 batch 可以通过 predicate 守在「跨链过来的 WETH 已经到账」这个条件上,到账之前一直不提交;

在这套设计里,每一个参数都要回答两个问题:第一,这个值执行时该从哪里来;第二,它被真正用进调用之前,需要满足什么条件,这样三者组合后,一个批次不再只是交易序列,而是一段内嵌安全检查的程序。

说到底,静态 batch 处理的心智模型是一份清单——按顺序执行 A、B、C 三步;而 ERC-8211 的心智模型则是一份带条件的程序——A 执行后,取 A 的真实输出作为 B 的输入;B 满足约束才进入 C;任何一步不达预期,整批回滚。

我们其实可以把它简单理解为一个专门为 AI Agent 和复杂 DeFi 操作设计的「智能批处理」机制,因为在传统的链上操作中,完成一笔复杂的 DeFi 策略往往需要多个独立交易:从借贷协议提取资金、兑换代币、再存入另一个协议(延伸阅读《 加密 AI 协议全景:从以太坊的主战场出发,如何为 AI Agent 搭建新操作系统? 》)。

每一步都需要单独签名和确认,这对人类用户来说已经繁琐,对需要高频自主操作的 AI Agent 来说更是瓶颈,而 ERC-8211 的解决方案是允许多个区块链操作在一笔交易中组合执行,每一步在执行时动态解析实际数值,且必须满足预定义条件后才能继续下一步。

例如一个 Agent 可以在一笔签名交易中完成:从 Aave 提取资金 → 将实际收到的金额在 Uniswap 上兑换 → 将兑换结果存入 Compound——全部原子化执行,无需编写新的智能合约。

三、为什么说它和钱包、尤其是智能钱包关系更大

ERC-8211 之所以值得钱包行业关注,不只是因为它适合 Agent,更因为它会重新定义钱包在交互链路中的位置。

过去的钱包,更像是一个安全签名器,它的职责是保管私钥、展示交易、让用户确认,再把签名发出去,这个角色在 EOA 时代已经足够重要,在账户抽象时代也继续成立,但如果未来越来越多的链上操作由 Agent 来代为完成,那么钱包的角色就会更加居中与吃重。

原因很简单,当用户不再逐笔操控链上动作,而是开始授权一个 Agent 去执行一整套目标时,钱包必须有能力承接这种更高层的交互对象,它要展示的不再只是某个合约地址和一段 calldata,而是一整段「意图—取值逻辑—条件判断—最终结果」的执行程序。

因此,未来的钱包需要理解的,不再只是交易,而是程序。 ERC-8211 正是在这一层给钱包提供了一个更清晰的抓手,因为它把这些执行语义都显式写进了编码结构中,包含参数从哪里来、必须满足什么条件、什么时候继续、什么时候回滚,都不是隐藏在后端逻辑里的黑箱,而是可被钱包解释、模拟和展示的对象。

从钱包视角看,这一整套机制最终指向的是同一件事,即 用户不再是在签一串自己很难完全读懂的底层调用,而是在签一份结果导向、边界清晰、条件可验证的执行程序:

  • AI Agent 可以负责理解用户意图、生成路径;
  • 钱包负责把这条路径用更清楚的方式展示给用户审核;
  • 而 relayer 只负责在条件成立时提交,不拥有篡改结果的权限;

这正是非托管执行之所以会被视为 Agentic DeFi 前提的原因,因为智能体可以参与,但主权、约束和最终结算仍然留在链上,这也是 ERC-8211 与智能钱包真正契合的地方,就是它把「安全表达复杂意图」这件事,写进了协议层标准里。

值得一提的是,ERC-8211 与 ERC-4337、EIP-7702、ERC-7579 等账户抽象框架完全兼容,它不替代账户抽象,而是在账户抽象之上,为 Agent 新增了一层程序化执行语义。

如果说 ERC-4337 解决了「谁能代表我发起交易」,EIP-7702 解决了「EOA 如何临时拥有智能合约能力」,那么 ERC-8211 解决的就是 一旦 Agent 开始替我操作,它能不能在一次签名里完成一整条决策链。

回看以太坊过去 10 年链上交互范式的演化:

  • 第一阶段:一次签名 = 一次函数调用(EOA 时代)
  • 第二阶段:一次签名 = 一组静态打包调用(ERC-4337、EIP-5792 时代)
  • 第三阶段:一次签名 = 一段动态求值的意图程序(ERC-8211 时代)

每一次跃迁,都意味着用户(或代表用户的 Agent)能用更少的摩擦,表达更复杂的目标。

虽然 ERC-8211 目前仍处于草案阶段,技术讨论仍在进行,大规模的协议接入也还需要时间,但它指向的方向已经足够清晰,当 AI Agent 真正开始替人做链上决策,链上就需要一种与之匹配的、原生的执行语法。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup