Flashbots 研究:MEV 如何吞噬区块链扩容红利
作者:Robert Miller,Flashbots
编译:Saoirse,Foresight News
今天,我们提出一个新论点:MEV(最大可提取价值)已成为区块链扩容的主要限制因素。
当以太坊及其 Layer2 网络、Solana 等主流公链正竞相以最快速度扩容时,MEV 带来的经济限制已在整个行业显现。链上搜索行为正以惊人的资源浪费方式,开始占据大多数高吞吐量区块链的主要容量。
这并非理论假设或个别现象。从 Solana(MEV 机器人消耗 40% 区块空间)到以太坊 Layer2 生态,这种情况随处可见。为量化影响,我们对支持特定追踪端点的顶级 OP-Stack Rollup 进行了深度分析,结果揭示了一个全行业问题:
数据库分片(如 Rollup)、有效性证明、数据库或共识机制优化等技术扩容手段固然重要,但仅靠技术无法解决问题。我们虽已掌握构建基础技术吞吐量的方法,但当前市场结构对扩容施加了经济层面的限制。
本文将剖析这一市场失灵现象,用数据展示其影响,并提出一种旨在解决该问题的新型 MEV 拍卖机制。
为理解区块空间为何被浪费,我们先拆解一笔成功的套利交易:
Base 上的成功套利交易示例
乍一看,这似乎是效率典范:搜索机器人执行精准套利,获利 0.12 美元并支付 0.02 美元手续费。
但这笔成功套利的真实成本令人震惊:每完成一次成功套利,该机器人会发送约 350 笔尝试套利的交易(多数失败)。平均而言,单次成功套利需消耗约 1.32 亿 Gas—— 相当于近 4 个完整的以太坊区块。需注意的是,这只是参与竞争的众多机器人之一,链的实际成本反而更高。
现在来看一次典型的失败尝试,以理解机器人的链上行为:
盲目寻找套利机会的失败交易示例
乍看这笔交易并无异常:执行成功且未进行代币转移。唯一的线索是它消耗了约 260 万 Gas(如上图所示)。
深入追踪其内部调用可发现,它对数十个不同 DEX 池发起了一连串调用,通过 getReserves () 和 slot0 () 查询池状态。这些调用本质上是在获取不同 DEX 上的资产价格。
展示 slot0 () 和 getReserves () 重复调用的追踪示例
该机器人的核心逻辑很简单:
上述交易就是这四个步骤的体现,最终终止且未执行任何操作。实际上,它只是一次高强度的价格查询,消耗约 260 万 Gas 却仅读取市场状态而无实质动作。
在 Base、World 和 Solana 等公链上,这种策略已成为提取 MEV 的主流方式。少数成功交易需为大量失败尝试买单,这对搜索者而言是理性选择,却对网络造成了系统性低效。
大量资源被用于读取价格却不产生实质价值。而且并非只有这一个搜索者如此,所有搜索者为捕获原子级 MEV 都不得不采用这种策略。最终结果正如数据所示:公链被垃圾交易堵塞,手续费因垃圾交易而上涨。(注:原子级 MEV 强调在单次链上操作(如单笔交易或单个区块内)中实现的价值提取,常见于套利、抢跑等利用区块链即时性和交易顺序的场景。)
高吞吐量公链被垃圾交易堵塞并非偶然,而是市场结构缺陷引发的直接且「理性」的反应:搜索者若想通过读取区块最新状态并以此获利,就必须盲目地在同一区块内发起交易。
前文剖析的套利机器人正是典型案例。链下查询虽能获取上一确认区块的状态,但这滞后于当前构建区块中交易正在创造的 MEV 机会。在 Base 或 Solana 等网络中,原生内存池(mempool)是私密的,这意味着搜索者在区块发布前,无法知晓用户交易的执行情况及其创造的机会。若想发现并捕获套利空间,唯一的方法是让自己的交易在用户交易之后立即纳入同一区块。一旦等待下一个区块,机会就会被抢先。
猖獗的链上搜索现象源于以下因素的相互作用:
1.交易表达性
不同于传统金融中交易者提交简单静态订单(如「以 X 价格买入」),搜索者可创建作为链上程序的交易,嵌入基于市场即时状态执行的条件逻辑,实现原本不可能的复杂响应式策略。
2.转向私密内存池
为保护用户免受抢跑,多数高吞吐量公链将内存池设为私密。这虽能有效防御抢跑,却也让搜索者无法看到用户订单流。由于无法在交易上链前做出反应,搜索者只能通过发起高表达性交易,在链上盲目探测机会。
3.低廉的手续费
低成本的区块空间进一步放大了链上搜索行为。搜索者深知,单次成功套利的利润可覆盖大量失败交易的成本,因此敢于向每个区块发送海量投机性交易。而 Gas 费越低,搜索者越能编写更复杂的逻辑,追求更复杂的策略。[1]
4.缺乏高效拍卖机制
搜索者之间的竞争缺乏正式的交易排序偏好表达机制。由于无法通过直接方式为区块中的特定交易排序竞价,竞争退化为一种浪费的替代手段:消耗更多 Gas。搜索者提高胜率的主要方式,就是在区块的更多位置消耗 Gas,以增加交易落在「正确位置」的概率。
这四大因素共同催生了「垃圾交易拍卖」,一种极度浪费的机制,既助长了网络拥堵,又未能有效捕获 MEV 价值。为量化垃圾交易造成的低效规模,我们进行了数据验证。
分析证实,MEV 驱动的垃圾交易对扩容构成了经济限制。
我们通过识别「重复查询 DEX 但不转移代币」的交易来定义垃圾交易。这一启发式方法旨在定位本可在链下完成、却被迫上链的系统性浪费型「后跑」(backrunning)套利行为。我们在 Python 工具和 Dune 仪表盘上均实现了该方法,具体方法论详见附录。
由于垃圾交易检测工具依赖特定 RPC 方法,当前数据分析仅限于 OP-Stack Rollup。但 Ghost Logs 团队的数据表明,Solana 也存在类似现象,且其他以太坊 Rollup(如 ZKsync、Arbitrum)也被发现有垃圾交易迹象。
首先,这一问题具有系统性且广泛存在。对 OP-Stack Rollup 的分析表明,垃圾交易并非孤立现象,而是整个生态系统中的主导力量。在 Unichain、Base 和 OP 主网等链上,垃圾交易通常消耗超过 50% 的总 Gas。由此可见,这是当前市场设计的结构性后果,而非局部异常。
第二项发现显示,从链的角度看,垃圾交易的效率极低。
在我们分析的所有 Rollup 中,垃圾交易消耗的资源与其产生的收入之间存在巨大差距。相比其他用户,垃圾交易机器人消耗的 Gas 量是其支付手续费的数倍。例如,OP 主网上的垃圾机器人消耗了约 57% 的 Gas,却仅支付了约 9% 的手续费,差距达 6 倍之多。
手续费支付与 Gas 消耗的差距表明,垃圾交易给网络带来了巨大的外部成本,却几乎未提供相应价值,这是系统性低效市场的典型特征。其中包括实实在在的计算资源浪费,因为每个全节点都被迫执行这些交易,从而提高了所有网络参与者的硬件要求。
此外,我们还分析了 L2 中的垃圾交易如何影响 Rollup 对 L1 数据可用性(Data Availability)的使用。
数据显示,在 2025 年 2 月的一百万个区块中,Base 上的垃圾机器人贡献了约 56% 的 Gas 消耗、26% 的 L1 DA(Data Availability 数据可用性)用量,以及 14% 的链上手续费。垃圾机器人的 DA 用量占比起初让我们感到意外,但随后发现这与其交易数量占比(而非 Gas 消耗)相关。这是合理的,因为 DA 用量取决于数据压缩效率,而非 Gas 消耗量。
第三,这种低效直接抵消了扩容的好处。为衡量垃圾交易的负面影响,我们引入了一个新指标:有效 Gas 吞吐量,即 Rollup 扣除垃圾机器人消耗后,每秒处理的用户可用 Gas 量。
Base 的趋势尤为明显:2024 年 11 月,总 Gas 吞吐量为 1500 万 Gas / 秒,而用户的有效 Gas 吞吐量仅为 1200 万 Gas / 秒。在接下来的四个月里,总吞吐量虽增加了 1100 万 Gas / 秒,但有效吞吐量几乎保持不变。换句话说,几乎所有新增的处理能力都被垃圾交易占据。
有趣的是,2 月底之后,有效吞吐量开始与总吞吐量的增长趋势更趋一致。这似乎与市场交易量(及由此产生的 MEV)相关:2 月 14 日「Libra 丑闻」爆发后,随着 Telegram 机器人交易的 Memecoin 交易量下降,有效吞吐量重新开始增长。
或许对用户最直接的影响,是垃圾交易的持续存在人为推高了交易手续费的基准线,并使其长期居高不下。
尽管 Rollup 的扩容举措已将名义手续费降至极低水平(例如约 0.01 美元),让许多自然用户对价格不再敏感,但理论上,若区块空间充足、用户对价格不敏感,再加上 EIP-1559 手续费市场机制的作用,手续费本应趋近于绝对最低值。扩容的愿景正是创造足够的容量,使这种近乎零手续费的状态成为常态。
但实际情况并非如此。试图通过垃圾交易捕获 MEV 的搜索者正用海量交易塞满区块,消耗大量 Gas。这种行为推高了区块利用率,导致基础手续费持续上涨,这更多反映了 MEV 市场的系统性低效,而非自然用户的真实需求。
尽管终端用户承担的手续费仍处于低位,但整体水平已远高于实际所需。这一问题的关键点在于:那些依赖大量廉价区块空间的创新应用场景(如链上社交网络或自动化微支付)正因此被排除在市场之外。
最后,分析显示,MEV 垃圾交易的搜索者市场呈现极端集中化特征。
为验证这一点,我们统计了区块高度 26000000 至 26900000 中,哪些智能合约消耗了最多被归类为「垃圾交易」的 Gas。初步观察时,市场看似头部占比较高但结构分散。
但这一表象具有欺骗性。链上分析显示,搜索者常用的策略是轮换用于发送垃圾交易的智能合约,但将利润统一转入固定的「获利地址」。通过追踪成功套利交易的 ETH 转账路径,我们尝试识别由同一运营方控制的智能合约。尽管并非所有机器人都采用此模式,但头部机器人普遍如此。
当按获利地址对数据进行分组后,市场集中度变得极为显著:
结果很明显,仅两家机构就主导了 Base 上 80% 以上的垃圾交易。这种极端集中化表明市场存在明显进入壁垒,且当前的「垃圾交易拍卖」并非真正的竞争性市场。竞争缺失进一步削弱了价格发现机制,导致公链既无法捕获被提取 MEV 的真实价值,又不得不承受垃圾交易带来的负外部性。
我们认为,区块链应最大限度地在有限的区块空间中容纳有价值的经济活动。
从这一标准来看,当前的「垃圾交易拍卖」机制效率极低:在 Uniswap v3 上完成两笔兑换的套利仅需约 20 万 Gas,而在 Base 上实现相同经济结果却需消耗约 1.3 亿 Gas。效率差距高达 650 倍,而缩小这一差距正是释放扩容真正潜力的关键。
要解决这一问题,先要回到链上搜索成为主流模式的四大原因:交易表达性、内存池隐私性、低廉手续费与缺乏高效拍卖机制。其中,低 Gas 费与高表达性是通用智能合约链的明确目标 [2],我们需要继续强化这些特性。因此,解决方案必须聚焦于另外两点:让搜索者能够读取即将上链的状态,并以既保障用户权益、又最小化链上垃圾交易的方式表达其偏好。
1. 通过可编程隐私实现状态透明化
高效的市场需要为搜索者提供交易流的实时访问权限,同时通过编程方式限制其对信息的使用方式。系统需可验证地确保搜索者仅能进行「后跑」(backrun)交易,而无法实施抢跑(frontrun)、三明治攻击(sandwich)或泄露隐私数据。这种可见性使搜索者能够在链下执行条件逻辑,而非在链上盲目探测。当搜索者在链下生成潜在获利交易后,仍需一种方式将其精准嵌入区块以捕获 MEV。
2. 构建显性竞价的 MEV 拍卖机制
摒弃以 Gas 消耗为竞争维度的「垃圾交易拍卖」模式,转而设计基于经济激励的交易排序权竞价机制。搜索者可直接为目标交易的区块位置提交货币报价,通过市场化定价机制决定交易顺序。这种模式将无序的 Gas 消耗竞争转化为高效的价格发现过程:
Flashbots 已在尝试利用可信执行环境(TEEs)为搜索者提供可见性,同时防止三明治攻击。TEEs 可确保特定代码在执行时,数据即使对机器操作者也保持机密性。
这使得搜索者能在 TEE 中运行,可验证地对私密交易进行后跑,同时无法实施三明治攻击或导出任何隐私数据。我们已在以太坊 L1 上验证了这一模式,搜索者通过类似系统进行后跑交易已持续数月,并正积极将其适配到 L2。
长期以来,关于扩容的讨论一直局限于基础技术吞吐量。但我们的研究表明,关键突破点已不再是扩大区块容量,而是更高效地利用区块空间 [3]。这是因为每释放一单位区块空间,MEV 都会激励垃圾交易消耗新增容量。换言之,「扩容」带来的大部分收益被具备经济理性的 MEV 机器人攫取,真正的用户无法从中获益。这一问题正推高普通用户的手续费、制约扩容成效,并造成海量网络资源浪费。
扩容的局限性正在于此:增加区块空间虽能提升吞吐量,但对手续费的改善有限,因为日益复杂的链上 MEV 会吞噬大部分增益。若想突破这些限制并释放扩容的真正潜力,我们必须摆脱浪费的垃圾交易市场。通过可编程隐私与显性竞价,我们能消除垃圾交易的激励,用富有表现力、公平且高效的 MEV 市场取代「垃圾交易拍卖」。
采用 MEV 拍卖并非奢侈选择,而是战略需要。核心在于利用 TEEs 为搜索者提供交易流访问权限,同时通过编程限制其使用方式。这种设计可实现理想结果:在无垃圾交易的前提下支持后跑套利,同时防范三明治攻击。对区块链而言,这意味着在高效、无垃圾的市场中捕获更多收入;对用户和开发者而言,更低且稳定的手续费与真实可用的容量将最终释放扩容的全部价值。
当我们突破垃圾交易的限制时,世界将发生什么?当交易成本低到几乎可忽略不计时,哪些新可能将被解锁?又会诞生哪些新型应用?答案,唯有实践可证。
感谢 DataAlways、Hasu、Fahim、Danning、dmarz、Nathan、Georgios、Dan、buffalu、Quintus、Tesa、Anika、Brian、Xin、Sam、Eli、Christine、Christoph、Alex、Fred 以及其他许多人提出的宝贵意见。特别感谢 Phil,同时也感谢 Achal 在设计方面提供的帮助。
垃圾交易识别启发式方法
为识别垃圾交易,我们采用了两种启发式规则:
我们认为,在撰写本文时,这些启发式方法是可靠的:任何涉及代币转移的操作通常对用户具有实际价值,而垃圾交易仅在捕获 MEV 机会时才会转移代币。此外,DEX 价格查询规则能有效识别系统性探测套利机会的机器人,这是我们观察到的主要垃圾交易形式。该定义聚焦于仅在链上查询 DEX 价格的浪费性行为,而排除了具有生产性的后跑(backrunning)行为。
但这一定义未来需进一步优化:垃圾交易机器人可通过简单转移代币绕过该规则,因此「垃圾交易」的分类标准仍是值得后续研究的方向。此外,该定义主要覆盖了占 MEV 主流的盲目后跑套利机器人,而未包含清算等其他 MEV 策略。
垃圾交易识别方法论
我们通过分析交易追踪识别垃圾交易:对每笔交易,检查其所有追踪以判断是否调用代币转移函数或 DEX 价格函数(如 slot0()、getReserves() 等)。若交易涉及代币转移,则排除;若未转移代币且发起 4 次及以上 DEX 价格查询,则归类为垃圾交易。
选择 4 次作为阈值是出于保守考虑,实验显示将阈值设为 3 次对整体结果影响甚微。类似地,我们在 Dune 上通过转移事件过滤交易,发现其与基于追踪的方法结果差异不大。
spam-inspect 工具
为研究垃圾交易,我们开发了 spam-inspect,一个专为分析以太坊 Rollup 活动而设计的 Python 工具,旨在高效识别垃圾机器人行为。该工具通过追踪区块内每笔交易,并用上述启发式规则实现分析。
此工具依赖 trace_block 方法,目前仅在支持 OP-Reth 或 OP-Erigon 的 OP-Stack 链上可用。
Dune 查询
我们在 Dune 上构建了物化视图(materialized views),通过过滤包含 Transfer 事件的交易并识别重复 DEX 价格调用,定位符合垃圾交易标准的哈希值。与 spam-inspect 的差异在于,此方法依赖转移事件而非交易追踪。这些垃圾交易物化视图被用于后续查询分析。
数据可用性(DA)估算
尽管本文主要讨论垃圾交易对 Gas 的影响,但其也会消耗其他资源,如 Rollup 对 L1 数据可用性的占用。为估算 L2 垃圾交易浪费的 L1 DA 资源,我们构建了自定义数据管道(复用了 op-batcher 的部分模块),通过两组计算得出结果:
两者差值即为单区块中垃圾交易消耗的 L1 DA 估算值。