让 AI Agent 自己花第一笔链上钱:从“能思考”到“能付款”
你肯定遇到过这种憋屈场景:
- agent 能把流程规划得明明白白
- 也能算出需要买多少数据、调用多少 API、跑多少算力
- 真到付款那一步……你还得爬起来当“人肉确认按钮”
自动化被卡成半自动,原因就一个:agent 没有可控的支付执行权。
这篇就聊一件很具体、很可复现的事:
给 Hermes Agent 接一条“能花钱但受控”的链上支付通道,让它自己完成一次小额 swap(比如 0.47 USDT),全程先模拟、再签名、再上链,触发风控就停下来等你。
我会按“你照着抄就能跑”的方式写,少讲概念,多讲落地。
你要的不是“能转账”,你要的是“能做商业动作”
很多人一上来就说:给 agent 一个钱包地址不就行了?
真跑起来你会发现:钱包≠支付能力。
你需要的是一整套“付款动作”的护栏:
- 交易前模拟(不模拟就签名,属于自杀式自动化)
- 额度上限(钱包余额上限、单笔上限)
- 成本上限(Gas 超过阈值就停)
- 风险分级(低风险自动放行,高风险要你点头)
- 私钥不出安全环境(不然你不是做 agent,你是在做事故)
把这些拼齐,agent 才敢真的“花钱”。
准备清单(别省这一步)
你需要这些东西:
- 一个 Hermes Agent(你已经在用最好)
- 一个可接入的 MCP Server(提供链上能力:查询、模拟、发交易、签名)
- 一个 独立钱包(强烈建议新建,用完就扔)
- 一点点测试资金(建议从 0.5~2 USDT 这种级别开始)
⚠️ 提醒一句:别拿主钱包做实验。真出问题,你会心态爆炸。
核心思路:把“钱包能力”变成 agent 的工具
你要实现的结构大概长这样:
- Hermes 负责推理与决策
- MCP Server 提供工具能力(链上读写、模拟、签名)
- Agentic Wallet(或同类方案)负责:
- 交易模拟
- 风险分级
- 安全签名(私钥不离开安全环境)
- 多链支持(看你用哪条链)
这样 agent 才能做到:
自己判断要不要 swap → 先模拟 → 触发风控就停 → 不触发就签名 → 发链上 → 回传 tx hash
关键配置:System Prompt 里那段“花钱规则”
这一步最容易被写成废话。
你要写得像“产品规则”,清清楚楚能执行。
下面是一个很稳的模板,你直接改地址和阈值就行:
你有一个独立钱包:0xYOUR_WALLET
钱包余额上限:5 USDT。
你可以为完成任务自主使用这笔钱。
执行任何链上交易前:
- 必须先进行交易模拟,并记录模拟结果。
- 若预计 gas 成本 > 0.01 美元,停止并请求人工审核。
- 若单笔交易金额 > 2 USDT,停止并请求人工审核。
- 若模拟结果显示滑点/价格影响异常,停止并请求人工审核。
签名必须在安全环境中完成,私钥不得以任何形式输出或展示。
交易发起后,必须返回:链、tx hash、花费金额、gas、耗时。
你会发现这段话的价值不在“好看”,在于:
- agent 可以拿它当硬约束
- MCP 工具可以把它映射成“策略开关”
这就是你把 agent 从“建议你花钱”推进到“自己能花钱”的分界线。
实操任务:让 agent 去测新 token 的流动性
别让它一上来就做复杂工作流。
一个很适合的入门任务是:测流动性。
原因很现实:
- 它需要链上数据(池子深度、报价)
- 很多时候需要小额 swap 验证(买一点点看看滑点、是否能卖出)
- 交易金额可控
你可以这样给任务(示例):
去评估 token 0xTOKEN 在 DEX 上的流动性。
输出:可用交易对、估算滑点、建议最大可买入金额。
若需要用小额 swap 验证,遵守你的钱包规则。
你希望看到的“正确执行日志”
一个理想的执行结果,终端里大概会回你这种信息(格式因实现不同会变):
- 模拟:0.47 USDT → 0.000183 ETH
- 预估 gas:$0.0008
- 风险等级:Low
- 执行:签名 + 广播
- 结果:tx confirmed(含耗时)
看到这行字那一刻,真的会愣住。
不是因为 0.47 USDT 多大,而是:你的电脑里出现了一个能自己完成“商业动作”的东西。
MCP 工具设计建议:别把“发交易”做成一个黑盒
你做 MCP server 的时候,工具最好拆细一点。
推荐的工具颗粒度(按顺序调用):
get_balance(address, token)get_quote(from, to, amount)simulate_swap(route, amount, slippage)risk_assess(simulation_result, policy)sign_tx(tx)(必须在安全环境)send_tx(signed_tx)wait_confirm(tx_hash)
这样 agent 的推理会更稳定,也更容易审计。
你也更容易定位锅:是报价不准?模拟不准?风险策略太松?
风控怎么设更像“人类”
别只盯金额。
真实世界里,你会因为这些情况拒绝付款:
- Gas 突然飙高(链上拥堵、MEV、路由异常)
- 滑点离谱(池子太浅、被夹、税币)
- 路由走了奇怪的合约(钓鱼路由)
建议你在策略里加几条很实用的硬阈值:
- 预估价格影响(price impact)超过某值就停(比如 2%)
- 交易对象合约不在 allowlist(或未通过基本校验)就停
- 遇到“买得进卖不出”的迹象就停(税币、黑名单、honeypot)
你不需要一次做完,先把“停下来等你”跑通,别追求一步到位全自动。
避坑清单(血压升高预警)
- 用主钱包测试:一次误签名就够你后悔半年。
- 不做模拟:你以为在做 agent,实际在玩俄罗斯轮盘。
- 只限制金额,不限制 Gas:链上拥堵时,0.5U 的 swap 也能烧你一顿饭钱。
- 没做 allowlist:路由里出现奇怪合约,你还让它自动签?
- 把私钥暴露给模型:任何“把私钥塞进 prompt/ENV 明文/日志输出”的做法都别碰。
你可以立刻抄走的落地方案(最小可用版)
目标:今天就让 agent 成功花出“可控的第一笔钱”。
建议流程:
- 新建一个小额钱包,充值 1~5 USDT
- MCP 接入钱包能力(至少要有:余额查询、模拟、签名、发送、确认)
- System Prompt 加上“额度 + Gas + 模拟 + 审核”规则
- 给 agent 一个低风险任务:测流动性或小额 swap 验证
- 观察日志,把每一步的输入输出都留存(为后面扩展做审计)
跑通后你再升级到更爽的场景:
- 内容 pipeline 自己买 AI 额度,用完自动结算 ✍️
- research agent 自己付费读报告,交付时附成本明细 📄
- agent 之间按调用计费,像微服务一样自动结算 🔁
这才是真正的“能跑起来的工作流”。
写在最后:瓶颈不在推理,在付款
模型越来越聪明这件事,大家都麻了。
真正让人起鸡皮疙瘩的,是你看到一行日志:
tx confirmed
那代表一个东西不光会想,还会做交易、会付费、会完成闭环。
如果你也在做 agent,建议你把“付款能力”当成基础设施来做。把这块补上,很多卡了一年的自动化会突然顺滑得离谱。