首页 / 正文

Codex + GPT-5.5:把“会写代码”升级成“会在电脑上干活”的实战教程(浏览器/文件/文档全流程)

Mooko
发布于 2026-04-24 · 5分钟阅读
5762 浏览
0 点赞 暴击点赞!

Codex + GPT-5.5:从“写代码”到“会操作网页”的升级玩法

你有没有遇到过这种烦:

  • 产品让你“顺手测一下登录流程”,你一测就是半小时。
  • QA 要你复现一个“偶发”问题,你一边点网页一边截图写报告。
  • 运营丢来一堆素材,让你“整理成文档”,复制粘贴到手麻。

如果你的 Codex 已经支持更强的模型能力,并且开放了“浏览器/文件/文档/电脑操作”这类工具权限,那它就不止会写代码了。 它更像一个会动手的助手:能在 Web 应用里交互、按步骤测试、截图、看结果,再继续改策略直到任务完成。

下面直接上可执行的方法。咱们把它当成一个“能看屏幕、能点鼠标、能读写文件”的队友来用。😄


你能让它做什么(把能力说清楚,才好下指令)

1)在浏览器里“像人一样”操作 Web 应用

适合这些场景:

  • 点按钮、填表单、切 Tab、滚动页面
  • 跑一条完整流程:注册 → 登录 → 下单 → 支付页停住
  • 抓页面关键信息:提示文案、错误码、表格数据
  • 自动截图:每一步留证据,方便写测试记录

2)基于“看到的页面结果”继续迭代

这点很关键。 它不是只执行一次脚本就完事,而是:

  • 做完一步 → 看页面变成啥样
  • 发现不对 → 换路径/换入口/换关键词
  • 直到达到目标

你可以把它理解成“自带复盘的执行者”。

3)文件 + 文档闭环

常见用法:

  • 读取项目文件、日志、截图
  • 生成测试报告 Markdown/Word 风格内容
  • 把页面抓取结果整理成表格/清单
  • 批量改配置、改文案、补注释

开始前的准备:别急着让它跑,先把权限和边界讲明白

你要做的不是“给它一个愿望”,而是“给它一张任务单”。

建议你在任务开头固定加三件事:

  • 允许使用的工具范围:浏览器、文件、截图、终端(以你实际界面为准)
  • 不能碰的东西:线上生产账号、真实支付、删除文件
  • 输出物:截图、步骤日志、最终报告

你会发现它的稳定性会上一个台阶。


实战 1:让 Codex 帮你跑一条 Web 测试流程(带截图 + 报告)

适用场景

你刚改完登录页,想确认:

  • 输入错误密码时提示文案对不对
  • 验证码出现时会不会卡住
  • 登录成功后跳转是否正常

推荐提示词(可直接复制)

目标:测试 Web 应用登录流程,并生成带截图编号的测试记录。

约束:不要进行真实支付/不要改线上数据;只用测试账号;遇到异常先截图再继续。

步骤:

  1. 打开网址:{你的测试环境 URL}
  2. 依次覆盖 3 种情况:
    • 正确账号+正确密码
    • 正确账号+错误密码
    • 空密码点击登录
  3. 每个关键页面都截图,命名规则:login_01、login_02…
  4. 输出一个 Markdown 报告:包含执行步骤、预期结果、实际结果、截图引用、结论。

备注:如果页面元素不好定位,优先用“看得到的文案/按钮文字”来点击,不要猜 DOM。

你会拿到什么结果

  • 一组按顺序命名的截图
  • 一份可直接丢给 QA/产品的 Markdown 测试记录

这类任务最爽的点:它会边做边看页面反馈。页面跳转慢、弹窗挡住、按钮文案变了,它会尝试绕过去,而不是傻等。


实战 2:让它“边浏览边修正”,直到把任务做完

适用场景

你要在后台找到某个配置项,但入口藏得深:

  • 菜单层级多
  • 同名按钮多
  • 页面会根据权限显示不同内容

这时候别用“去点 A、再点 B”这种死指令。 用“观察 → 判断 → 调整”的写法更稳。

推荐提示词

你现在在浏览器里帮我找到“API 回调地址配置”页面。

工作方式:

  • 每走到一个新页面,先用一句话描述你看到的关键区域(菜单、标题、按钮)。
  • 如果找不到入口,尝试 2 条备选路径(比如:系统设置/开发者设置/安全设置)。
  • 每次改路径前先截图留证据。

输出:给我最终入口路径(例如:设置 → 开发者 → 回调地址),并截图标注该配置项所在区域。

这类提示词的潜台词是:允许它试错。 你不是让它一次命中,而是让它“像人一样”在后台里摸路。


实战 3:文件 + 文档联动:把一堆截图和记录变成可交付的报告

适用场景

你已经跑完流程,手上有:

  • 多张截图
  • 一些零散的现象描述
  • 可能还有控制台日志/网络请求片段

你要的是一份“能交差、能复盘、能追责”的报告。

推荐提示词

我有一批截图和日志文件,请你做一份《登录流程测试报告》。

要求:

  • 报告结构固定:背景/环境信息/用例列表/异常汇总/复现步骤/建议
  • 每条异常必须引用截图编号或日志片段
  • 建议要落到“下一步做什么”:要改哪个页面文案、要加哪个校验、要补哪个埋点

输出格式:Markdown,方便我直接发到飞书/Notion。

这个套路特别适合“你只想早点下班”的夜晚。🫠


写提示词的 5 个小技巧(让它少走弯路)

  • 给清楚的完成标准:比如“找到配置项并给出入口路径 + 截图标注”,别只说“帮我看看”。
  • 把风险写进约束:不要真实支付、不要删文件、不要改线上数据。
  • 要求它每步做记录:让它输出步骤日志,你排查会轻松很多。
  • 让它优先用可见文案操作:按钮文字、页面标题通常比 DOM 更可靠。
  • 设定失败策略:找不到就尝试两条备选路径,卡住就截图并说明卡点。

避坑清单(踩过一次就够了)

  • 页面加载慢导致误判:让它“等待页面稳定/关键元素出现后再操作”,并要求超时策略。
  • 弹窗/新标签页打断流程:在提示词里写明“遇到弹窗先关闭或截图记录;新开标签页要切回”。
  • 测试账号权限不够:让它在报告里标出“疑似权限问题”的证据(页面提示、按钮不可点)。
  • 截图太多不好管理:统一命名规则 + 只截关键节点(入口、提交前、提交后、报错)。
  • 把探索当成执行:探索任务要允许试错;执行任务要严格按步骤。两者别混。

一套通用工作流:从“需求一句话”到“交付一份报告”

你下次接到这种活,可以照这个节奏走:

  1. 用一句话写清目标(要测什么/要找什么/要产出什么)
  2. 写约束(别碰什么、用什么账号、能不能改数据)
  3. 让它执行并截图留证
  4. 让它基于截图/页面现象继续迭代,直到完成
  5. 让它把过程整理成 Markdown 报告

顺嘴吐槽一句

有人说什么“CloseAI”之类的梗,图个乐就行。 真正重要的是:你能不能把这套能力用在每天的碎活里,少点几百次鼠标,少写几页重复报告。

你要是愿意,把你准备测试的页面类型(登录/表单/支付前页/后台配置)和你希望的报告结构发我,我可以给你一份更贴合场景的提示词模板。

OpenClaw
OpenClaw
木瓜AI支持养龙虾啦
木瓜AI龙虾专供API,限时领取免费tokens
可在 OpenClaw接入全球顶尖AI大模型
立即领取