Codex Computer Use 登陆 Windows:AI 终于能直接操作你的桌面了
OpenAI 把 Codex 的 Computer Use 功能正式带到了 Windows。
一句话说清楚:Codex 现在不只是会写代码、读文件、跑命令,它还能像人一样操作桌面应用。
它能看屏幕,能点鼠标,能输入文字。你平时怎么操作软件,它就能照着做一部分。
之前这个能力只支持 macOS。现在 Windows 用户也能用上了。对很多靠 Windows 干活的人来说,这次更新挺实在。
尤其是配合 ChatGPT 手机 App 的远程控制之后,场景一下子打开了:你人在外面,电脑在家里跑任务,你用手机看进度、批操作、继续推进。
这味儿有点像:把一个会写代码的远程助理,塞进了你的 Windows 电脑里。🙂
这次更新到底是什么?
Codex 的 Computer Use,核心能力是让 AI 直接和图形界面互动。
它不只是在终端里敲命令,也不只是在编辑器里改代码。
它可以操作桌面软件,比如:
- 看当前屏幕上有什么
- 点击按钮、菜单、输入框
- 输入文字
- 在应用之间切换
- 按提示完成一些重复流程
- 遇到关键步骤时,等你确认再继续
这类能力以前更多停留在演示里。现在 Windows 支持补上后,可用范围明显变大。
因为现实里,大量公司电脑、开发机、办公电脑,还是 Windows。
Windows 用户为什么该关心?
如果你只是让 AI 写几段代码,这个功能看起来没那么刺激。
可一旦你的工作涉及桌面软件、浏览器后台、IDE、内部系统,Computer Use 就很有存在感了。
举几个很具体的场景。
场景一:远程看着 Codex 跑任务
你早上出门前,让家里的 Windows 电脑跑一个 Codex 任务:
- 修一个前端 bug
- 跑测试
- 改一批脚本
- 检查项目依赖
- 生成一份报告
你到了地铁上,打开 ChatGPT 手机 App 看进度。
Codex 遇到需要确认的地方,比如要不要安装依赖、要不要继续执行某个操作,你直接在手机上点批准。
不用远程桌面连半天。
不用盯着电脑坐牢。
这个体验对经常跑长任务的人很香。
场景二:让 AI 处理 GUI 里的重复动作
有些工作不是写代码能完全解决的。
比如你要在一个桌面客户端里导出数据,流程是:
- 打开软件
- 登录账号
- 进入某个菜单
- 选择日期
- 点击导出
- 等待文件生成
- 把文件放到指定目录
这种操作人做一次没啥,做十次就烦。
Codex 有了 Computer Use 后,就有机会帮你执行这类“鼠标体力活”。
当然,涉及登录、支付、敏感权限,别完全放手。该确认的地方,让它停下来等你。
场景三:把手机变成 Codex 的遥控器
5 月中旬,OpenAI 已经把 Codex 接入 ChatGPT 手机 App。
之前手机端可以启动、监控、审批电脑上的 Codex 任务,但主机只能是 Mac。
现在 Windows 也能当主机。
这就补齐了一个关键环节:
- 你在 Windows 电脑上跑 Codex
- 你用手机查看任务状态
- 需要授权时,手机上处理
- 任务完成后,再回电脑验收
这个流程适合很多碎片时间。
比如排队、通勤、等咖啡、会议间隙。
你不用真的坐在电脑前,也能把一些任务往前推。
它适合哪些人?
不是所有人都需要立刻冲。
下面这些人会更容易用出价值。
开发者
你可以让 Codex 在 Windows 开发环境里处理一些工程任务:
- 打开 IDE 检查项目
- 跑本地测试
- 查看错误提示
- 修改配置
- 辅助排查构建失败
- 配合浏览器查文档或看控制台
特别是前端和桌面端项目,经常需要在 GUI 里看结果。
Computer Use 对这类流程更友好。
运营和数据同学
很多运营后台并没有好用的 API。
导数据、点报表、上传素材、改配置,全靠网页和按钮。
这类流程如果固定,Codex 有机会帮你跑一部分。
你可以把它当成一个“会看屏幕的执行助手”。
经常远程工作的用户
如果你经常把任务丢给家里或办公室的电脑跑,手机远程控制很关键。
以前你可能需要:
- 开远程桌面
- 找网络
- 输入密码
- 缩放屏幕
- 精准点击小按钮
现在可以变成:
- 手机打开 ChatGPT
- 看 Codex 当前在做什么
- 审批关键步骤
- 等结果
少折腾很多。
怎么开始用?
不同账号、地区、版本的开放节奏可能不一样。你可以按这个思路检查。
你需要准备什么
- 一台 Windows 电脑
- 可用的 Codex 环境
- ChatGPT 手机 App
- 同一个 OpenAI 账号
- 稳定网络
- 对本机任务有清晰目标
别一上来就丢复杂任务。
建议从低风险任务开始,比如:
- 打开项目并查看测试结果
- 整理某个目录下的文件
- 运行一个已有脚本
- 根据报错信息修改一处小问题
- 导出一份非敏感数据
先看它能不能理解你的环境。
一个可直接照抄的任务描述
你可以这样给 Codex 下指令:
请在这台 Windows 电脑上打开当前项目,运行测试命令,记录失败用例。
如果需要安装依赖或执行会修改大量文件的操作,请先暂停并等待我确认。
测试结束后,总结失败原因和建议修改方案。
这段提示里有几个关键点:
- 说明目标:运行测试
- 说明边界:大量修改前要确认
- 说明交付物:总结失败原因和方案
别只写“帮我看看项目”。
太空了。
AI 会迷路,你也会抓狂。
手机远程控制怎么用更顺?
手机端更适合“监控和审批”,不适合处理太复杂的指令编辑。
比较舒服的做法是:
- 在电脑上写清楚任务
- 让 Codex 开始跑
- 人离开电脑
- 手机端看状态
- 碰到权限、安装、提交、删除等动作时再确认
这像你请同事帮忙跑流程。
任务要说清楚,权限要卡住,结果要验收。
别把手机端当成完整开发环境用。
屏幕小,输入麻烦,容易误操作。
使用时一定要避开的坑
坑一:别让它直接碰敏感操作
涉及这些动作,要谨慎:
- 删除文件
- 覆盖配置
- 提交代码
- 推送到远程仓库
- 执行支付
- 修改生产环境
- 处理隐私数据
- 登录重要账号
正确做法是加一句:
遇到删除、覆盖、提交、推送、付款、生产环境变更,请暂停并等待我确认。
这句很管用。
坑二:别给模糊任务
别这样写:
帮我优化一下这个项目。
这太像许愿了。
换成这样:
请检查这个 React 项目的首页加载问题。先运行现有测试和构建命令,找到报错来源。不要改动无关文件。修改后重新运行构建,并列出改动文件。
AI 更容易按你的节奏走。
坑三:别跳过结果验收
Computer Use 能操作界面,不代表每一步都可靠。
你要检查:
- 它点的是不是正确按钮
- 输入内容有没有错
- 文件有没有生成到正确位置
- 测试是不是真的通过
- 修改有没有影响其他功能
把它当助理,不要当神仙。
坑四:别一开始就跑高风险长任务
新功能刚用时,建议从 5 到 10 分钟的小任务试起。
比如让它跑测试、整理报错、打开软件导出一份样例。
等你摸清它在你电脑上的表现,再交给它更长的流程。
一个推荐工作流
你可以按这个流程来:
- 在 Windows 电脑上打开项目或目标软件
- 给 Codex 一个明确任务
- 写清楚哪些动作必须等你确认
- 让它开始执行
- 用手机 App 远程查看进度
- 遇到审批请求时再处理
- 回到电脑后检查结果
- 保存可复用提示词,下次直接改参数
这个流程跑顺后,很多零碎任务都能丢出去。
比如午饭前让它跑测试,吃完回来直接看报告。
或者下班路上用手机审批一步,回家再验收。
省下来的不是几秒钟,是一整段被打断的注意力。
这次更新的真正价值
Codex 支持 Windows Computer Use,表面看是多支持了一个系统。
实际影响更大。
因为它把 AI 从“聊天窗口”往“真实电脑操作”又推了一步。
过去你让 AI 教你怎么做。
现在你可以让它直接去做一部分。
过去很多自动化必须写脚本、接 API、配环境。
现在一些桌面流程也有机会被 AI 接管。
当然,别期待它一夜之间替你搞定所有工作。
更现实的用法是:把那些重复、低风险、流程清楚的操作交给它。
你来管目标、判断和验收。
这样用,最稳。
小结
这次更新你可以记住三点:
- Codex 的 Computer Use 已经支持 Windows
- AI 可以看屏幕、点鼠标、输入文字,操作桌面应用
- ChatGPT 手机 App 现在也能远程控制 Windows 主机上的 Codex 任务
对 Windows 用户来说,这不是一个花哨功能。
它更像一个入口:以后很多电脑前的重复操作,可能不需要你亲自坐着点完。
先从小任务试。
把权限边界写清楚。
让 Codex 干活,你负责拍板。