Codex Computer Use 登陆 Windows：AI 终于能直接操作你的桌面了

OpenAI 把 Codex 的 Computer Use 功能正式带到了 Windows。

一句话说清楚：Codex 现在不只是会写代码、读文件、跑命令，它还能像人一样操作桌面应用。

它能看屏幕，能点鼠标，能输入文字。你平时怎么操作软件，它就能照着做一部分。

之前这个能力只支持 macOS。现在 Windows 用户也能用上了。对很多靠 Windows 干活的人来说，这次更新挺实在。

尤其是配合 ChatGPT 手机 App 的远程控制之后，场景一下子打开了：你人在外面，电脑在家里跑任务，你用手机看进度、批操作、继续推进。

这味儿有点像：把一个会写代码的远程助理，塞进了你的 Windows 电脑里。🙂

这次更新到底是什么？

Codex 的 Computer Use，核心能力是让 AI 直接和图形界面互动。

它不只是在终端里敲命令，也不只是在编辑器里改代码。

它可以操作桌面软件，比如：

看当前屏幕上有什么
点击按钮、菜单、输入框
输入文字
在应用之间切换
按提示完成一些重复流程
遇到关键步骤时，等你确认再继续

这类能力以前更多停留在演示里。现在 Windows 支持补上后，可用范围明显变大。

因为现实里，大量公司电脑、开发机、办公电脑，还是 Windows。

Windows 用户为什么该关心？

如果你只是让 AI 写几段代码，这个功能看起来没那么刺激。

可一旦你的工作涉及桌面软件、浏览器后台、IDE、内部系统，Computer Use 就很有存在感了。

举几个很具体的场景。

场景一：远程看着 Codex 跑任务

你早上出门前，让家里的 Windows 电脑跑一个 Codex 任务：

修一个前端 bug
跑测试
改一批脚本
检查项目依赖
生成一份报告

你到了地铁上，打开 ChatGPT 手机 App 看进度。

Codex 遇到需要确认的地方，比如要不要安装依赖、要不要继续执行某个操作，你直接在手机上点批准。

不用远程桌面连半天。

不用盯着电脑坐牢。

这个体验对经常跑长任务的人很香。

场景二：让 AI 处理 GUI 里的重复动作

有些工作不是写代码能完全解决的。

比如你要在一个桌面客户端里导出数据，流程是：

打开软件
登录账号
进入某个菜单
选择日期
点击导出
等待文件生成
把文件放到指定目录

这种操作人做一次没啥，做十次就烦。

Codex 有了 Computer Use 后，就有机会帮你执行这类“鼠标体力活”。

当然，涉及登录、支付、敏感权限，别完全放手。该确认的地方，让它停下来等你。

场景三：把手机变成 Codex 的遥控器

5 月中旬，OpenAI 已经把 Codex 接入 ChatGPT 手机 App。

之前手机端可以启动、监控、审批电脑上的 Codex 任务，但主机只能是 Mac。

现在 Windows 也能当主机。

这就补齐了一个关键环节：

你在 Windows 电脑上跑 Codex
你用手机查看任务状态
需要授权时，手机上处理
任务完成后，再回电脑验收

这个流程适合很多碎片时间。

比如排队、通勤、等咖啡、会议间隙。

你不用真的坐在电脑前，也能把一些任务往前推。

它适合哪些人？

不是所有人都需要立刻冲。

下面这些人会更容易用出价值。

开发者

你可以让 Codex 在 Windows 开发环境里处理一些工程任务：

打开 IDE 检查项目
跑本地测试
查看错误提示
修改配置
辅助排查构建失败
配合浏览器查文档或看控制台

特别是前端和桌面端项目，经常需要在 GUI 里看结果。

Computer Use 对这类流程更友好。

运营和数据同学

很多运营后台并没有好用的 API。

导数据、点报表、上传素材、改配置，全靠网页和按钮。

这类流程如果固定，Codex 有机会帮你跑一部分。

你可以把它当成一个“会看屏幕的执行助手”。

经常远程工作的用户

如果你经常把任务丢给家里或办公室的电脑跑，手机远程控制很关键。

以前你可能需要：

开远程桌面
找网络
输入密码
缩放屏幕
精准点击小按钮

现在可以变成：

手机打开 ChatGPT
看 Codex 当前在做什么
审批关键步骤
等结果

少折腾很多。

怎么开始用？

不同账号、地区、版本的开放节奏可能不一样。你可以按这个思路检查。

你需要准备什么

一台 Windows 电脑
可用的 Codex 环境
ChatGPT 手机 App
同一个 OpenAI 账号
稳定网络
对本机任务有清晰目标

别一上来就丢复杂任务。

建议从低风险任务开始，比如：

打开项目并查看测试结果
整理某个目录下的文件
运行一个已有脚本
根据报错信息修改一处小问题
导出一份非敏感数据

先看它能不能理解你的环境。

一个可直接照抄的任务描述

你可以这样给 Codex 下指令：

请在这台 Windows 电脑上打开当前项目，运行测试命令，记录失败用例。
如果需要安装依赖或执行会修改大量文件的操作，请先暂停并等待我确认。
测试结束后，总结失败原因和建议修改方案。

这段提示里有几个关键点：

说明目标：运行测试
说明边界：大量修改前要确认
说明交付物：总结失败原因和方案

别只写“帮我看看项目”。

太空了。

AI 会迷路，你也会抓狂。

手机远程控制怎么用更顺？

手机端更适合“监控和审批”，不适合处理太复杂的指令编辑。

比较舒服的做法是：

在电脑上写清楚任务
让 Codex 开始跑
人离开电脑
手机端看状态
碰到权限、安装、提交、删除等动作时再确认

这像你请同事帮忙跑流程。

任务要说清楚，权限要卡住，结果要验收。

别把手机端当成完整开发环境用。

屏幕小，输入麻烦，容易误操作。

使用时一定要避开的坑

坑一：别让它直接碰敏感操作

涉及这些动作，要谨慎：

删除文件
覆盖配置
提交代码
推送到远程仓库
执行支付
修改生产环境
处理隐私数据
登录重要账号

正确做法是加一句：

遇到删除、覆盖、提交、推送、付款、生产环境变更，请暂停并等待我确认。

这句很管用。

坑二：别给模糊任务

别这样写：

帮我优化一下这个项目。

这太像许愿了。

换成这样：

请检查这个 React 项目的首页加载问题。先运行现有测试和构建命令，找到报错来源。不要改动无关文件。修改后重新运行构建，并列出改动文件。

AI 更容易按你的节奏走。

坑三：别跳过结果验收

Computer Use 能操作界面，不代表每一步都可靠。

你要检查：

它点的是不是正确按钮
输入内容有没有错
文件有没有生成到正确位置
测试是不是真的通过
修改有没有影响其他功能

把它当助理，不要当神仙。

坑四：别一开始就跑高风险长任务

新功能刚用时，建议从 5 到 10 分钟的小任务试起。

比如让它跑测试、整理报错、打开软件导出一份样例。

等你摸清它在你电脑上的表现，再交给它更长的流程。

一个推荐工作流

你可以按这个流程来：

在 Windows 电脑上打开项目或目标软件
给 Codex 一个明确任务
写清楚哪些动作必须等你确认
让它开始执行
用手机 App 远程查看进度
遇到审批请求时再处理
回到电脑后检查结果
保存可复用提示词，下次直接改参数

这个流程跑顺后，很多零碎任务都能丢出去。

比如午饭前让它跑测试，吃完回来直接看报告。

或者下班路上用手机审批一步，回家再验收。

省下来的不是几秒钟，是一整段被打断的注意力。

这次更新的真正价值

Codex 支持 Windows Computer Use，表面看是多支持了一个系统。

实际影响更大。

因为它把 AI 从“聊天窗口”往“真实电脑操作”又推了一步。

过去你让 AI 教你怎么做。

现在你可以让它直接去做一部分。

过去很多自动化必须写脚本、接 API、配环境。

现在一些桌面流程也有机会被 AI 接管。

当然，别期待它一夜之间替你搞定所有工作。

更现实的用法是：把那些重复、低风险、流程清楚的操作交给它。

你来管目标、判断和验收。

这样用，最稳。

小结

这次更新你可以记住三点：

Codex 的 Computer Use 已经支持 Windows
AI 可以看屏幕、点鼠标、输入文字，操作桌面应用
ChatGPT 手机 App 现在也能远程控制 Windows 主机上的 Codex 任务

对 Windows 用户来说，这不是一个花哨功能。

它更像一个入口：以后很多电脑前的重复操作，可能不需要你亲自坐着点完。

先从小任务试。

把权限边界写清楚。

让 Codex 干活，你负责拍板。

Codex Computer Use 登陆 Windows：手机远程盯电脑干活，终于不用只羡慕 Mac 用户了