我决定开始深度使用 Codex 了

AI摘要

本文作者深度体验新版Codex桌面端后，认为其核心价值在于从“回答问题”转向“参与工作流”。Codex能直接读取文件、操作应用、使用内置浏览器，将开发、预览、反馈整合在同一空间，缩短工作循环。它还能将任务经验沉淀为可复用流程，适合处理邮箱整理、Notion待办归类等高频琐碎任务。作者强调Codex是执行型助手而非最终负责人，用户仍需把控关键判断与责任。

最近很多人都在问新版 Codex 桌面端到底好不好用。

我原本也只是想试一下：看看它是不是又一个“看起来很强，但最后还是要我自己收尾”的 AI 工具。

但这几天用下来，我的判断变了。Codex 最值得注意的地方，不是它又会写代码了，而是它开始真正进入电脑本身，变成一个能读文件、开浏览器、操作应用、整理信息、还能把经验沉淀成自动化的工作伙伴。

接下来讲一下我为什么决定开始深度使用它，以及它目前最打动我的几个变化。

先说结论

我决定深度使用 Codex，不是因为它单点能力最强。

真正让我改变判断的，是它把很多原本割裂的环节接起来了。

过去用 AI，常见流程是：你把需求复制给它，它给你一段内容或代码，你再切回浏览器、文件、邮箱、Notion、项目目录里验证和执行。

现在 Codex 的感觉更像是：你把一个目标交给它，它自己去看上下文，自己打开该看的东西，自己操作该操作的界面，然后把结果交还给你确认。

这不是“聊天机器人更聪明了”这么简单。

这是 AI 从“回答问题”往“参与工作流”迈了一步。

它正在进入真实工作现场

很多人一提 Codex，第一反应还是写代码。

这当然是它的基本盘。但新版桌面端真正让我觉得有意思的地方，是它开始拥有更完整的工作现场。

1. 不再事事依赖 API

以前我们想让 AI 操作某个软件，常常要先问一个问题：这个软件有没有 API？有没有插件？权限怎么配？字段怎么映射？

这一步会劝退很多人。

因为真实工作不是都在干净的 API 里发生的。它发生在 Slack、Google Sheets、Notes、iMessage、邮箱、Notion、网页后台、各种临时文档里。

新版 Codex 的一个变化是，它可以直接进入这些应用的使用场景。

这意味着，你不一定要先把每个工具都改造成“适合 AI 调用”的样子。很多时候，你只要授权、说明目标，它就能开始看、开始整理、开始执行。

这点非常关键。

AI 如果只能待在聊天窗口里，它再聪明也只是顾问。AI 如果能进入你的真实工作界面，它才开始像助手。

2. 邮箱和 Notion 这种场景，立刻能看出差别

我先试了邮箱授权。

很简单的任务：让它帮我看看有没有客户邮件，哪些需要回复，哪些只是通知。

它给出的判断比我预期更准确。不是把邮件标题堆给我，而是能区分“需要处理”“可以稍后看”“只是同步信息”。

下一步我准备在真实客户邮件出现时，让它先写一版回复。

这类场景的价值，不在于 AI 能不能写一封漂亮邮件，而在于它能不能先替你判断：这封邮件的关系是什么、对方要什么、你现在该不该回。

Notion 也是类似。

我让它读取我的内容和待办，它能把散在页面里的事项重新归类，帮我看哪些是真任务，哪些只是我随手记下来的想法。

这听起来不炫，但很有用。

因为日常工作里真正消耗人的，往往不是“写一段话”，而是从一堆半成品信息里判断下一步。

3. 内置浏览器让协作开发变短了

Codex 的内置浏览器，是我这次体验里非常加分的一点。

它不是简单打开网页给你看，而是把“开发、预览、交互、反馈、修改”放进了同一个工作空间。

我做了一个小测试：让它开发一个 web app 示例，并且在内置浏览器里打开，边看边做交互式测试。

它很快生成了一个 Vite 项目，启动本地页面，然后把效果直接展示出来。

这一步本身不稀奇。很多 AI 编程工具都能生成 Demo。

真正舒服的是后面的流程。

当页面打开后，我可以直接在网页元素上点击、标注、提交修改意见。左侧工作区记录我的反馈，右侧代码和页面按这个反馈继续改。

这很像把设计评审、前端开发、浏览器调试和 AI 对话揉在了一起。

过去我们做一个小页面，经常要在几个地方来回切：

编辑器里改代码
浏览器里看效果
聊天窗口里描述问题
截图工具里圈位置
再回到编辑器验证

Codex 这套体验让这个循环短了很多。

短循环对开发很重要。

不是因为它省了几次点击，而是因为人脑不容易丢上下文。你刚看到哪里别扭，就能立刻指出来；AI 刚收到反馈，就能立刻改对应位置。

这种连续性，会直接影响你愿不愿意把它放进真实工作里。

我最在意的，是它开始积累经验

我以前对 AI 自动化一直比较谨慎。

很多工具说自己能自动化，但实际用起来像“定时提醒 + 固定模板”。它能跑，但不太懂为什么这么跑。

Codex 现在让我感兴趣的地方，是它可以把一次任务结束后的经验沉淀下来。

比如你完成一个流程后，可以让它回顾：

这次任务怎么做的
哪一步最容易出错
下次可以复用什么
有没有必要写成一个 skill
是否需要安排成自动化

这件事很小，但方向很重要。

因为真正的自动化不是“让 AI 每天重复一句话”，而是把你已经验证过的工作方法，变成下一次可以调用的流程。

我理解的深度使用 Codex，不是每天找它闲聊，也不是把所有事都丢给它。

而是把那些高频、琐碎、但又需要上下文判断的任务，慢慢交给它参与。

例如：

每天整理邮箱里真正需要回复的内容
定期检查 Notion 里的待办和项目状态
写完一次分析后沉淀成可复用的写作流程
开发页面时让它边预览边修 UI 细节
对重复任务做复盘，再升级成自动化

这才是我觉得有价值的地方。

AI 不只是帮你完成一次任务，而是帮你把“完成任务的方法”留下来。

还有一个被低估的点：它用起来很顺

很多 AI 产品的问题，不是能力不够，而是使用时总有一点别扭。

你要切窗口，要整理上下文，要复制粘贴，要解释一遍当前状态，还要忍受不够稳定的界面。

Codex 桌面端这次给我的感觉，是它在努力减少这种摩擦。

比如它有自己的光标和键盘操作，所以它在处理电脑上的任务时，你仍然可以继续做别的事。

再比如内置文件查看器、内置浏览器、应用标记和工作区之间的衔接，做得比较完整。

这些都不是一句“模型能力提升”能概括的。

它更像是在回答另一个问题：

如果 AI 真的要成为日常工作的一部分，它应该待在哪里？

我的答案越来越明确：它不能只待在聊天框里。

它要离文件近一点，离浏览器近一点，离你的真实软件近一点，离任务结果近一点。

只有这样，它才有机会从“帮我想想”变成“跟我一起做完”。

但我不会把它神化

我决定深度使用 Codex，不代表我认为它已经可以完全托管工作。

现在它最适合的角色，仍然是一个很强的执行型助手，而不是最终负责人。

你依然需要判断目标是否正确，授权范围是否合理，结果是否可靠，哪些内容可以发布，哪些操作不能让它直接做。

尤其是涉及客户、财务、账号权限、外部发布的场景，我更倾向于让它先准备、先分析、先生成草稿，最后一步由人确认。

这不是保守。

这是把 AI 放在正确的位置上。

它可以极大缩短从想法到初稿、从需求到 Demo、从混乱信息到待办列表的距离。

但真正的判断、取舍、责任，还是要留在人这里。

最后

我决定开始深度使用 Codex，是因为它让我第一次比较清楚地看到：AI 工具的下一步，不只是回答更好，而是更接近真实工作现场。

它能读上下文，能进应用，能开浏览器，能做交互测试，能把经验沉淀成 skill 和自动化。

这些能力单独看都不算惊天动地，但合在一起，会改变一个人使用 AI 的方式。

接下来我会继续把 Codex 放进真实工作流里测试：写文章、处理邮件、整理 Notion、开发小工具、做自动化。

我更关心的不是它演示时有多惊艳，而是它能不能在每天重复出现的具体任务里，稳定帮我省心。

这才是我愿意深度使用一个 AI 工具的理由。

本作品采用《CC 协议》，转载必须注明作者和本文链接

Sown

28 声望

Hi，快来一起 Vibe Coding

0 人点赞

讨论数量: 3

JinBB

154 声望

这个文章看着就像是codex写的。怎么有点像小龙虾呢？

1个月前评论

Sown （楼主）

好眼力！龙虾配置的就是openai的模型

wangchunbo

版主 2.7k 声望 / 啥活都干 @ 一人企业

有点过于理想了。现在codex 能进应用能开浏览器能沉淀 skill / 自动化？

前面两个是要agent和插件。后面那个得自己成整了。

1个月前评论

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容，与人为善，比聪明更重要！

帮助

我决定开始深度使用 Codex 了

先说结论