Codex App 从 0 到 1 完整入门教程

最近我发现,很多人第一次接触 Codex App 的反应不是“哇,好强”,而是:

这玩意儿到底从哪开始使用?需不需要我配置一大堆东西?

左边一堆入口,中间是聊天,右边又会弹出网页、图片、文档、来源、代码变化。设置里还有一堆看起来很技术的东西。

作为小白,困住你的大概率不是不想用Codex,而是压根不知道如何第一次上手Codex。

所以这篇文章不是技术类文章,我会按一个普通人的使用路线来讲清楚:

  1. Codex App 到底是什么。
  2. 本地 App、云端 Codex、普通 ChatGPT 的区别。
  3. 打开 App 后,左边、中间、右边分别是干什么的。
  4. 设置页每个目录到底管什么。
  5. 普通对话和项目对话有什么区别。
  6. 插件、技能、MCP、自动化、Git 这些词怎么理解。
  7. 哪些地方小白最容易点错。

本文基于 Mac 版 Codex App 实测整理。
Codex版本:Codex 26.429.30905
Codex App 更新很快,你看到的按钮名称和位置可能会有一点变化,但核心逻辑基本一样。


一、Codex App 到底是什么

一句话:Codex App 是一个把 AI Agent 放进你电脑里的工作台,只要你能在电脑上做的操作,它基本上也都能做,而且它会做的更完美、更高效。

说白了,它不是一个你问一句,它答一句的普通聊天框。Codex App 更像是你的助理,它可以:

  • 和你聊天。
  • 读你指定的本地文件。
  • 搜索网页。
  • 打开内置浏览器。
  • 生成图片、文档、PPT、网页、代码等结果。
  • 用插件连接 Gmail、GitHub、Google Drive、Slack 等外部工具。
  • 设置自动化,定期帮你检查、总结或继续任务。

如果你是非程序员,可以先把它理解成:

一个更偏“做事”的 ChatGPT。

它不是只回答“怎么做”,而是很多时候可以直接帮你“做一遍”。

但也正因为它能做事,所以你必须理解它的界面和权限。不然你会不知道它到底是在本地电脑上做事,还是在云端任务里做事,也不知道它什么时候会碰到你的文件。

先看一张打开后的整体界面。

这张图先不用看细节。你只要记住:左边是导航栏,中间是你和 Codex 对话的地方,右边有时会出现结果、来源、预览和代码变化。

这就是 Codex App 和普通聊天框最大的差别:它不是只有“问答”,它还有“工作现场”。


二、下载和登录

Mac 用户建议只从 OpenAI 官方入口下载 Codex App: https://openai.com/codex/

安装方式和普通 Mac App 差不多:

  1. 下载 Codex App。
  2. 打开安装包。
  3. 把 Codex 拖进“应用程序”。
  4. 从启动台或应用程序里打开 Codex。
  5. 用你的 ChatGPT / OpenAI 账号登录(普通账号也有一定的免费额度)

三、本地 Codex App、云端 Codex、普通 ChatGPT 有什么区别

在开始介绍Codex App之前,我把Codex App和云端Codex以及普通Chatgpt的区别先理一下,因为很多人一直没搞清楚这三者的区别。

名字大白话解释适合做什么
ChatGPT 普通对话一个网页或 App 里的助手问问题、写文案、解释概念、生成文件、生成图片
Codex App 本地版装在你电脑上的 AI 工作台普通ChatGPT能做的都能做,最大的区别就是能轻松地读取本地的文件。
云端 Codex在云端环境里跑的 AI Agent有时候电脑关机了本地Codex APP就用不了了,如果在云端上跑任务,那就不受本地电源的限制,因为是跑在官方服务器上面的。

小白先记住一个判断标准就够了:

  • 一般任务:用普通对话。
  • 要处理本地文件或项目:用 Codex App 里的项目。
  • 要让 Codex 在远程环境里持续跑任务:用云端 Codex。

四、主界面地图:左边、中间、右边

第一次打开 Codex App,可能有点懵逼,因为上面的功能还是有点多的,毕竟人家是“超级工作台”嘛!

区域它是干什么的小白最常用的动作
左边导航栏找入口、找项目、找对话新对话、切换对话、连接插件和设置自动化任务
中间对话区你和 Codex 真正交流的地方输入需求、让Codex开始工作
右边结果区展示证据和产物看来源、预览网页/图片/PDF、看代码变化

下面这张图是插件页,但它很适合看 Codex 的整体布局:左边是导航,中间是主要内容,右边这次没有打开额外预览(一般有生成图片、代码或者网页,就可以在右边预览)。


五、左侧导航栏:你从这里进入不同工作流

左边是 Codex 的入口区。

常见入口包括:

入口大白话解释什么时候点
新对话开一个新的聊天任务不想污染旧上下文时
搜索找历史对话、命令或文件忘了之前聊过什么时
插件给 Codex 增加外部能力想连接 Gmail、GitHub、Drive、Slack 等工具时
自动化让 Codex 定期或稍后执行任务想每天总结、定期检查、过一会儿继续时
项目让 Codex 针对某个文件夹或代码仓库工作需要它读文件、改文件、跑命令时
普通对话不绑定项目的聊天问概念、写内容、整理思路时

六、搜索:找回你之前做过的事

点左侧“搜索”,会弹出一个搜索浮层。

搜索浮层

它的作用很简单:

  • 找历史对话。
  • 找之前跑过的项目任务。
  • 找你忘记名字的上下文。

七、插件:给 Codex 装能力包

点左侧“插件”,会进入插件页。

插件其实就是给 Codex 装能力包。

比如:

  • Browser Use:让 Codex 操作内置浏览器。
  • Computer Use:让 Codex 操作 Mac 上的 App。
  • Spreadsheets:让 Codex 处理表格。
  • Presentations:让 Codex 做演示文稿。
  • GitHub:让 Codex 和 GitHub 工作流配合。
  • Gmail / Google Drive / Slack 这类:让 Codex 连接外部账号。

这里顺便把几个词讲清楚。

名词大白话解释例子
Plugin 插件给 Codex 装一个能力包装了表格插件,它就更会处理表格
Connector 连接器连接外部账号或服务连接 Gmail、GitHub、Google Drive
Skill 技能一套固定工作流说明书“写教程时按我的风格来写”
MCP一种让外部工具接入 Codex 的方式让 Codex 调用某个本地服务或工具

小白不用纠结这些名词的具体细节,只需要大概理解:

插件是能力包,连接器是接账号,技能是工作流说明书,MCP 是接工具的通道。

什么时候需要插件?

  • 你想让 Codex 读 Gmail。
  • 你想让 Codex 操作浏览器。
  • 你想让 Codex 做 PPT、表格、文档。
  • 你想让 Codex 和 GitHub、Slack、Linear 等工具协作。

小白建议:刚开始只用官方已经内置好的插件,不要急着装一堆,后续熟练了可以慢慢添加


八、自动化:让 Codex 稍后或定期帮你做事

点左侧“自动化”,会看到自动化页面。

自动化页面

自动化就是让 Codex 在某个时间点,或按某个频率,自动执行一件你提前设置好的任务。

常见场景:

  • 每天早上帮你整理某个项目状态。
  • 每周检查一次某个仓库有没有问题。
  • 半小时后继续当前线程。
  • 定期监控某个网页、邮箱、任务列表。
  • 定时生成日报、周报、复盘。

九、右侧结果区:产出物

Codex 的右侧区域可能出现:

  • 生成出来的文件。
  • 搜索来源。
  • 网页预览。
  • 图片预览。
  • PDF / 文档预览。
  • 内置浏览器。
  • 代码差异。
  • Git 变化。

你可以把右侧理解成:Codex 交作业的地方。

中间告诉你“Codex到底做了什么”,右边让你看“Codex到底产出了什么”。


十、设置入口:让Codex更好用

左下角有“设置”入口,这里面可能有很多小白陌生的设置,但是挨个认真看完,其实也能设置好,把Codex设置的更加好用。下面逐个介绍:


十一、设置页 1:常规

设置:常规

常规管的是 App 的基础使用习惯。

常见内容包括:

  • 工作模式:更偏日常工作,还是更偏编程。
  • 默认权限。
  • 自动审核。
  • 完全访问权限。
  • 默认打开目标。
  • 语言。
  • 菜单栏显示。
  • 运行时防止系统休眠。
  • 长文本发送快捷键。

小白最应该关注四个地方。

第一个是工作模式。

如果你不是程序员,优先选更偏“日常工作”的模式。这样 Codex 的表达会少一点工程黑话。

第二个是权限。

权限越大,Codex 能做的事越多,但风险也越大。

如果你还不熟,别一上来就开最大权限,但是熟练了之后发现权限给的用多,需要操心的越少,使用Codex越丝滑,这个因人而异,大家可以按照自己的习惯设置。

第三个是发送方式。

长文本是否需要 Command + Enter 发送,这个会影响你写长需求时会不会误触,因为很多朋友不小心点击Enter就会发送,比如我。。。

第四个是语音输入 这个相当于全局键,打开了之后,不止是在Codex App内部,可以在电脑上任意一个对话框调用Codex的语音输入法。但是如果习惯了比如Typeless、豆包输入法的朋友就没有必要切换了。


十二、设置页 2:外观

设置:外观

外观管的是界面长什么样。

常见内容包括:

  • 主题。
  • 字体。
  • 颜色。
  • 代码展示样式。
  • 差异对比样式。
  • 字号或界面密度。

这个页面基本不影响 Codex 能不能完成任务,它只影响你看界面UI的时候舒不舒服。

但是有个新功能大家也许会感兴趣:可以在这个界面选择一只桌宠,然后再Codex对话框输入/宠物就能唤起一只陪伴大家工作的小可爱!


十三、设置页 3:配置

设置:配置

保持默认即可,不需要改。


十四、设置页 4:个性化

设置:个性化

个性化管的是 Codex 怎么理解你。

这里通常会出现类似:

  • 个人偏好。
  • 自定义说明。
  • 记忆或偏好相关设置。
  • 让 Codex 按某种风格回答的规则。

你可以在这里写:

  • 我更喜欢中文回答。
  • 我不是程序员,请少用术语。
  • 给我教程时要写成功标志和排查步骤。
  • 修改代码前先解释影响。
  • 涉及隐私文件时先提醒我。

小白建议写这种:

请默认用中文回答。
如果涉及代码,请先用大白话解释目的,再给具体操作。
如果要修改文件、运行命令、访问外部账号,请明确告诉我风险。
教程类内容请写成小白能照着做的步骤,并标注成功标志。

哪些别乱写?

  • 不要把 API Key、密码、Cookie 写进去。
  • 不要把私人身份证、银行卡、公司机密写进去。
  • 不要写互相矛盾的规则。

十五、设置页 5:MCP 服务器

设置:MCP 服务器

MCP 对小白来说第一次听见会有点懵,但是简单理解就是MCP 是让 Codex 连接外部工具的一条通道,大概意义和插件没啥区别。

比如某个工具提供了 MCP,Codex 就可以通过它读取数据、调用功能、执行操作。

一般不需要添加,就是用Codex内置的插件已经能满足99%的日常工作生活需求了。


十六、设置页 6:Git

设置:Git

Git 是代码世界里的“版本记录系统”。

如果你不是程序员,可以先这样理解:

Git 像一个项目的时间机器,记录每次改了什么。

因为你需要知道:

  • 它改了哪些文件。
  • 哪些改动是新增的。
  • 哪些改动是删除的。
  • 能不能回退。
  • 要不要提交。

但是总而言之,这些都是技术相关,小白第一次上手把这页的设置保持默认即可,不需要改变。


十七、设置页 7和8:环境和工作树

设置:环境

小白保持默认即可!


十八、设置页 9和10:浏览器使用和电脑操作

设置:浏览器使用

浏览器使用是指 Codex 能操作内置浏览器,这个功能非常实用,Codex 可以用它来:

  • 打开网页。
  • 搜索资料。
  • 登录某些网站。
  • 查看本地网页。
  • 测试前端页面。
  • 截图或检查页面效果。

直接在Codex App内部就完成相关操作,不需要再跳转到别的网页,十分便捷。


十九、设置页 10:电脑操控

电脑操控是让 Codex 操作 Mac 上的应用。

比如:

  • 打开某个 App。
  • 点击按钮。
  • 查看界面。
  • 处理一些可视化任务。
  • 帮你在软件里完成一些流程。

这功能很非常非常强,可以说是我觉得Codex App最牛逼的一个功能,前端时间我才让它帮我从零到一写了一份法律检索报告(我只完成了登录几个网站的操作,别的搜索、探究网站内部结构、点击、整理资料全是它一次性完成),但是,也更需要谨慎。

因为它可能碰到:

  • 微信。
  • 邮箱。
  • 浏览器。
  • 文件管理器。
  • 付费软件。
  • 公司工具。
  • 私人资料。

小白建议:第一次用电脑操控,最好只让它操作无风险 App,特别记住不要操作社媒账号和微信!!!!!


二十、设置页 11:已归档对话

设置:已归档对话

已归档对话就是被你收起来的历史对话,它不是删除,更像是:一个没有时间限制的回收站,不会过期清理,想要找回来的时候随时在这里找回就行。

适合归档的内容:

  • 已经完成的任务。
  • 暂时不用的项目对话。
  • 不想占用左侧列表的旧记录。
  • 需要保留但不常看的过程。

二十一、跑一个普通对话:先从低风险任务开始

刚开始用 Codex,不建议直接让它改项目,先开启一个普通对话。特别建议打开“完全访问权限”,那一刻,会发现真的很爽,小白应该不会一上来就做什么惊人的操作,所以也不会有太大的安全风险,吧。。。

比如输入:

用小白能听懂的话,解释一下 Codex App 和 ChatGPT 的区别。

如果是做一个比较复杂的任务,建议打开“计划模式”,先梳理清楚思路,再开始做。


二十二、权限确认:非常重要!

Codex 可能会请求不同权限,你可以这样理解:

权限类型意味着什么小白怎么判断
文件访问Codex 要读或改某个文件夹看清楚路径是不是你允许的项目
终端命令Codex 要在电脑上运行命令不懂就让它先解释
浏览器Codex 要打开网页或操作网页避免付款、删除、发布类操作
第三方账号Codex 要连接 Gmail、GitHub 等看清楚授权范围
电脑操控Codex 要操作 Mac App边界一定要说清楚

小白最容易犯的错:看到确认按钮就点。千万不要这样,如果你看不懂,就问:

这个权限具体会让你做什么?有什么风险?我是小白,应该允许吗?

Codex 本身也可以帮你解释权限滴!~


二十三、常见踩坑和排查

1. Codex 一直在跑,不知道是不是卡了

先看左边对话状态,是在转圈还是蓝色的不动的点

如果它显示转圈,那就是没有结束。

如果它显示蓝色的点,就代表任务已经结束了

2. 它请求权限,我不知道能不能点

不要直接点,让它解释:

这个权限会让你访问什么?为什么这个任务需要它?有没有更低风险的做法?

3. 它改了项目,我看不懂

让它解释 Git diff:

请按文件逐个解释这次改动,用非程序员能懂的话说。

4. 生成结果不满意

不要重开。

直接基于结果继续改:

保留现在的结构,但把语言改得更口语化,并补充每一步的成功标志。

5. 插件太多,不知道装哪个

先别装,先用官方内置能力。

等你明确知道“我要让 Codex 连接某个工具”,再去插件页找。

6. 自动化跑偏

大概率是你的任务描述太泛,把任务精细化描述一下:

  • 什么时候执行。
  • 执行对象是什么。
  • 输出什么。
  • 不要做什么。
  • 遇到问题怎么处理。

二十四、我的推荐使用路线

如果你是第一次用 Codex App,我建议按这个顺序来:

  1. 打开 App,先熟悉左侧导航。
  2. 新建一个普通对话,问一个低风险问题。
  3. 打开设置页,只看不改。
  4. 建一个干净演示项目,不要用私人项目。
  5. 让 Codex 读取项目,并生成一个简单 Markdown。
  6. 看右侧结果区。
  7. 让它解释它做了什么。
  8. 再尝试插件页和自动化页。
  9. 最后再碰 Git、MCP、电脑操控这些高级功能。

二十五、账号额度怎么选:Plus 够不够,Pro 什么时候值得

尽量用付费的会员账号登录,因为免费的真的经不起折腾。大佬级别的直接上pro,小白可以先plus尝尝鲜。

一些购买方法汇总: 小猫的20美金礼品卡订阅方法:https://x.com/lngkximo/status/2050761195750351026

gamsgo:https://www.gamsgo.com/partner/WsMzs,之前有200刀,现在好像缺货。

逸尘:我这边也提供plus和200刀pro的充值,但是基本上都和官方价格差不多,但是优点胜在不需要折腾,充值方式简单,不愿意浪费太多时间的大佬可以让我赚杯咖啡钱~联系:yichen365ai

二十六、写在最后

Codex App 是一个非常牛逼、而且非常适合普通人上手的超级APP,他比Claude Code的CLI界面更加好上手,非常符合小白的使用习惯。而且他能够操控电脑、读取本地文件,基本上只要是人类能做的软件操作他都能完成。

它的功能非常广泛:

  • 聊天。
  • 文件。
  • 项目。
  • 网页。
  • 浏览器。
  • 自动化。
  • Git。
  • 第三方账号。
  • 本地电脑权限。

所以小白第一次打开会懵,是很正常的,但是你要习惯使用它,慢慢地给他加插件、加Skill,最后把它培养成最合适的超级助手。

最后,祝你使用的愉快!