Codex App 边玩边赚钱实战教学:用它做办公四件套、3D视频、网站、教程和电商自动化

上一篇我写的是 Codex App 从 0 到 1 入门,重点是带大家认识 Codex 界面以及进行一些基础配置。

地基搭建好了,就要开始用 Codex App 干一些真正能提效降本的事情,把它全方位地赋能到业务里面。当然,除了“赚钱”,也要好好“玩一下”,毕竟,不能老是工作,没有娱乐嘻嘻~

今天这篇就带大家进入一些实战场景,体验一下 Codex 那些不为人知的秘密,从基础到略难,从功能到场景,一次性帮你把 Codex 啃透!

  1. 牛马打工人必备:用 Codex 做 Word、PDF、PPT(图片型 VS HTML 型)、Sheets 四件套。
  2. 手搓酷炫 3D 视频:用 Codex + HyperFrames / Remotion(three.js)做《国产动画十大电影》。
  3. 早起早睡身体好:用 Codex 实际制作一个排版精美的分析早睡早起的网站,并在 Vercel 上线部署,顺便用 OpenRouter 上的 Ring-2.6-1T (free) 做一次对照测试。
  4. 自媒体人必备:用 Codex 制作图文长教程——让 Codex 自己操控自己,多对话并行,截图打码一把梭。
  5. 电商选品上架自动化:Codex + Playwright 操控浏览器,无痛实现拼多多商品批量上架。

边学边玩,再边把钱赚了,是我的目标,与各位大佬共勉,话不多说,直接开始!


一、牛马打工人必备:用 Codex 做 Word、PDF、PPT、Sheets 四件套

以前如果你要做一套活动方案、项目汇报、课程交付、咨询报告、员工培训材料,可能要先花几个月熟练使用这些工具,但是现在在Codex里面只需要一句提示词,就能生成排版精美、数据准确的Word、PDF、PPT、Sheets。

我为了展示Codex生成四件套的能力,做了一个demo:

请在当前对话里做一个办公四件套演示任务,主题是《Codex App 内容生产工作流》。要求:
1. 生成 Word 文档、PDF 文件、PPTX 演示稿、XLSX 表格四类真实文件;
2. 每个文件都要有实际内容,不要空文件;
3. 生成后告诉我每个文件的真实路径;
4. 尽量生成一个预览或文件清单,方便我截图放进教程;
5. 最后给出验收清单,确认四个文件都存在、能打开、不是占位内容。

验收结果: 1.Word:

2.PDF

3.PPT

4.sheets

当然,在我没有给出skill或者优化后的提示词的情况下,能做出这样的效果,已经非常优秀了!

众所周知,现在X最火的PPT制作方法,绝对是打破传统的HTML绘制PPT,现在相关爆火的Skill也是数不胜数,其次直接生成图片PPT也是一个另辟蹊径的办法。

下面我将用“进阶版”PPT的操作路径给大家带来一些启发:

路线一:图片型 PPT

图片型 PPT 的意思是:先让 Codex 生成一张张 16:9 的视觉图片,再把这些图片铺到 PPT 里。

每一页 PPT 本质上就是一张完整图片。

效果还是蛮不错的,因为底层是GPT2-imge。

当然,这种方式生成的PPT并非无法编辑,还是有很多方法滴,如果感兴趣,可以私信找我要文档~

路线二:HTML 型 PPT

HTML 型 PPT 是最近非常火的一条路线。

说白了,就是不用传统 PPT 软件,而是用 HTML、CSS、JS 直接写幻灯片。

它的好处是:

  • 可以在浏览器里直接预览;
  • 可以做动画;
  • 可以做交互;
  • 可以用代码控制布局;
  • 可以方便截图、导出、录屏;
  • 很适合和 Codex 这种代码执行型工具配合。

X上面有很多开源火爆的Skill,大家用Grok搜索一下就能让Codex安装一下使用了。


二、手搓酷炫 3D 视频:Codex + HyperFrames / Remotion 做《国产动画十大电影》

前面是打工人刚需,下面开始玩一点酷的,主打一个劳逸结合。

我之前让 Codex + HyperFrames / Remotion (three.js) 做了一个《国产动画十大电影》的 3D 视频:https://x.com/gengdaJ/status/2052380430385471686

核心思路:

  • Codex 负责写项目、改代码、跑渲染、排查错误
  • three.js 负责 3D 画面
  • Minimax负责旁白配音
  • yt-dlp下载部分视频
  • Remotion / HyperFrames 负责把网页动画变成视频
  • 本地工具统一音量
  • 最后输出 MP4 成片

详细步骤就是:

1.先把目标视频的需求给Codex说清楚——“我需要一个做《国产动画十大电影》的视频,16:9…(更多描述参考下面的模板),你自己去网上找素材下载。”

2.和Codex对齐需求——”如果有任何不清楚的地方,或者需要我继续判断的地方,请一定要停下来问我问题,进行信息对齐。“

3.开启“超高”和“完全访问权限”,让Codex@browser和@computer use自己去操作,当然@chrome也可以(但是我一直超时没成功过)。

4.得到成片,然后就是把不满意的地方和Codex说,让它修改。

当初我想要做这么一个视频的思路,很简单,我就是想验证Codex“自动写脚本——搜索素材——自动下载——自动识别高光片段——自动配音——自动剪辑”这条链路跑通。

然后迁移到商业化就是,调用GPT2-image、seedance2.0、elevenlabs等API,90%自动化地完成上述整个思路,赋能到AI流量变现、AI电商带货、AI前端获客、AI广告宣传等真实场景里面。

至于怎么写脚本、怎么生成图片、怎么制作视频,这是一门大学问,需要千锤百炼去苦修试错,不是朝夕就能学会的,而且细分到每一个垂直领域所需要掌握的技巧又是完全不同的。

但是怎么生成一个视频,快速上手玩,有一个通用模板可以上手:

目标:
受众:
目标平台:unspecified / YouTube / Shorts / Reels / TikTok / 官网 / 会议现场
时长:
比例 / 分辨率 / FPS:
语言:
场景数量与每场时长:
主体 / 角色:
动作:
场景 / 背景:
镜头 / 构图:
光线 / 色彩 / 风格:
字幕 / 画面文字:
音频:旁白 / 语言 / 音色 / 语速 / 音乐 / SFX
转场:
关键帧 / 参考图 / 角色一致性资产:
品牌 / 法务 / 无障碍:
数据变量 / 占位符:
输出要求:先给 scene list,再给 final prompt,再给 render metadata JSON


三、早起早睡身体好:一条提示词做网站,并部署到 Vercel

现在玩 AI 的人,很多都有一个共同问题:作息乱。

本来只是想改一个提示词,最后顺手又刷了一堆X、然后莫名其妙调用Codex跑一个任务,然后这个任务又停不下来了。。。这就是曾经的我。。。

我知道用AI很爽,但身体遭不住,健康才是革命的本钱。所以我蹭这次写“Codex代码教程“的机会,让 Codex 做了一个网站,主题是“早睡早起身体好”

让Codex写代码,跑出一个小网站或者小App真的很简单:

请重新帮我生成一个网站,主题是早睡早起。
 
要求:
1. 页面要排版精美;
2. 可以有 3D 动画效果;
3. 分析早睡早起的好处;
4. 给出普通人能执行的步骤;
5. 做成真实可运行的网站;
6. 最后启动本地预览,并部署到 Vercel。

涉及到上线部署(别人通过链接能访问你的这个网站)这里可能需要你配置一下Vercel插件(“插件”里面搜Vercel就行):

Codex 最后做出来的不只是一个静态页面(已经部署到:https://codex-1-html-css-js-2.vercel.app/,大家可以自由访问),他还做了:

  • 一个 3D 昼夜节律视觉场景;
  • 早睡早起好处说明;
  • 晚间关机流程;
  • 早晨启动流程;
  • 7 天调整计划;
  • 自测打分;
  • 常见误区;
  • 参考资料和免责声明。

当然,这只是一个很基础的网站,如果想要做前端后端都有的网站,那么可能会提高有些难度,但是没关系,Codex都能帮你解决的,记得选择“计划模式”,先有方案,再写代码,效果会好很多。

除了让Codex自己写项目之外,其实还能白嫖官方网页版AI生成的代码——我直接打开相应的网页版AI,把我的项目需求告诉它,让它返回相应的代码,这一招在测试新模型的时候特别好用。

因为Openrouter上面经常会有新的模型,这个时候很多人很懒,只想着等AI博主测试完了看效果,有一个小技巧——直接让Codex去Openrouter上测试。

最近 OpenRouter 上又新出现了一个模型:Ring-2.6-1T (free),是蚂蚁家的第一个推理大模型(https://openrouter.ai/inclusionai/ring-2.6-1t:free)。

我本来想把 Ring-2.6-1T 接到 Claude Code 里面,然后让 Codex 去操作 Claude Code,看这个模型在 agent 编程场景里的真实表现。但实际操作的时候遇到一个限制:Codex 现在不能直接操控我本机里已经打开的 Ghostty / Claude Code 终端界面,所以这条链路不好测。

于是我换了一个更直接的办法:让 Codex 打开 OpenRouter 官网,在 Chat Playground 里选择 Ring-2.6-1T (free),然后把上面那条非常普通的“早睡早起网站”提示词和本地 frontend-design skill 里的审美原则提炼成提示词丢给它,让它直接生成一个单文件 HTML 网站。

它生成出来的版本,我也部署了一份,大家可以直接打开看效果:

https://ring-sleep-site.vercel.app/

老实说,这个结果非常不错吧,简洁美观。白嫖Token成功!

所以,如果你刚好想用一种高效的办法测试新模型的能力,我建议你可以通过 Codex + OpenRouter 免费试试 Ring 模型。国产大模型现在确实不是只能看参数和榜单,拿来干活也已经很有水平了。

此外,这个思路其实还可以迁移,Codex里面只能用GPT5.5模型,但是网页端GPT可以用GPT5.5 pro,据说这个模型比Codex写的代码好用,所以我这个思路迁移到GPT5.5pro可以说是非常牛逼!这个秘密别公开出去了,咱自己用就行。。。

四、自媒体人必备:用 Codex 制作图文长教程

这一节是我自己非常常用的一个场景,我相信会对很多写长文章恐惧症的朋友也会很有帮助。

自媒体人最痛苦的是什么?不是不会写,而是“搜索素材——找选题——搭结构——写文章——配图片/视频”这套流程花费时间太多了,往往写一篇文章几个小时就过去了。

所以,我直接干脆让Codex来写,我上一篇爆了92W阅读的《Codex App 从0到1完整入门教程:把这个超级APP的每一个细节抽丝剥茧讲清楚》80%都是由Codex完成!

包括文章、截图、打码、配封面图,我做的就是20%的纠正和补充工作。

但是,我为什么能用Codex写出那么高阅读的文章?这就涉及到“提示词的准确度”。

写作,不是给AI一个方向,让它琢磨,而是你要把“自己写这篇文章的思路”告诉它,让它帮你加速这个过程,这篇文章的核心和内容基本和你脑海想的别无二致,只是AI把这个琐碎的过程给自动化了。

所以,有一篇AI写的好文之前,是这个写作的人脑海里面有画面、有思路。

我拿我之前的这篇文章举个例子:我知道要介绍Codex的主界面以及Codex的设置,那么我给Codex的指令就是:“你来操作Codex APP本身,你挨个分析Codex主界面每个按钮的功能,然后再打开Codex的设置,按照左边导航栏的顺序,一页一页仔细地介绍。注意把隐私的地方打码。@computer use”

下面是另外一个实战demo,大家可以看看效果:

五、电商选品上架自动化:Codex + Playwright 实现拼多多商品批量上架

最后讲一个真正能降本的业务场景。我之前和一个电商的老板连麦,他现在主要做拼多多,店铺在迅速扩张。

他们遇到的痛点非常典型:

  • 链接数量很多;
  • 一个链接下面有多个 SKU;
  • 表格里有几千行数据;
  • 当前在售链接有几百个
  • 开新店时,需要重新建几百个商品链接;
  • 每个 SKU 都要填库存、拼单价、规格编码、商品编码、参考价等字段;
  • 日常还要维护价格和编码变化;
  • 人工对着表格往后台填,慢,而且容易错。

这就是非常适合自动化的场景,因为它不是创意判断。

它本质上是:

把表格里的结构化数据,稳定地填进网页后台。

第一条思路:Computer Use

我最开始给他的思路,是用 Codex 的 Computer Use。

也就是让 Codex 直接看屏幕、操控电脑、打开表格、识别后台字段,然后把内容填进去。

因为我想着Codex可以操作电脑,之前我跑了相关的数据库任务、X长文章任务都非常丝滑,所以推荐他首先用这个

只要把表格路径、后台页面、字段对应关系讲清楚,Codex 就可以像一个会看屏幕的人一样操作。

但是Codex拒绝访问拼多多后台。。。所以只能换第二条思路——用Codex调用playwright!

第二条思路:Playwright

Playwright 是什么?你可以把它理解成“让代码操控浏览器”。

它不是靠眼睛看屏幕,而是直接识别网页里的按钮、输入框、下拉框。

这个其实更适合批量任务。因为Computer Use 像一个人坐在电脑前看屏幕操作,Playwright 像一个自动化脚本,直接去找网页元素,不会抢鼠标和屏幕。

然后这条思路就打通了:

flowchart LR
    A["商品底表"] --> B["整理字段映射"]
    B --> C["Playwright 打开后台"]
    C --> D["填写商品基础信息"]
    D --> E["填写 SKU 价格和库存"]
    E --> F["上传图片和视频"]
    F --> G["截图暂停人工确认"]
    G --> H["确认后批量运行"]
    H --> I["输出成功/失败日志"]

Codex 在这里负责什么

这个项目里,Codex 不只是调用了一个playwright,它负责了整条链路:

  1. 读取原始 Excel;
  2. 分析哪些列有用;
  3. 重新整理成标准上架表;
  4. 让你确认字段映射;
  5. 写 Playwright 自动化;
  6. 用已登录浏览器打开拼多多后台;
  7. 先跑一个商品;
  8. 截图暂停,让人工确认;
  9. 记录成功、失败和错误截图;
  10. 稳定后批量跑;
  11. 最后把流程沉淀成 Skill。

把成功的经验沉淀成skill,这就从“一次性帮我填表”,直接升级成“公司可复用的自动化流程”,大大节约了后续的踩坑成本


六、跑完这五个场景后,我对 Codex 的理解

如果只把 Codex 当聊天助手,对话一下,实在就太浪费了。。。

你可以用它来生产文字、图片和视频——写图文教程(自媒体)、做精美的hyperframes视频(自媒体)、AI视频带货、接广告商单

你可以用它来解析微信聊天数据(https://github.com/mcncarl/yichen-skills/tree/main/wechat-local-vault)——赋能私域、提升话术、业务挖掘

你可以用它来自动化操控浏览器——电商AI提效、自媒体多平台同步

你可以用它来做AI PK——打开网页,同时调用gemini、chatgpt、claude、grok等网页版AI的最强模型,来帮你深度研究或者思考

你可以用它来调用监督别的AI干活——这一步的潜力是无限大的,但是唯一遗憾的是Codex不能监督别的终端干活,也就是说不能去监督Claude Code,希望以后能够放宽白名单。

七、我建议的小白学习路线

如果你是刚开始用 Codex App,不要一上来就挑战最复杂的电商自动化。

建议按这个顺序:

  1. 先让它生成几张图片,提示词可以去仓和;
  2. 再让它生成 Word、PDF、PPT、XLSX;
  3. 再让它做一个 HTML 小网页;
  4. 再让它启动本地预览;
  5. 再让它部署到 Vercel;
  6. 再让它做图文教程;
  7. 再尝试 HTML PPT;
  8. 再尝试视频动画;
  9. 最后再碰业务自动化。

这个顺序会比较丝滑,因为你会一点点建立和Codex信任——先看到它能生成资料、网站,看到它上线,看到它操作浏览器。

最后你才会真的理解:哦,原来 Codex App 不是一个聊天框,它是无所不能的超级助手


八、关于价格和使用事项

关于Codex的使用方法:免费版两个对话就用完了,所以大家上手一般至少需要充值一个GPT的Plus会员,但是我这种用量比较大的就开了个100刀的,实测下来一周差不多用完。

如果有需要GPT Plus、pro充值的朋友,可以来找我(yichen10801或yichen365ai),帮大家节省充值时间同时,我会给出几乎成本价,和大家交个朋友。

如果大家在和Codex对话过程中遇到以下情况:

解决办法是:

第一,不要只配置 `HTTP_PROXY`、`HTTPS_PROXY`、`ALL_PROXY`,还要补上 WebSocket 用的 `WSS_PROXY`、`WS_PROXY`,因为新对话可能走的是 `wss://` 连接;

第二,把这些代理变量写进 `~/.codex/config.toml`,让 Codex 的子进程能用代理;

第三,再用 `launchctl setenv` 把同样的代理写进 macOS 图形应用启动环境,这样从 Dock/Finder 打开的 Codex Desktop 也能吃到代理;

第四,设置完成后必须完全退出 Codex 再重新打开,不是只关窗口,因为旧进程不会自动继承新的代理环境。

核心思路就是:同时覆盖 HTTP 代理、WebSocket 代理,以及 Codex Desktop 自己的启动环境。

最后,祝大家使用Codex愉快!如果有业务场景繁琐、需要优化的老板,也欢迎联系我:yichen10801或yichen365ai