Codex App 边玩边赚钱实战教学:用它做办公四件套、3D视频、网站、教程和电商自动化
上一篇我写的是 Codex App 从 0 到 1 入门,重点是带大家认识 Codex 界面以及进行一些基础配置。
地基搭建好了,就要开始用 Codex App 干一些真正能提效降本的事情,把它全方位地赋能到业务里面。当然,除了“赚钱”,也要好好“玩一下”,毕竟,不能老是工作,没有娱乐嘻嘻~
今天这篇就带大家进入一些实战场景,体验一下 Codex 那些不为人知的秘密,从基础到略难,从功能到场景,一次性帮你把 Codex 啃透!
- 牛马打工人必备:用 Codex 做 Word、PDF、PPT(图片型 VS HTML 型)、Sheets 四件套。
- 手搓酷炫 3D 视频:用 Codex + HyperFrames / Remotion(three.js)做《国产动画十大电影》。
- 早起早睡身体好:用 Codex 实际制作一个排版精美的分析早睡早起的网站,并在 Vercel 上线部署,全程一句提示词。
- 自媒体人必备:用 Codex 制作图文长教程——让 Codex 自己操控自己,多对话并行,截图打码一把梭。
- 电商选品上架自动化:Codex + Playwright 操控浏览器,无痛实现拼多多商品批量上架。
边学边玩,再边把钱赚了,是我的目标,与各位大佬共勉,话不多说,直接开始!
先说清楚:这次不是“讲概念”,是真实跑项目
这一篇和上一篇不太一样。
上一篇更像“认识 Codex App”:界面在哪里,插件怎么装,基础配置怎么做,遇到报错怎么排查。
这一篇更像“把 Codex 当一个执行型员工来用”。
我会把它放进几个真实场景里:
| 场景 | 最后得到什么 | 核心能力 |
|---|---|---|
| 办公四件套 | Word、PDF、PPT、XLSX | 内容交付 |
| PPT 两条路线 | 图片型 PPT、HTML 型 PPT | 视觉表达 |
| 3D 视频 | 1080P 动画成片 | 创意制作 |
| 网站开发部署 | 本地网页 + Vercel 在线网址 | 产品上线 |
| 图文教程 | Markdown 长文 + 真实配图 | 自媒体生产 |
| 电商自动化 | 表格到后台的批量填写方案 | 业务降本 |
这篇里出现的截图分两类。
第一类是 Codex App 本体截图,也就是在 Codex 里输入提示词、看它运行、看它生成文件的界面。
第二类是最终产物截图,比如 PPT 预览、网页预览、视频关键帧、图文教程配图。
涉及账号、项目路径、无关对话的地方,我会尽量裁掉或打码。教程重点是让大家看懂流程,不是展示隐私信息。
还有一个原则:这次不放“截图占位符”。
能放进来的图,都是已经真实生成出来的;如果某个场景不适合放真实业务截图,比如电商后台和客户资料,我会直接说明原因,并改成流程图或文字拆解。
一、牛马打工人必备:用 Codex 做 Word、PDF、PPT、Sheets 四件套
先从最接地气的开始。
很多人一听 Codex,就下意识觉得它是程序员工具。
其实不是。
说白了,Codex App 不只是能写代码,它更像一个“能在本地文件夹里干活的 AI 助理”。
你给它一个任务,它不只是给你一段文字,而是可以真的生成文件:
- Word 文档;
- PDF 手册;
- PPT 演示稿;
- Excel / Sheets 表格;
- HTML 页面;
- 图片素材;
- README 说明;
- 验收清单。
这就很适合打工人的日常场景。
比如你要做一套活动方案、项目汇报、课程交付、咨询报告、员工培训材料,以前可能要来回切 Word、PPT、Excel、PDF 工具。
现在可以先让 Codex 一口气搭一套“内容资产包”。
我这次给 Codex 的任务
我在 Codex App 里新开了一个对话,让它围绕“Codex App 内容生产工作流”生成一套办公四件套。
提示词大概是这个方向:
请在当前项目里生成一套内容生产工作流交付物:
1. Word 工作说明文档;
2. PDF 执行手册;
3. PPT 演示稿;
4. XLSX 生产排期表;
5. 最后生成一个预览图和文件清单;
6. 每个文件要能真实打开,不要只写占位内容。这里有个重点:不要只说“帮我写个方案”。
你要告诉它“最终要交付哪些文件”。
因为 Codex 很适合做“文件型交付”,你说得越像一个交付清单,它做出来的东西越容易验收。
最终生成了什么
这次生成出来的文件包括:
| 文件 | 用途 |
|---|---|
Codex_App_内容生产工作流_工作说明.docx | 给人看的 Word 说明文档 |
Codex_App_内容生产工作流_执行手册.pdf | 可以发给别人阅读的 PDF 手册 |
Codex_App_内容生产工作流_演示稿.pptx | 用来汇报或讲课的 PPT |
Codex_App_内容生产工作流_生产排期表.xlsx | 内容生产排期、任务分工和检查表 |
Codex_App_内容生产工作流_预览.png | 一张总览图,方便放进教程里展示 |
下面这张就是四件套的预览图。
看图重点不是“它多漂亮”,而是你要意识到:这些不是聊天框里的一段建议,而是真的生成到了本地文件夹里的文件。

这一张图证明了一个很关键的点:
Codex 适合做“成套交付”,不是只适合做单个文案。
你可以把一个任务拆成:
- 说明文档;
- 执行 SOP;
- 汇报 PPT;
- 任务表格;
- 验收清单;
- 预览截图。
然后让它一次性产出一套可复用资料。
Word 适合干什么
Word 最适合放结构化长文。
比如:
- 项目说明;
- 课程讲义;
- 咨询报告;
- 员工手册;
- SOP 文档;
- 活动方案。
我一般会要求 Codex 在 Word 里写清楚:
- 背景和目标;
- 使用对象;
- 操作流程;
- 风险点;
- 验收标准;
- 下一步建议。
它不一定第一次就写得像最终版,但它能快速帮你把“空白文档”变成“有结构的初稿”。
这一步已经非常值钱了。
因为很多人最痛苦的不是改文档,而是面对空白页。
PDF 适合干什么
PDF 更适合对外发。
比如你做课程、咨询、交付、内部培训,都可以让 Codex 把 Word 内容再整理成 PDF 手册。
这里有个小坑:中文 PDF 最容易出字体问题。
如果你发现 PDF 里中文乱码,不要急着骂工具。
直接让 Codex 检查:
这个 PDF 里的中文显示不正常,请检查字体嵌入、页面尺寸和导出方式,重新生成一个中文可读的 PDF。成功标志很简单:
- PDF 能打开;
- 中文正常显示;
- 页面没有大面积空白;
- 标题、段落、表格不重叠;
- 文件大小合理。
PPT 适合干什么
PPT 就不用多说了,汇报、课程、直播、路演、提案,基本都绕不开。
我这次还单独开了一个 Codex 对话,让它生成一套 5 页、16:9 的演示 PPT。
这张截图就是 Codex App 里生成 PPT 后出现文件卡片的画面。

看这张图时重点看右侧的文件卡片。
这说明它不是只在聊天里“描述了一套 PPT”,而是真的产出了 .pptx 文件。
我比较推荐大家让 Codex 先做两件事:
- 先列每一页标题和核心观点;
- 再生成 PPT 文件。
不要上来就说“帮我做一套漂亮 PPT”。
这样很容易得到一堆看起来很热闹,但逻辑比较散的页面。
更稳的提示词是:
请先为这套 PPT 设计 6 页结构。
每一页包含:标题、核心观点、适合的视觉元素、讲解备注。
我确认结构后,再生成可编辑 PPTX 文件。当然,如果你只是做一个演示样例,也可以让它一步到位。
但真正要发给客户、领导、学员的内容,我建议先让它出大纲,再生成文件。
Sheets / XLSX 适合干什么
表格这块是很多人低估 Codex 的地方。
它不只是能写文字,也能帮你规划数据结构。
比如:
- 内容排期表;
- 课程交付表;
- 项目进度表;
- 商品上架表;
- 预算表;
- 客户跟进表;
- 风险检查表。
我这次生成的 XLSX 里面,不只是随便填几行文字,而是按工作流拆成了多个 sheet。
你可以要求它:
请把这个项目拆成 4 个工作表:
1. 总览;
2. 任务排期;
3. 交付物清单;
4. 验收检查表。
每个表头要清晰,字段要适合后续继续维护。这一步的价值很大。
因为你以后要做自动化,表格就是最关键的“数据底座”。
比如后面讲到拼多多批量上架,真正的核心不是浏览器怎么点,而是你有没有一张干净、稳定、字段明确的商品表。
PPT 的两条路线:图片型 VS HTML 型
在 PPT 这件事上,我建议大家把它拆成两条路线。
第一条叫“图片型 PPT”。
第二条叫“HTML 型 PPT”。
这两个路线适合的场景不一样。
路线一:图片型 PPT
图片型 PPT 的意思是:先让 Codex 生成一张张 16:9 的视觉图片,再把这些图片铺到 PPT 里。
每一页 PPT 本质上就是一张完整图片。
这张是图片型 PPT 的预览。

这种方式的优点很明显:
- 视觉效果稳定;
- 不容易出现字体丢失;
- 不用担心元素位置乱跑;
- 很适合做封面、金句页、视觉型课程页;
- 适合发给别人看,不适合让别人深度编辑。
缺点也很明显:
- 页面里的字不好单独修改;
- 如果要改一句话,可能要重新生成整张图;
- 文件体积可能更大;
- 不适合财报、数据表、复杂可编辑内容。
所以我的建议是:
如果你要的是“好看、稳定、像海报”,就用图片型 PPT。
如果你要的是“可编辑、可改字、可复用”,就用普通 PPT 或 HTML 型 PPT。
路线二:HTML 型 PPT
HTML 型 PPT 是最近非常火的一条路线。
说白了,就是不用传统 PPT 软件,而是用 HTML、CSS、JS 直接写幻灯片。
它的好处是:
- 可以在浏览器里直接预览;
- 可以做动画;
- 可以做交互;
- 可以用代码控制布局;
- 可以方便截图、导出、录屏;
- 很适合和 Codex 这种代码执行型工具配合。
下面这张是我让 Codex 生成的 HTML 幻灯片页面截图。

HTML 型 PPT 更像“网页化的演示稿”。
如果你要做知识分享、产品演示、AI 课程、可交互课件,这个路线非常香。
我这次实测的工作流是:
- 先让 Codex 写一份 HTML 幻灯片;
- 本地打开预览;
- 检查文字是否溢出;
- 截图每一页;
- 需要的话再合成 PPT 或 PDF。
你也可以直接使用一些现成的开源工具,比如 Slidev、Marp、reveal.js、HTMLSlides、frontend-slides 这一类。
如果你之前听到过“OpenSlide”这个名字,也可以顺手搜一下确认自己说的是哪一个项目。因为同名或近似名的工具挺多,有些并不是做 PPT 的,不要把医学图像库、会议系统和 HTML 幻灯片框架混在一起。
我推荐的 PPT 提示词
如果你要做图片型 PPT,可以这样写:
请帮我做一套图片型 PPT。
主题:普通人如何用 Codex App 做内容生产
要求:
1. 先设计 5 页结构;
2. 每页生成一张 16:9 图片;
3. 图片中文字要少,重点突出;
4. 每页都要有标题、核心观点和视觉主体;
5. 最后把图片放进一个 PPTX 文件里;
6. 同时生成一张总览预览图,方便我检查。如果你要做 HTML 型 PPT,可以这样写:
请用 HTML、CSS、JS 写一套可在浏览器中打开的幻灯片。
主题:普通人如何用 Codex App 做内容生产
要求:
1. 16:9 画布;
2. 支持上一页、下一页切换;
3. 每页文字不能溢出;
4. 适配桌面浏览器;
5. 给我本地预览方式;
6. 最后用截图检查每页是否正常显示。这里最重要的不是“提示词多华丽”,而是你要把验收标准写进去。
比如:
- 16:9;
- 页数;
- 是否可编辑;
- 是否能浏览器预览;
- 是否生成文件;
- 是否截图检查;
- 是否给出文件路径。
Codex 是很适合被“验收清单”驱动的。
你越会写验收清单,它越像一个靠谱的执行者。
二、手搓酷炫 3D 视频:Codex + HyperFrames / Remotion 做《国产动画十大电影》
前面是打工人刚需。
下面开始玩一点酷的。
我之前让 Codex + HyperFrames / Remotion / three.js 做了一个《国产动画十大电影》的 3D 视频。
这个任务就不是普通办公交付了,而是偏创意制作。
你可以把它理解成:
- Codex 负责写项目、改代码、跑渲染、排查错误;
- three.js 负责 3D 画面;
- Remotion / HyperFrames 负责把网页动画变成视频;
- 最后输出 MP4 成片。
为什么这个场景值得讲
因为它能让你看到 Codex 的另一面:
它不是只能写“干巴巴的代码”,也可以做“带审美要求的多轮创作”。
普通视频剪辑软件里,你想做一个 3D 星空转场、电影海报环绕、镜头穿梭,往往需要会 AE、C4D、Blender。
但在 Codex 里,你可以把效果描述成文字,然后让它用 three.js 一点点搭出来。
当然,它不是一次就完美。
这类任务一定要迭代。
你要像导演一样反馈:
- 开场不够震撼;
- 转场不像星空;
- 3D 字体不够立体;
- 镜头运动太平;
- 下一个电影出现得太早;
- 最终导出要 1080P、30fps。
Codex 的优势是:它能把这些反馈变成代码修改,并且继续渲染验证。
这次做出来的效果
最终版本是一个 1920×1080、30fps、约 144 秒的视频。
开场做成了“星海神殿开门”的感觉。
中间的电影切换,不是普通横向滑动,而是进入一个“星空 360 度环绕电影空间”。
每一部电影像一块发光的银幕,围成一个轨道,镜头从当前电影退出,进入星空环形空间,再冲进下一部电影。
下面是最终成片的关键帧总览。

这张图主要看三件事:
- 画面是不是 16:9 成片比例;
- 3D 场景是不是有空间感;
- 每个片段是不是已经真实渲染出来。
再看这张转场边界检查图。

这张图不是为了好看,而是为了验收。
做视频最怕什么?
不是代码写不出来,而是你以为渲染成功了,结果转场切点乱了、画面穿帮了、下一部电影提前露出来了。
所以我让 Codex 抽关键帧检查转场边界。
这个习惯很重要。
做 3D 视频时,提示词不要只写“酷炫”
很多人会这样写:
帮我做一个酷炫的 3D 视频。这句话太抽象。
AI 会懂,但会懂得很飘。
更好的写法是把视频拆成“镜头语言”:
请用 three.js 制作一个 16:9 的 3D 视频工程。
主题:《国产动画十大电影》
要求:
1. 开场是金色电影神殿,镜头从远处推进,神殿大门打开,门后是星海;
2. 每部电影作为一个独立片段出现;
3. 电影之间用星空环绕转场连接;
4. 转场时 10 块电影银幕围成环形轨道,镜头从当前电影退出,进入轨道,再冲进下一部;
5. 不要让下一部电影在当前片段提前出现;
6. 输出 1920×1080、30fps 的 MP4;
7. 渲染后抽帧检查开场、正文和转场边界。你看,这就不是“做个酷炫视频”了。
这是一个导演分镜。
Codex 很吃这一套。
因为它可以把每条要求翻译成具体任务:
- 搭 three.js 场景;
- 写相机运动;
- 写星空粒子;
- 写银幕材质;
- 写转场时间轴;
- 写渲染命令;
- 写抽帧检查脚本。
这个项目的成功标志
做视频类项目,不要只看“有没有生成 MP4”。
我建议按这几个标准验收:
| 验收点 | 怎么看 |
|---|---|
| 能不能播放 | MP4 可以正常打开,不卡死 |
| 画面比例 | 1920×1080 或你指定的比例 |
| 帧率 | 30fps 或你指定的帧率 |
| 转场 | 不穿帮、不提前露出下一段 |
| 声音 | 如果有 BGM,音频能正常合成 |
| 抽帧 | 开头、中段、结尾、转场都能截图检查 |
| 文件路径 | 最终文件和中间文件要分清楚 |
我这次最终成片路径是:
/Users/yichen/Documents/Codex/2026-05-07/hyperframes-hyperframes-users-yichen-codex-plugins-2/renders/china-animation-top10-montage-v19-starry-space-final.mp4这里还有一个小建议。
如果你只是想做短视频封面、片头、转场模板,可以先做 10 秒、20 秒的小片段。
不要一上来就做 3 分钟大片。
先把风格跑通,再拉长时长。
不然每次渲染都要等,改起来也痛苦。
三、早起早睡身体好:一条提示词做网站,并部署到 Vercel
接下来这个项目,听起来有点搞笑,但我觉得很有必要。
现在玩 AI 的人,很多都有一个共同问题:作息乱。
晚上说“再测一个模型”,结果一抬头凌晨两点。
本来只是想改一个提示词,最后顺手又跑了三个工作流、看了五个项目、顺便刷了一圈新工具。
很爽,但身体遭不住。
健康才是革命的本钱。
赚钱重要,效率重要,但身体不能一直当服务器 24 小时跑。
所以我这次让 Codex 做了一个网站,主题是“早睡早起复利实验室”。
目的不是装作自己突然变成养生大师,而是想用一个轻松一点的方式提醒大家:
我们搞 AI,不能只优化工作流,也要优化自己的作息流。
我给 Codex 的需求
这个项目的要求很简单:
请重新帮我生成一个网站,主题是早睡早起。
要求:
1. 页面要排版精美;
2. 可以有 3D 动画效果;
3. 分析早睡早起的好处;
4. 给出普通人能执行的步骤;
5. 做成真实可运行的网站;
6. 最后启动本地预览,并告诉我怎么部署到 Vercel。Codex 最后做出来的不只是一个静态页面。
它做了:
- 一个 3D 昼夜节律视觉场景;
- 早睡早起好处说明;
- 晚间关机流程;
- 早晨启动流程;
- 7 天调整计划;
- 自测打分;
- 常见误区;
- 参考资料和免责声明。
下面是网站预览。

这张图比较长,因为整个网页内容都截图进来了。
你能看到它已经不是“一个白底页面加几段字”,而是一个完整的主题网站。
Codex 做网站的过程其实很简单
很多人听到“做网站并部署上线”,脑子里会自动浮现一堆麻烦东西:
- HTML;
- CSS;
- JavaScript;
- 本地预览;
- 打包;
- 服务器;
- 域名;
- 部署;
- 报错;
- 环境配置。
但在 Codex App 里,流程其实可以非常直观。
你只需要讲清楚:
- 我要做什么主题;
- 网站给谁看;
- 页面要包含哪些内容;
- 风格大概是什么;
- 是否要动画;
- 是否要部署上线;
- 最后怎么验收。
Codex 会自己去生成文件。
这次项目里主要生成了:
index.html
styles.css
app.js
README.md
vendor/three.module.js
sleep-lab-preview.png它还启动了本地预览。
本地预览地址是:
http://127.0.0.1:4173注意,这个地址只有你自己的电脑能打开。
如果你想让别人也能看,就要部署到线上。
部署到 Vercel
这次我把它部署到了 Vercel。
线上地址是:
https://codex-1-html-css-js-2.vercel.app
我也检查过,线上返回状态是 200,可以正常访问。
这一步的意义不是“我做了一个多么伟大的网站”。
真正重要的是:
从一个想法,到一个可以被别人打开的网址,中间不需要你手写一整套工程。
Codex 可以帮你完成:
- 建项目;
- 写页面;
- 写样式;
- 写交互;
- 加 3D 效果;
- 本地预览;
- 截图检查;
- 部署上线;
- 告诉你哪个网址别人能访问。
这就是普通人做产品原型的巨大机会。
你今天可以做一个早睡早起网站。
明天就可以做:
- 课程介绍页;
- 产品落地页;
- 活动报名页;
- 咨询服务页;
- 小工具页面;
- 数据看板;
- 客户演示 Demo。
以前你可能想了半天:“我不会开发,算了。”
现在可以先让 Codex 做一个能跑的版本。
再慢慢改。
这里容易踩的坑
第一个坑:本地地址和线上地址不要搞混。
127.0.0.1 是你自己的电脑。
别人打不开。
Vercel 地址才是别人能访问的。
第二个坑:部署完不等于万事大吉。
你还要检查:
- 页面能不能打开;
- 手机端是否能看;
- 3D 画面是否出现;
- 按钮是否能点;
- 文字有没有溢出;
- 页面标题是否正确;
- 参考资料是否靠谱。
第三个坑:健康类内容不要装医生。
我这次网站里也加入了非医疗建议说明,并参考了 CDC、NHLBI、Mayo Clinic、AASM 等公开健康资料。
如果你要写健康、金融、法律这种高敏感主题,一定要让 Codex 标注来源,并且避免绝对化承诺。
比如不要写“早睡一定治好所有问题”。
这种话既不严谨,也容易翻车。
四、自媒体人必备:用 Codex 制作图文长教程
这一节是我自己最常用的场景。
自媒体人最痛苦的是什么?
不是不会写。
而是“素材整理 + 截图 + 打码 + 配图 + 排版 + 验证链接”太碎了。
一篇图文长教程,看起来只是几千字。
背后其实是一堆小活:
- 要写大纲;
- 要跑流程;
- 要截图;
- 要裁剪;
- 要打码;
- 要生成配图;
- 要把图放到正确位置;
- 要检查 Markdown 链接;
- 要确保读者照着做能跑通。
这时候 Codex App 就很适合。
因为它可以直接在本地文件夹里管理文章和图片。
让 Codex 自己制作图文教程
我这次单独开了一个对话,要求很明确:
请制作一篇图文教程。
要求:
1. 不要使用截图占位符;
2. 可以用 Codex 内置生图能力生成真实配图;
3. 也可以使用真实截图;
4. 每张图都要保存成本地文件;
5. Markdown 文章里要正确引用图片;
6. 最后检查所有图片链接是否有效。下面这张是 Codex App 里生成图文教程结果的截图。

看图重点是右侧的生成结果。
Codex 已经生成了多张真实图片,并且放进了教程结构里。
这就比“这里后面补图”靠谱多了。
最终生成的三张配图
第一张是教程规划图。

第二张是图片工作流图。

第三张是 Markdown 验证图。

这三张图不是随便拿来装饰的。
它们分别承担了三个作用:
| 图片 | 作用 |
|---|---|
| 教程规划图 | 告诉读者从选题到成文的大流程 |
| 图片工作流图 | 告诉读者配图不是乱放,而是有生成、保存、引用链路 |
| Markdown 验证图 | 告诉读者最后要检查图片链接是否真的可用 |
多对话并行:让 Codex 自己操控自己
这次教程里,我不止开了一个 Codex 对话。
而是把任务拆成多个对话并行跑。
比如:
- 一个对话生成办公四件套;
- 一个对话做 PPT 双路线;
- 一个对话做图文教程;
- 一个对话做 3D 视频;
- 一个对话做网站;
- 一个对话整理文章素材。
为什么要这么做?
因为长任务很容易互相干扰。
你在一个对话里既要做 PPT,又要做 PDF,又要做视频,又要改文章,后面上下文会越来越乱。
拆成多个对话以后,每个对话只负责一个结果。
这就像开了几个小团队:
- A 组负责文档;
- B 组负责视觉;
- C 组负责视频;
- D 组负责网站;
- E 组负责文章。
最后再把结果汇总回来。
这就是我说的“让 Codex 自己操控自己”。
不是玄学。
就是把一个大任务拆成多个小执行单元。
做图文教程时,我建议固定这套流程
- 先写教程主题;
- 再列截图清单;
- 每个截图说明“读者要看哪里”;
- 敏感信息先打码;
- 图片统一放到
assets文件夹; - Markdown 引用相对路径;
- 最后让 Codex 检查图片链接。
截图清单可以这样写:
请为这篇教程规划截图清单。
每张图请包含:
1. 截图名称;
2. 截图位置;
3. 截图前要完成什么操作;
4. 图里读者要重点看哪里;
5. 是否需要打码;
6. 图片应该放在文章哪个段落后面。这一步非常重要。
很多教程不好懂,不是因为文字少,而是图片放错了。
图片不是装饰。
图片应该帮读者确认:“我现在是不是也到了同一个状态?”
这里最容易踩的坑
第一个坑:图片是假的。
很多 AI 写教程会写:
\然后根本没有这张图。
这种文章发出去,读者一打开就是裂图。
所以一定要让 Codex 最后检查:
请检查这篇 Markdown 里所有图片路径是否真实存在。
如果有不存在的图片,请修复路径或重新生成图片。第二个坑:截图暴露隐私。
Codex App 左侧可能有历史对话、项目名称、路径、账号信息。
截图前要裁掉,或者打码。
第三个坑:图文不对应。
有些教程前面说“点击右上角”,图片里却没有右上角。
这会让小白非常焦虑。
所以每张图前后都要写清楚:
- 这张图在看什么;
- 它证明了什么;
- 如果你和我不一样,应该检查哪里。
五、电商选品上架自动化:Codex + Playwright 实现拼多多商品批量上架
最后讲一个真正能降本的业务场景。
我今天和一个做电商的老板连麦,他现在主要做拼多多,类目是数码配件。
他们遇到的痛点非常典型:
- 商品非常长尾;
- 链接数量很多;
- 一个链接下面有多个 SKU;
- 表格里有 1000 多行数据;
- 当前在售链接有 438 个左右;
- 开新店时,需要重新建几百个商品链接;
- 每个 SKU 都要填库存、拼单价、规格编码、商品编码、参考价等字段;
- 日常还要维护价格和编码变化;
- 人工对着表格往后台填,慢,而且容易错。
这就是非常适合自动化的场景。
因为它不是创意判断。
它本质上是:
把表格里的结构化数据,稳定地填进网页后台。
第一条思路:Computer Use
我最开始给他的思路,是用 Codex 的 Computer Use。
也就是让 Codex 直接看屏幕、操控电脑、打开表格、识别后台字段,然后把内容填进去。
这个方式的优点是直观。
你不用先研究网页结构。
只要把表格路径、后台页面、字段对应关系讲清楚,Codex 就可以像一个会看屏幕的人一样操作。
适合什么场景?
- 只跑几条;
- 页面变化不大;
- 操作比较简单;
- 你愿意在旁边盯着;
- 需要先验证可行性。
我当时建议他先拿 1 到 5 个商品测试。
不要一上来就让 AI 跑 400 个链接。
因为屏幕识别很消耗额度,也更容易受到页面状态影响。
提示词可以这样写:
请根据这个本地表格里的数据,填写当前浏览器中打开的拼多多商品发布页面。
表格路径:xxx
Sheet 名称:xxx
行范围:第 2 行到第 7 行
字段对应关系:
库存 = 表格 H 列
拼单价 = 表格 I 列
日常售价 = 表格 J 列
规格编码 = 表格 K 列
商品编码 = 表格 L 列
要求:
1. 先只填写第一个商品;
2. 填完后不要提交发布,先截图给我确认;
3. 如果页面字段和表格字段无法对应,请停下来问我;
4. 不要操作其他浏览器标签页。这条路能不能用?
能。
但如果你要做几百个商品,它不是最优解。
因为 Computer Use 更像“让 AI 盯着屏幕点击”。
它会慢,会耗额度,也会受到页面布局、弹窗、滚动条、焦点位置影响。
后来实际落地时,这条路失败了。
所以我又给他讲了第二条路:Playwright。
第二条思路:Playwright
Playwright 是什么?
你可以把它理解成“让代码操控浏览器”。
它不是靠眼睛看屏幕,而是直接识别网页里的按钮、输入框、下拉框。
这就更适合批量任务。
Computer Use 像一个人坐在电脑前看屏幕操作。
Playwright 像一个自动化脚本,直接去找网页元素。
做拼多多批量上架,更推荐 Playwright。
因为这个任务有明显的结构:
flowchart LR A["商品底表"] --> B["整理字段映射"] B --> C["Playwright 打开后台"] C --> D["填写商品基础信息"] D --> E["填写 SKU 价格和库存"] E --> F["上传图片和视频"] F --> G["截图暂停人工确认"] G --> H["确认后批量运行"] H --> I["输出成功/失败日志"]
这里最关键的是:先整理表格。
不要把一张混乱的大表直接丢给自动化。
你要先让 Codex 把它整理成“后台字段顺序一致”的干净表。
比如:
| 后台字段 | 表格字段 | 说明 |
|---|---|---|
| 商品标题 | title | 每个商品唯一 |
| 商品类目 | category | 可固定或映射 |
| 规格名称 | sku_name | 比如 0.3 米、1 米 |
| 库存 | stock | 数字 |
| 拼单价 | group_price | 数字 |
| 日常售价 | sale_price | 数字 |
| 规格编码 | sku_code | ERP 发货用 |
| 商品编码 | product_code | 内部管理用 |
| 图片路径 | image_paths | 本地素材文件夹 |
表格一旦稳定,后面自动化就简单很多。
Codex 在这里负责什么
这个项目里,Codex 不只是“写一个脚本”。
它可以负责整条链路:
- 读取原始 Excel;
- 分析哪些列有用;
- 重新整理成标准上架表;
- 让你确认字段映射;
- 写 Playwright 自动化;
- 用已登录浏览器打开拼多多后台;
- 先跑一个商品;
- 截图暂停,让人工确认;
- 记录成功、失败和错误截图;
- 稳定后批量跑;
- 最后把流程沉淀成 Skill。
这就是从“一次性帮我填表”,升级成“公司可复用的自动化流程”。
我会怎么设计这个自动化
如果是我来做,我不会直接让它一口气提交 400 个商品。
我会分成 5 步。
第一步,整理数据。
让 Codex 把原始 Excel 变成一个干净的 products_to_upload.xlsx。
每一列都对应后台字段。
第二步,做字段映射。
把拼多多后台每个字段和表格列一一对应。
如果某些字段是固定值,比如品牌、类目、型号,就写进配置文件。
第三步,跑单商品 dry run。
只填一个商品,不提交。
填完截图,人工确认。
第四步,小批量测试。
比如一次跑 5 个或 10 个。
每个商品都记录:
- 成功;
- 失败;
- 失败原因;
- 错误截图;
- 已填写到哪个步骤。
第五步,批量运行。
等前面稳定之后,再跑 400 个。
而且最好也不要真的完全无人值守。
电商后台是有外部影响的系统,发错价格、发错库存、发错 SKU,后果都是真钱。
所以我建议前期一定保留人工确认。
Playwright 方案的提示词
可以这样让 Codex 开始:
请帮我设计一个拼多多商品批量上架自动化项目。
目标:
把 Excel 表格里的商品和 SKU 信息,填写到已经登录的拼多多商家后台。
要求:
1. 先读取 Excel,整理成标准字段表;
2. 生成字段映射配置;
3. 使用 Playwright 控制浏览器;
4. 先只跑第 1 个商品;
5. 填完后不要提交,截图并暂停,等待我确认;
6. 每一行都要输出运行日志;
7. 失败时保存错误截图;
8. 稳定后再支持批量运行;
9. 不要把登录 Cookie、账号密码写进代码或文档。如果你是做跨境电商,这套思路也能迁移。
比如:
- 亚马逊;
- Coupang;
- Mercado Libre;
- 独立站后台;
- ERP 系统;
- 供应链系统。
底层逻辑都差不多:
标准化表格 + 字段映射 + 浏览器自动化 + 截图验收 + 日志追踪。
这个场景真正值钱的地方
很多人以为自动化最难的是“点按钮”。
其实不是。
最难的是把业务流程变成稳定的数据结构。
你只要做到:
- 表格字段清楚;
- 页面字段清楚;
- 每一步可截图;
- 每一行可追踪;
- 出错能回滚;
- 最后能沉淀成 Skill;
那 Codex 就不只是一个聊天工具。
它会变成你的业务执行系统。
这也是我觉得 Codex 真正能帮普通人赚钱的地方。
不是因为它会写代码。
而是它能把你原来靠人肉重复做的事情,拆成流程,写成脚本,跑出结果,再不断优化。
跑完这五个场景后,我对 Codex 的理解
如果只把 Codex 当“更会写代码的 ChatGPT”,就太浪费了。
这次五个场景跑下来,我更愿意把它理解成五种能力的集合:
| 能力 | 对应场景 |
|---|---|
| 文件生产能力 | Word、PDF、PPT、Sheets |
| 视觉表达能力 | 图片型 PPT、HTML 型 PPT |
| 创意渲染能力 | 3D 视频、动画、关键帧 |
| 产品上线能力 | 网站、本地预览、Vercel 部署 |
| 业务自动化能力 | 表格到后台、Playwright、批量操作 |
这几个能力组合起来,就很可怕。
你可以用它做内容。
可以用它做课程。
可以用它做网站。
可以用它做视频。
可以用它做自动化。
也可以用它给自己的业务做一套内部工具。
我建议的小白学习路线
如果你是刚开始用 Codex App,不要一上来就挑战最复杂的电商自动化。
建议按这个顺序:
- 先让它生成一篇 Markdown 文档;
- 再让它生成 Word、PDF、PPT、XLSX;
- 再让它做一个 HTML 小网页;
- 再让它启动本地预览;
- 再让它部署到 Vercel;
- 再让它做图文教程;
- 再尝试 HTML PPT;
- 再尝试视频动画;
- 最后再碰业务自动化。
这个顺序会比较舒服。
因为你会一点点建立信任。
先看到它能生成文件。
再看到它能预览网页。
再看到它能上线。
再看到它能操作浏览器。
最后你才会真的理解:
哦,原来 Codex App 不是一个聊天框。
它更像一个可以执行任务的小型工作台。
可以直接复制的总提示词
如果你想自己复刻这篇文章里的思路,可以先用下面这个总提示词:
我想用 Codex App 做一个完整实战项目。
请你不要只给我建议,而是直接在当前项目文件夹里生成真实可交付的文件。
项目主题:填写你的主题
我希望你完成:
1. 生成一份 Markdown 说明文档;
2. 生成 Word、PDF、PPT、XLSX 四类交付物;
3. 如果适合,请生成一个 HTML 预览页面;
4. 如果适合,请生成图片或截图;
5. 每个文件都要放在清晰的目录里;
6. 生成 README,说明每个文件是干什么的;
7. 最后检查所有文件是否真实存在;
8. 给我一份验收清单;
9. 不要使用“待补充”“截图占位符”这种假内容。如果你要做网站,可以改成:
请帮我做一个真实可运行的网站。
主题:填写你的主题
目标用户:填写目标用户
页面风格:填写风格
要求:
1. 使用 HTML、CSS、JS;
2. 页面排版要完整;
3. 移动端和桌面端都能看;
4. 如果适合,可以加入 three.js 3D 效果;
5. 启动本地预览;
6. 截图检查页面;
7. 如果环境允许,部署到 Vercel;
8. 告诉我本地地址和线上地址分别是什么。如果你要做电商自动化,可以改成:
请帮我设计一个浏览器自动化项目。
目标:
把表格中的数据填写到网页后台。
要求:
1. 先读取表格;
2. 整理字段映射;
3. 先跑一条测试数据;
4. 填完后截图并暂停确认;
5. 不要直接提交或发布;
6. 记录每一行的运行日志;
7. 失败时保存错误截图;
8. 稳定后再支持批量运行;
9. 不要保存账号密码、Cookie 等敏感信息。写在最后
我越来越觉得,未来普通人用 AI 的分水岭,不是“会不会问问题”。
而是你能不能把自己的需求,变成一个可执行、可验收、可复用的流程。
Codex App 最厉害的地方,就在这里。
它可以陪你从一个想法开始,一路做到:
- 文件生成;
- 页面预览;
- 图片制作;
- 视频渲染;
- 网站部署;
- 浏览器自动化;
- 业务流程沉淀。
赚钱当然重要。
但偶尔也要拿它做点好玩的东西。
比如做一个 3D 国产动画视频。
比如做一个提醒自己早睡早起的网站。
毕竟工具再强,人也得活得有点意思。
边学边玩,再边把钱赚了。
这就是我现在用 Codex App 最真实的感受。
参考资料和延伸链接
HTML / PPT 方向:
睡眠健康资料:
- CDC:Sleep and Sleep Disorders
- NHLBI:Sleep Deprivation and Deficiency
- Mayo Clinic:Sleep tips
- American Academy of Sleep Medicine:Healthy Sleep Habits
部署相关: