Codex App 边玩边赚钱实战教学:用它做办公四件套、3D视频、网站、教程和电商自动化

上一篇我写的是 Codex App 从 0 到 1 入门,重点是带大家认识 Codex 界面以及进行一些基础配置。

地基搭建好了,就要开始用 Codex App 干一些真正能提效降本的事情,把它全方位地赋能到业务里面。当然,除了“赚钱”,也要好好“玩一下”,毕竟,不能老是工作,没有娱乐嘻嘻~

今天这篇就带大家进入一些实战场景,体验一下 Codex 那些不为人知的秘密,从基础到略难,从功能到场景,一次性帮你把 Codex 啃透!

  1. 牛马打工人必备:用 Codex 做 Word、PDF、PPT(图片型 VS HTML 型)、Sheets 四件套。
  2. 手搓酷炫 3D 视频:用 Codex + HyperFrames / Remotion(three.js)做《国产动画十大电影》。
  3. 早起早睡身体好:用 Codex 实际制作一个排版精美的分析早睡早起的网站,并在 Vercel 上线部署,全程一句提示词。
  4. 自媒体人必备:用 Codex 制作图文长教程——让 Codex 自己操控自己,多对话并行,截图打码一把梭。
  5. 电商选品上架自动化:Codex + Playwright 操控浏览器,无痛实现拼多多商品批量上架。

边学边玩,再边把钱赚了,是我的目标,与各位大佬共勉,话不多说,直接开始!


先说清楚:这次不是“讲概念”,是真实跑项目

这一篇和上一篇不太一样。

上一篇更像“认识 Codex App”:界面在哪里,插件怎么装,基础配置怎么做,遇到报错怎么排查。

这一篇更像“把 Codex 当一个执行型员工来用”。

我会把它放进几个真实场景里:

场景最后得到什么核心能力
办公四件套Word、PDF、PPT、XLSX内容交付
PPT 两条路线图片型 PPT、HTML 型 PPT视觉表达
3D 视频1080P 动画成片创意制作
网站开发部署本地网页 + Vercel 在线网址产品上线
图文教程Markdown 长文 + 真实配图自媒体生产
电商自动化表格到后台的批量填写方案业务降本

这篇里出现的截图分两类。

第一类是 Codex App 本体截图,也就是在 Codex 里输入提示词、看它运行、看它生成文件的界面。

第二类是最终产物截图,比如 PPT 预览、网页预览、视频关键帧、图文教程配图。

涉及账号、项目路径、无关对话的地方,我会尽量裁掉或打码。教程重点是让大家看懂流程,不是展示隐私信息。

还有一个原则:这次不放“截图占位符”。

能放进来的图,都是已经真实生成出来的;如果某个场景不适合放真实业务截图,比如电商后台和客户资料,我会直接说明原因,并改成流程图或文字拆解。


一、牛马打工人必备:用 Codex 做 Word、PDF、PPT、Sheets 四件套

先从最接地气的开始。

很多人一听 Codex,就下意识觉得它是程序员工具。

其实不是。

说白了,Codex App 不只是能写代码,它更像一个“能在本地文件夹里干活的 AI 助理”。

你给它一个任务,它不只是给你一段文字,而是可以真的生成文件:

  • Word 文档;
  • PDF 手册;
  • PPT 演示稿;
  • Excel / Sheets 表格;
  • HTML 页面;
  • 图片素材;
  • README 说明;
  • 验收清单。

这就很适合打工人的日常场景。

比如你要做一套活动方案、项目汇报、课程交付、咨询报告、员工培训材料,以前可能要来回切 Word、PPT、Excel、PDF 工具。

现在可以先让 Codex 一口气搭一套“内容资产包”。

我这次给 Codex 的任务

我在 Codex App 里新开了一个对话,让它围绕“Codex App 内容生产工作流”生成一套办公四件套。

提示词大概是这个方向:

请在当前项目里生成一套内容生产工作流交付物:
 
1. Word 工作说明文档;
2. PDF 执行手册;
3. PPT 演示稿;
4. XLSX 生产排期表;
5. 最后生成一个预览图和文件清单;
6. 每个文件要能真实打开,不要只写占位内容。

这里有个重点:不要只说“帮我写个方案”。

你要告诉它“最终要交付哪些文件”。

因为 Codex 很适合做“文件型交付”,你说得越像一个交付清单,它做出来的东西越容易验收。

最终生成了什么

这次生成出来的文件包括:

文件用途
Codex_App_内容生产工作流_工作说明.docx给人看的 Word 说明文档
Codex_App_内容生产工作流_执行手册.pdf可以发给别人阅读的 PDF 手册
Codex_App_内容生产工作流_演示稿.pptx用来汇报或讲课的 PPT
Codex_App_内容生产工作流_生产排期表.xlsx内容生产排期、任务分工和检查表
Codex_App_内容生产工作流_预览.png一张总览图,方便放进教程里展示

下面这张就是四件套的预览图。

看图重点不是“它多漂亮”,而是你要意识到:这些不是聊天框里的一段建议,而是真的生成到了本地文件夹里的文件。

这一张图证明了一个很关键的点:

Codex 适合做“成套交付”,不是只适合做单个文案。

你可以把一个任务拆成:

  • 说明文档;
  • 执行 SOP;
  • 汇报 PPT;
  • 任务表格;
  • 验收清单;
  • 预览截图。

然后让它一次性产出一套可复用资料。

Word 适合干什么

Word 最适合放结构化长文。

比如:

  • 项目说明;
  • 课程讲义;
  • 咨询报告;
  • 员工手册;
  • SOP 文档;
  • 活动方案。

我一般会要求 Codex 在 Word 里写清楚:

  1. 背景和目标;
  2. 使用对象;
  3. 操作流程;
  4. 风险点;
  5. 验收标准;
  6. 下一步建议。

它不一定第一次就写得像最终版,但它能快速帮你把“空白文档”变成“有结构的初稿”。

这一步已经非常值钱了。

因为很多人最痛苦的不是改文档,而是面对空白页。

PDF 适合干什么

PDF 更适合对外发。

比如你做课程、咨询、交付、内部培训,都可以让 Codex 把 Word 内容再整理成 PDF 手册。

这里有个小坑:中文 PDF 最容易出字体问题。

如果你发现 PDF 里中文乱码,不要急着骂工具。

直接让 Codex 检查:

这个 PDF 里的中文显示不正常,请检查字体嵌入、页面尺寸和导出方式,重新生成一个中文可读的 PDF。

成功标志很简单:

  • PDF 能打开;
  • 中文正常显示;
  • 页面没有大面积空白;
  • 标题、段落、表格不重叠;
  • 文件大小合理。

PPT 适合干什么

PPT 就不用多说了,汇报、课程、直播、路演、提案,基本都绕不开。

我这次还单独开了一个 Codex 对话,让它生成一套 5 页、16:9 的演示 PPT。

这张截图就是 Codex App 里生成 PPT 后出现文件卡片的画面。

看这张图时重点看右侧的文件卡片。

这说明它不是只在聊天里“描述了一套 PPT”,而是真的产出了 .pptx 文件。

我比较推荐大家让 Codex 先做两件事:

  1. 先列每一页标题和核心观点;
  2. 再生成 PPT 文件。

不要上来就说“帮我做一套漂亮 PPT”。

这样很容易得到一堆看起来很热闹,但逻辑比较散的页面。

更稳的提示词是:

请先为这套 PPT 设计 6 页结构。
每一页包含:标题、核心观点、适合的视觉元素、讲解备注。
我确认结构后,再生成可编辑 PPTX 文件。

当然,如果你只是做一个演示样例,也可以让它一步到位。

但真正要发给客户、领导、学员的内容,我建议先让它出大纲,再生成文件。

Sheets / XLSX 适合干什么

表格这块是很多人低估 Codex 的地方。

它不只是能写文字,也能帮你规划数据结构。

比如:

  • 内容排期表;
  • 课程交付表;
  • 项目进度表;
  • 商品上架表;
  • 预算表;
  • 客户跟进表;
  • 风险检查表。

我这次生成的 XLSX 里面,不只是随便填几行文字,而是按工作流拆成了多个 sheet。

你可以要求它:

请把这个项目拆成 4 个工作表:
1. 总览;
2. 任务排期;
3. 交付物清单;
4. 验收检查表。
 
每个表头要清晰,字段要适合后续继续维护。

这一步的价值很大。

因为你以后要做自动化,表格就是最关键的“数据底座”。

比如后面讲到拼多多批量上架,真正的核心不是浏览器怎么点,而是你有没有一张干净、稳定、字段明确的商品表。

PPT 的两条路线:图片型 VS HTML 型

在 PPT 这件事上,我建议大家把它拆成两条路线。

第一条叫“图片型 PPT”。

第二条叫“HTML 型 PPT”。

这两个路线适合的场景不一样。

路线一:图片型 PPT

图片型 PPT 的意思是:先让 Codex 生成一张张 16:9 的视觉图片,再把这些图片铺到 PPT 里。

每一页 PPT 本质上就是一张完整图片。

这张是图片型 PPT 的预览。

这种方式的优点很明显:

  • 视觉效果稳定;
  • 不容易出现字体丢失;
  • 不用担心元素位置乱跑;
  • 很适合做封面、金句页、视觉型课程页;
  • 适合发给别人看,不适合让别人深度编辑。

缺点也很明显:

  • 页面里的字不好单独修改;
  • 如果要改一句话,可能要重新生成整张图;
  • 文件体积可能更大;
  • 不适合财报、数据表、复杂可编辑内容。

所以我的建议是:

如果你要的是“好看、稳定、像海报”,就用图片型 PPT。

如果你要的是“可编辑、可改字、可复用”,就用普通 PPT 或 HTML 型 PPT。

路线二:HTML 型 PPT

HTML 型 PPT 是最近非常火的一条路线。

说白了,就是不用传统 PPT 软件,而是用 HTML、CSS、JS 直接写幻灯片。

它的好处是:

  • 可以在浏览器里直接预览;
  • 可以做动画;
  • 可以做交互;
  • 可以用代码控制布局;
  • 可以方便截图、导出、录屏;
  • 很适合和 Codex 这种代码执行型工具配合。

下面这张是我让 Codex 生成的 HTML 幻灯片页面截图。

HTML 型 PPT 更像“网页化的演示稿”。

如果你要做知识分享、产品演示、AI 课程、可交互课件,这个路线非常香。

我这次实测的工作流是:

  1. 先让 Codex 写一份 HTML 幻灯片;
  2. 本地打开预览;
  3. 检查文字是否溢出;
  4. 截图每一页;
  5. 需要的话再合成 PPT 或 PDF。

你也可以直接使用一些现成的开源工具,比如 Slidev、Marp、reveal.js、HTMLSlides、frontend-slides 这一类。

如果你之前听到过“OpenSlide”这个名字,也可以顺手搜一下确认自己说的是哪一个项目。因为同名或近似名的工具挺多,有些并不是做 PPT 的,不要把医学图像库、会议系统和 HTML 幻灯片框架混在一起。

我推荐的 PPT 提示词

如果你要做图片型 PPT,可以这样写:

请帮我做一套图片型 PPT。
 
主题:普通人如何用 Codex App 做内容生产
要求:
1. 先设计 5 页结构;
2. 每页生成一张 16:9 图片;
3. 图片中文字要少,重点突出;
4. 每页都要有标题、核心观点和视觉主体;
5. 最后把图片放进一个 PPTX 文件里;
6. 同时生成一张总览预览图,方便我检查。

如果你要做 HTML 型 PPT,可以这样写:

请用 HTML、CSS、JS 写一套可在浏览器中打开的幻灯片。
 
主题:普通人如何用 Codex App 做内容生产
要求:
1. 16:9 画布;
2. 支持上一页、下一页切换;
3. 每页文字不能溢出;
4. 适配桌面浏览器;
5. 给我本地预览方式;
6. 最后用截图检查每页是否正常显示。

这里最重要的不是“提示词多华丽”,而是你要把验收标准写进去。

比如:

  • 16:9;
  • 页数;
  • 是否可编辑;
  • 是否能浏览器预览;
  • 是否生成文件;
  • 是否截图检查;
  • 是否给出文件路径。

Codex 是很适合被“验收清单”驱动的。

你越会写验收清单,它越像一个靠谱的执行者。


二、手搓酷炫 3D 视频:Codex + HyperFrames / Remotion 做《国产动画十大电影》

前面是打工人刚需。

下面开始玩一点酷的。

我之前让 Codex + HyperFrames / Remotion / three.js 做了一个《国产动画十大电影》的 3D 视频。

这个任务就不是普通办公交付了,而是偏创意制作。

你可以把它理解成:

  • Codex 负责写项目、改代码、跑渲染、排查错误;
  • three.js 负责 3D 画面;
  • Remotion / HyperFrames 负责把网页动画变成视频;
  • 最后输出 MP4 成片。

为什么这个场景值得讲

因为它能让你看到 Codex 的另一面:

它不是只能写“干巴巴的代码”,也可以做“带审美要求的多轮创作”。

普通视频剪辑软件里,你想做一个 3D 星空转场、电影海报环绕、镜头穿梭,往往需要会 AE、C4D、Blender。

但在 Codex 里,你可以把效果描述成文字,然后让它用 three.js 一点点搭出来。

当然,它不是一次就完美。

这类任务一定要迭代。

你要像导演一样反馈:

  • 开场不够震撼;
  • 转场不像星空;
  • 3D 字体不够立体;
  • 镜头运动太平;
  • 下一个电影出现得太早;
  • 最终导出要 1080P、30fps。

Codex 的优势是:它能把这些反馈变成代码修改,并且继续渲染验证。

这次做出来的效果

最终版本是一个 1920×1080、30fps、约 144 秒的视频。

开场做成了“星海神殿开门”的感觉。

中间的电影切换,不是普通横向滑动,而是进入一个“星空 360 度环绕电影空间”。

每一部电影像一块发光的银幕,围成一个轨道,镜头从当前电影退出,进入星空环形空间,再冲进下一部电影。

下面是最终成片的关键帧总览。

这张图主要看三件事:

  1. 画面是不是 16:9 成片比例;
  2. 3D 场景是不是有空间感;
  3. 每个片段是不是已经真实渲染出来。

再看这张转场边界检查图。

这张图不是为了好看,而是为了验收。

做视频最怕什么?

不是代码写不出来,而是你以为渲染成功了,结果转场切点乱了、画面穿帮了、下一部电影提前露出来了。

所以我让 Codex 抽关键帧检查转场边界。

这个习惯很重要。

做 3D 视频时,提示词不要只写“酷炫”

很多人会这样写:

帮我做一个酷炫的 3D 视频。

这句话太抽象。

AI 会懂,但会懂得很飘。

更好的写法是把视频拆成“镜头语言”:

请用 three.js 制作一个 16:9 的 3D 视频工程。
 
主题:《国产动画十大电影》
 
要求:
1. 开场是金色电影神殿,镜头从远处推进,神殿大门打开,门后是星海;
2. 每部电影作为一个独立片段出现;
3. 电影之间用星空环绕转场连接;
4. 转场时 10 块电影银幕围成环形轨道,镜头从当前电影退出,进入轨道,再冲进下一部;
5. 不要让下一部电影在当前片段提前出现;
6. 输出 1920×1080、30fps 的 MP4;
7. 渲染后抽帧检查开场、正文和转场边界。

你看,这就不是“做个酷炫视频”了。

这是一个导演分镜。

Codex 很吃这一套。

因为它可以把每条要求翻译成具体任务:

  • 搭 three.js 场景;
  • 写相机运动;
  • 写星空粒子;
  • 写银幕材质;
  • 写转场时间轴;
  • 写渲染命令;
  • 写抽帧检查脚本。

这个项目的成功标志

做视频类项目,不要只看“有没有生成 MP4”。

我建议按这几个标准验收:

验收点怎么看
能不能播放MP4 可以正常打开,不卡死
画面比例1920×1080 或你指定的比例
帧率30fps 或你指定的帧率
转场不穿帮、不提前露出下一段
声音如果有 BGM,音频能正常合成
抽帧开头、中段、结尾、转场都能截图检查
文件路径最终文件和中间文件要分清楚

我这次最终成片路径是:

/Users/yichen/Documents/Codex/2026-05-07/hyperframes-hyperframes-users-yichen-codex-plugins-2/renders/china-animation-top10-montage-v19-starry-space-final.mp4

这里还有一个小建议。

如果你只是想做短视频封面、片头、转场模板,可以先做 10 秒、20 秒的小片段。

不要一上来就做 3 分钟大片。

先把风格跑通,再拉长时长。

不然每次渲染都要等,改起来也痛苦。


三、早起早睡身体好:一条提示词做网站,并部署到 Vercel

接下来这个项目,听起来有点搞笑,但我觉得很有必要。

现在玩 AI 的人,很多都有一个共同问题:作息乱。

晚上说“再测一个模型”,结果一抬头凌晨两点。

本来只是想改一个提示词,最后顺手又跑了三个工作流、看了五个项目、顺便刷了一圈新工具。

很爽,但身体遭不住。

健康才是革命的本钱。

赚钱重要,效率重要,但身体不能一直当服务器 24 小时跑。

所以我这次让 Codex 做了一个网站,主题是“早睡早起复利实验室”。

目的不是装作自己突然变成养生大师,而是想用一个轻松一点的方式提醒大家:

我们搞 AI,不能只优化工作流,也要优化自己的作息流。

我给 Codex 的需求

这个项目的要求很简单:

请重新帮我生成一个网站,主题是早睡早起。
 
要求:
1. 页面要排版精美;
2. 可以有 3D 动画效果;
3. 分析早睡早起的好处;
4. 给出普通人能执行的步骤;
5. 做成真实可运行的网站;
6. 最后启动本地预览,并告诉我怎么部署到 Vercel。

Codex 最后做出来的不只是一个静态页面。

它做了:

  • 一个 3D 昼夜节律视觉场景;
  • 早睡早起好处说明;
  • 晚间关机流程;
  • 早晨启动流程;
  • 7 天调整计划;
  • 自测打分;
  • 常见误区;
  • 参考资料和免责声明。

下面是网站预览。

这张图比较长,因为整个网页内容都截图进来了。

你能看到它已经不是“一个白底页面加几段字”,而是一个完整的主题网站。

Codex 做网站的过程其实很简单

很多人听到“做网站并部署上线”,脑子里会自动浮现一堆麻烦东西:

  • HTML;
  • CSS;
  • JavaScript;
  • 本地预览;
  • 打包;
  • 服务器;
  • 域名;
  • 部署;
  • 报错;
  • 环境配置。

但在 Codex App 里,流程其实可以非常直观。

你只需要讲清楚:

  1. 我要做什么主题;
  2. 网站给谁看;
  3. 页面要包含哪些内容;
  4. 风格大概是什么;
  5. 是否要动画;
  6. 是否要部署上线;
  7. 最后怎么验收。

Codex 会自己去生成文件。

这次项目里主要生成了:

index.html
styles.css
app.js
README.md
vendor/three.module.js
sleep-lab-preview.png

它还启动了本地预览。

本地预览地址是:

http://127.0.0.1:4173

注意,这个地址只有你自己的电脑能打开。

如果你想让别人也能看,就要部署到线上。

部署到 Vercel

这次我把它部署到了 Vercel。

线上地址是:

https://codex-1-html-css-js-2.vercel.app

我也检查过,线上返回状态是 200,可以正常访问。

这一步的意义不是“我做了一个多么伟大的网站”。

真正重要的是:

从一个想法,到一个可以被别人打开的网址,中间不需要你手写一整套工程。

Codex 可以帮你完成:

  1. 建项目;
  2. 写页面;
  3. 写样式;
  4. 写交互;
  5. 加 3D 效果;
  6. 本地预览;
  7. 截图检查;
  8. 部署上线;
  9. 告诉你哪个网址别人能访问。

这就是普通人做产品原型的巨大机会。

你今天可以做一个早睡早起网站。

明天就可以做:

  • 课程介绍页;
  • 产品落地页;
  • 活动报名页;
  • 咨询服务页;
  • 小工具页面;
  • 数据看板;
  • 客户演示 Demo。

以前你可能想了半天:“我不会开发,算了。”

现在可以先让 Codex 做一个能跑的版本。

再慢慢改。

这里容易踩的坑

第一个坑:本地地址和线上地址不要搞混。

127.0.0.1 是你自己的电脑。

别人打不开。

Vercel 地址才是别人能访问的。

第二个坑:部署完不等于万事大吉。

你还要检查:

  • 页面能不能打开;
  • 手机端是否能看;
  • 3D 画面是否出现;
  • 按钮是否能点;
  • 文字有没有溢出;
  • 页面标题是否正确;
  • 参考资料是否靠谱。

第三个坑:健康类内容不要装医生。

我这次网站里也加入了非医疗建议说明,并参考了 CDC、NHLBI、Mayo Clinic、AASM 等公开健康资料。

如果你要写健康、金融、法律这种高敏感主题,一定要让 Codex 标注来源,并且避免绝对化承诺。

比如不要写“早睡一定治好所有问题”。

这种话既不严谨,也容易翻车。


四、自媒体人必备:用 Codex 制作图文长教程

这一节是我自己最常用的场景。

自媒体人最痛苦的是什么?

不是不会写。

而是“素材整理 + 截图 + 打码 + 配图 + 排版 + 验证链接”太碎了。

一篇图文长教程,看起来只是几千字。

背后其实是一堆小活:

  • 要写大纲;
  • 要跑流程;
  • 要截图;
  • 要裁剪;
  • 要打码;
  • 要生成配图;
  • 要把图放到正确位置;
  • 要检查 Markdown 链接;
  • 要确保读者照着做能跑通。

这时候 Codex App 就很适合。

因为它可以直接在本地文件夹里管理文章和图片。

让 Codex 自己制作图文教程

我这次单独开了一个对话,要求很明确:

请制作一篇图文教程。
 
要求:
1. 不要使用截图占位符;
2. 可以用 Codex 内置生图能力生成真实配图;
3. 也可以使用真实截图;
4. 每张图都要保存成本地文件;
5. Markdown 文章里要正确引用图片;
6. 最后检查所有图片链接是否有效。

下面这张是 Codex App 里生成图文教程结果的截图。

看图重点是右侧的生成结果。

Codex 已经生成了多张真实图片,并且放进了教程结构里。

这就比“这里后面补图”靠谱多了。

最终生成的三张配图

第一张是教程规划图。

第二张是图片工作流图。

第三张是 Markdown 验证图。

这三张图不是随便拿来装饰的。

它们分别承担了三个作用:

图片作用
教程规划图告诉读者从选题到成文的大流程
图片工作流图告诉读者配图不是乱放,而是有生成、保存、引用链路
Markdown 验证图告诉读者最后要检查图片链接是否真的可用

多对话并行:让 Codex 自己操控自己

这次教程里,我不止开了一个 Codex 对话。

而是把任务拆成多个对话并行跑。

比如:

  • 一个对话生成办公四件套;
  • 一个对话做 PPT 双路线;
  • 一个对话做图文教程;
  • 一个对话做 3D 视频;
  • 一个对话做网站;
  • 一个对话整理文章素材。

为什么要这么做?

因为长任务很容易互相干扰。

你在一个对话里既要做 PPT,又要做 PDF,又要做视频,又要改文章,后面上下文会越来越乱。

拆成多个对话以后,每个对话只负责一个结果。

这就像开了几个小团队:

  • A 组负责文档;
  • B 组负责视觉;
  • C 组负责视频;
  • D 组负责网站;
  • E 组负责文章。

最后再把结果汇总回来。

这就是我说的“让 Codex 自己操控自己”。

不是玄学。

就是把一个大任务拆成多个小执行单元。

做图文教程时,我建议固定这套流程

  1. 先写教程主题;
  2. 再列截图清单;
  3. 每个截图说明“读者要看哪里”;
  4. 敏感信息先打码;
  5. 图片统一放到 assets 文件夹;
  6. Markdown 引用相对路径;
  7. 最后让 Codex 检查图片链接。

截图清单可以这样写:

请为这篇教程规划截图清单。
 
每张图请包含:
1. 截图名称;
2. 截图位置;
3. 截图前要完成什么操作;
4. 图里读者要重点看哪里;
5. 是否需要打码;
6. 图片应该放在文章哪个段落后面。

这一步非常重要。

很多教程不好懂,不是因为文字少,而是图片放错了。

图片不是装饰。

图片应该帮读者确认:“我现在是不是也到了同一个状态?”

这里最容易踩的坑

第一个坑:图片是假的。

很多 AI 写教程会写:

\![截图占位](xxx.png)

然后根本没有这张图。

这种文章发出去,读者一打开就是裂图。

所以一定要让 Codex 最后检查:

请检查这篇 Markdown 里所有图片路径是否真实存在。
如果有不存在的图片,请修复路径或重新生成图片。

第二个坑:截图暴露隐私。

Codex App 左侧可能有历史对话、项目名称、路径、账号信息。

截图前要裁掉,或者打码。

第三个坑:图文不对应。

有些教程前面说“点击右上角”,图片里却没有右上角。

这会让小白非常焦虑。

所以每张图前后都要写清楚:

  • 这张图在看什么;
  • 它证明了什么;
  • 如果你和我不一样,应该检查哪里。

五、电商选品上架自动化:Codex + Playwright 实现拼多多商品批量上架

最后讲一个真正能降本的业务场景。

我今天和一个做电商的老板连麦,他现在主要做拼多多,类目是数码配件。

他们遇到的痛点非常典型:

  • 商品非常长尾;
  • 链接数量很多;
  • 一个链接下面有多个 SKU;
  • 表格里有 1000 多行数据;
  • 当前在售链接有 438 个左右;
  • 开新店时,需要重新建几百个商品链接;
  • 每个 SKU 都要填库存、拼单价、规格编码、商品编码、参考价等字段;
  • 日常还要维护价格和编码变化;
  • 人工对着表格往后台填,慢,而且容易错。

这就是非常适合自动化的场景。

因为它不是创意判断。

它本质上是:

把表格里的结构化数据,稳定地填进网页后台。

第一条思路:Computer Use

我最开始给他的思路,是用 Codex 的 Computer Use。

也就是让 Codex 直接看屏幕、操控电脑、打开表格、识别后台字段,然后把内容填进去。

这个方式的优点是直观。

你不用先研究网页结构。

只要把表格路径、后台页面、字段对应关系讲清楚,Codex 就可以像一个会看屏幕的人一样操作。

适合什么场景?

  • 只跑几条;
  • 页面变化不大;
  • 操作比较简单;
  • 你愿意在旁边盯着;
  • 需要先验证可行性。

我当时建议他先拿 1 到 5 个商品测试。

不要一上来就让 AI 跑 400 个链接。

因为屏幕识别很消耗额度,也更容易受到页面状态影响。

提示词可以这样写:

请根据这个本地表格里的数据,填写当前浏览器中打开的拼多多商品发布页面。
 
表格路径:xxx
Sheet 名称:xxx
行范围:第 2 行到第 7 行
 
字段对应关系:
库存 = 表格 H 列
拼单价 = 表格 I 列
日常售价 = 表格 J 列
规格编码 = 表格 K 列
商品编码 = 表格 L 列
 
要求:
1. 先只填写第一个商品;
2. 填完后不要提交发布,先截图给我确认;
3. 如果页面字段和表格字段无法对应,请停下来问我;
4. 不要操作其他浏览器标签页。

这条路能不能用?

能。

但如果你要做几百个商品,它不是最优解。

因为 Computer Use 更像“让 AI 盯着屏幕点击”。

它会慢,会耗额度,也会受到页面布局、弹窗、滚动条、焦点位置影响。

后来实际落地时,这条路失败了。

所以我又给他讲了第二条路:Playwright。

第二条思路:Playwright

Playwright 是什么?

你可以把它理解成“让代码操控浏览器”。

它不是靠眼睛看屏幕,而是直接识别网页里的按钮、输入框、下拉框。

这就更适合批量任务。

Computer Use 像一个人坐在电脑前看屏幕操作。

Playwright 像一个自动化脚本,直接去找网页元素。

做拼多多批量上架,更推荐 Playwright。

因为这个任务有明显的结构:

flowchart LR
    A["商品底表"] --> B["整理字段映射"]
    B --> C["Playwright 打开后台"]
    C --> D["填写商品基础信息"]
    D --> E["填写 SKU 价格和库存"]
    E --> F["上传图片和视频"]
    F --> G["截图暂停人工确认"]
    G --> H["确认后批量运行"]
    H --> I["输出成功/失败日志"]

这里最关键的是:先整理表格。

不要把一张混乱的大表直接丢给自动化。

你要先让 Codex 把它整理成“后台字段顺序一致”的干净表。

比如:

后台字段表格字段说明
商品标题title每个商品唯一
商品类目category可固定或映射
规格名称sku_name比如 0.3 米、1 米
库存stock数字
拼单价group_price数字
日常售价sale_price数字
规格编码sku_codeERP 发货用
商品编码product_code内部管理用
图片路径image_paths本地素材文件夹

表格一旦稳定,后面自动化就简单很多。

Codex 在这里负责什么

这个项目里,Codex 不只是“写一个脚本”。

它可以负责整条链路:

  1. 读取原始 Excel;
  2. 分析哪些列有用;
  3. 重新整理成标准上架表;
  4. 让你确认字段映射;
  5. 写 Playwright 自动化;
  6. 用已登录浏览器打开拼多多后台;
  7. 先跑一个商品;
  8. 截图暂停,让人工确认;
  9. 记录成功、失败和错误截图;
  10. 稳定后批量跑;
  11. 最后把流程沉淀成 Skill。

这就是从“一次性帮我填表”,升级成“公司可复用的自动化流程”。

我会怎么设计这个自动化

如果是我来做,我不会直接让它一口气提交 400 个商品。

我会分成 5 步。

第一步,整理数据。

让 Codex 把原始 Excel 变成一个干净的 products_to_upload.xlsx

每一列都对应后台字段。

第二步,做字段映射。

把拼多多后台每个字段和表格列一一对应。

如果某些字段是固定值,比如品牌、类目、型号,就写进配置文件。

第三步,跑单商品 dry run。

只填一个商品,不提交。

填完截图,人工确认。

第四步,小批量测试。

比如一次跑 5 个或 10 个。

每个商品都记录:

  • 成功;
  • 失败;
  • 失败原因;
  • 错误截图;
  • 已填写到哪个步骤。

第五步,批量运行。

等前面稳定之后,再跑 400 个。

而且最好也不要真的完全无人值守。

电商后台是有外部影响的系统,发错价格、发错库存、发错 SKU,后果都是真钱。

所以我建议前期一定保留人工确认。

Playwright 方案的提示词

可以这样让 Codex 开始:

请帮我设计一个拼多多商品批量上架自动化项目。
 
目标:
把 Excel 表格里的商品和 SKU 信息,填写到已经登录的拼多多商家后台。
 
要求:
1. 先读取 Excel,整理成标准字段表;
2. 生成字段映射配置;
3. 使用 Playwright 控制浏览器;
4. 先只跑第 1 个商品;
5. 填完后不要提交,截图并暂停,等待我确认;
6. 每一行都要输出运行日志;
7. 失败时保存错误截图;
8. 稳定后再支持批量运行;
9. 不要把登录 Cookie、账号密码写进代码或文档。

如果你是做跨境电商,这套思路也能迁移。

比如:

  • 亚马逊;
  • Coupang;
  • Mercado Libre;
  • 独立站后台;
  • ERP 系统;
  • 供应链系统。

底层逻辑都差不多:

标准化表格 + 字段映射 + 浏览器自动化 + 截图验收 + 日志追踪。

这个场景真正值钱的地方

很多人以为自动化最难的是“点按钮”。

其实不是。

最难的是把业务流程变成稳定的数据结构。

你只要做到:

  • 表格字段清楚;
  • 页面字段清楚;
  • 每一步可截图;
  • 每一行可追踪;
  • 出错能回滚;
  • 最后能沉淀成 Skill;

那 Codex 就不只是一个聊天工具。

它会变成你的业务执行系统。

这也是我觉得 Codex 真正能帮普通人赚钱的地方。

不是因为它会写代码。

而是它能把你原来靠人肉重复做的事情,拆成流程,写成脚本,跑出结果,再不断优化。


跑完这五个场景后,我对 Codex 的理解

如果只把 Codex 当“更会写代码的 ChatGPT”,就太浪费了。

这次五个场景跑下来,我更愿意把它理解成五种能力的集合:

能力对应场景
文件生产能力Word、PDF、PPT、Sheets
视觉表达能力图片型 PPT、HTML 型 PPT
创意渲染能力3D 视频、动画、关键帧
产品上线能力网站、本地预览、Vercel 部署
业务自动化能力表格到后台、Playwright、批量操作

这几个能力组合起来,就很可怕。

你可以用它做内容。

可以用它做课程。

可以用它做网站。

可以用它做视频。

可以用它做自动化。

也可以用它给自己的业务做一套内部工具。

我建议的小白学习路线

如果你是刚开始用 Codex App,不要一上来就挑战最复杂的电商自动化。

建议按这个顺序:

  1. 先让它生成一篇 Markdown 文档;
  2. 再让它生成 Word、PDF、PPT、XLSX;
  3. 再让它做一个 HTML 小网页;
  4. 再让它启动本地预览;
  5. 再让它部署到 Vercel;
  6. 再让它做图文教程;
  7. 再尝试 HTML PPT;
  8. 再尝试视频动画;
  9. 最后再碰业务自动化。

这个顺序会比较舒服。

因为你会一点点建立信任。

先看到它能生成文件。

再看到它能预览网页。

再看到它能上线。

再看到它能操作浏览器。

最后你才会真的理解:

哦,原来 Codex App 不是一个聊天框。

它更像一个可以执行任务的小型工作台。


可以直接复制的总提示词

如果你想自己复刻这篇文章里的思路,可以先用下面这个总提示词:

我想用 Codex App 做一个完整实战项目。
 
请你不要只给我建议,而是直接在当前项目文件夹里生成真实可交付的文件。
 
项目主题:填写你的主题
 
我希望你完成:
1. 生成一份 Markdown 说明文档;
2. 生成 Word、PDF、PPT、XLSX 四类交付物;
3. 如果适合,请生成一个 HTML 预览页面;
4. 如果适合,请生成图片或截图;
5. 每个文件都要放在清晰的目录里;
6. 生成 README,说明每个文件是干什么的;
7. 最后检查所有文件是否真实存在;
8. 给我一份验收清单;
9. 不要使用“待补充”“截图占位符”这种假内容。

如果你要做网站,可以改成:

请帮我做一个真实可运行的网站。
 
主题:填写你的主题
目标用户:填写目标用户
页面风格:填写风格
 
要求:
1. 使用 HTML、CSS、JS;
2. 页面排版要完整;
3. 移动端和桌面端都能看;
4. 如果适合,可以加入 three.js 3D 效果;
5. 启动本地预览;
6. 截图检查页面;
7. 如果环境允许,部署到 Vercel;
8. 告诉我本地地址和线上地址分别是什么。

如果你要做电商自动化,可以改成:

请帮我设计一个浏览器自动化项目。
 
目标:
把表格中的数据填写到网页后台。
 
要求:
1. 先读取表格;
2. 整理字段映射;
3. 先跑一条测试数据;
4. 填完后截图并暂停确认;
5. 不要直接提交或发布;
6. 记录每一行的运行日志;
7. 失败时保存错误截图;
8. 稳定后再支持批量运行;
9. 不要保存账号密码、Cookie 等敏感信息。

写在最后

我越来越觉得,未来普通人用 AI 的分水岭,不是“会不会问问题”。

而是你能不能把自己的需求,变成一个可执行、可验收、可复用的流程。

Codex App 最厉害的地方,就在这里。

它可以陪你从一个想法开始,一路做到:

  • 文件生成;
  • 页面预览;
  • 图片制作;
  • 视频渲染;
  • 网站部署;
  • 浏览器自动化;
  • 业务流程沉淀。

赚钱当然重要。

但偶尔也要拿它做点好玩的东西。

比如做一个 3D 国产动画视频。

比如做一个提醒自己早睡早起的网站。

毕竟工具再强,人也得活得有点意思。

边学边玩,再边把钱赚了。

这就是我现在用 Codex App 最真实的感受。


参考资料和延伸链接

HTML / PPT 方向:

睡眠健康资料:

部署相关: