00 / Cover
ZHAPHAR01 / 08ZHAPHAR.COM00 / Cover
Codex App:从任务到可验证变更
一个产品演示脚本:把目标、上下文、执行和验证放进同一条开发流。
演示重点不是写得快,而是交付可信。
ZHAPHAR01 / 08ZHAPHAR.COM01 / Brief
ZHAPHAR02 / 08ZHAPHAR.COM01 / Brief
先把任务边界放到屏幕上
演示一开始不讲模型能力,而是让听众看到人真正给了什么任务。
task.zhaphar.localbrieflocalhost:3000/tasks/codex-demo修复 slides print 的分页错位
目标:PDF 与浏览器预览保持一致。
限制:不引入图表库,不扩大阅读栏。
- 验收:每页 16:9
- 检查:Playwright 截图
- 输出:剩余风险说明
Browser artifact: user-facing task brief. ZHAPHAR02 / 08ZHAPHAR.COM02 / Time
ZHAPHAR03 / 08ZHAPHAR.COM02 / Time
真正耗时的是上下文和验证
这页把“Agent 只是写代码”的直觉拆开:读、改、验不是同一件事。
6 上下文读取22 变更执行11 验证反馈18 ZHAPHAR03 / 08ZHAPHAR.COM03 / Decision
ZHAPHAR04 / 08ZHAPHAR.COM03 / Decision
先分流,再交给 Agent
不是每个任务都适合直接自动化。风险和可验证性决定介入方式。
High / Checkable 高风险 · 高可验证
有测试兜底,放手改,验证收尾。
High / Fuzzy 高风险 · 低可验证
先补可观测性,别急着动。
Low / Checkable 低风险 · 高可验证
自动化首选,批量交给 Agent。
Low / Fuzzy 低风险 · 低可验证
文档与重命名,人快速过目即可。
ZHAPHAR04 / 08ZHAPHAR.COM04 / Context
ZHAPHAR05 / 08ZHAPHAR.COM04 / Context
上下文要能被指到文件
这页让听众看到 Agent 不是凭空理解项目,而是在一组可追踪的边界里工作。
workspacecontext- app/sessions.css
- components/session-slide-visual.tsx
- tests/content/sessions.test.ts
- content/sessions/codex-app-demo
stage: 1280px × 720pxfooter and folio stay fixedartifact layouts own one evidence areaprint parity is part of the contract
Editor artifact: files and local rules stay visible. ZHAPHAR05 / 08ZHAPHAR.COM05 / Maturity
ZHAPHAR06 / 08ZHAPHAR.COM05 / Maturity
从只读到可回放
这一页把产品能力讲成演进曲线,而不是一次模型表演。
- 2026-02
只读上下文
先看懂再说。
- 2026-04
可回放证据链
终端和浏览器进入同一条流。
- 2026-06
验证式交付
当前:以测试和风险说明收尾。
ZHAPHAR06 / 08ZHAPHAR.COM- 2026-02
06 / Proof
ZHAPHAR07 / 08ZHAPHAR.COM06 / Proof
用命令结果收尾
终端页只放最后一锤:跑了什么、过了什么、还有什么没覆盖。
pnpmexit 0$ pnpm test184 pass$ pnpm typecheckNo TypeScript errors$ pnpm build✓ Compiled successfully
Terminal artifact: command, result, and scope. ZHAPHAR07 / 08ZHAPHAR.COM07 / Closing
ZHAPHAR08 / 08ZHAPHAR.COM07 / Closing
把结果交还给人
不是“我改好了”,而是把变更、验证和风险放回人的判断里。
- 改了什么:变更边界清楚
- 测了什么:证据可以复查
- 还剩什么:风险没有被藏起来
可信交付,比快速生成更重要。
ZHAPHAR08 / 08ZHAPHAR.COM