返回详情Codex App:从任务到可验证变更
导出演示 PDF

00 / Cover

Codex App:从任务到可验证变更

一个产品演示脚本:把目标、上下文、执行和验证放进同一条开发流。

演示重点不是写得快,而是交付可信。

01 / Brief

先把任务边界放到屏幕上

演示一开始不讲模型能力,而是让听众看到人真正给了什么任务。

task.zhaphar.localbrief
localhost:3000/tasks/codex-demo

修复 slides print 的分页错位

目标:PDF 与浏览器预览保持一致。

限制:不引入图表库,不扩大阅读栏。

  • 验收:每页 16:9
  • 检查:Playwright 截图
  • 输出:剩余风险说明
Browser artifact: user-facing task brief.

02 / Time

真正耗时的是上下文和验证

这页把“Agent 只是写代码”的直觉拆开:读、改、验不是同一件事。

任务输入6
上下文读取22
变更执行11
验证反馈18

03 / Decision

先分流,再交给 Agent

不是每个任务都适合直接自动化。风险和可验证性决定介入方式。

High / Checkable

高风险 · 高可验证

有测试兜底,放手改,验证收尾。

High / Fuzzy

高风险 · 低可验证

先补可观测性,别急着动。

Low / Checkable

低风险 · 高可验证

自动化首选,批量交给 Agent。

Low / Fuzzy

低风险 · 低可验证

文档与重命名,人快速过目即可。

04 / Context

上下文要能被指到文件

这页让听众看到 Agent 不是凭空理解项目,而是在一组可追踪的边界里工作。

workspacecontext
  1. app/sessions.css
  2. components/session-slide-visual.tsx
  3. tests/content/sessions.test.ts
  4. content/sessions/codex-app-demo
stage: 1280px × 720pxfooter and folio stay fixedartifact layouts own one evidence areaprint parity is part of the contract
Editor artifact: files and local rules stay visible.

05 / Maturity

从只读到可回放

这一页把产品能力讲成演进曲线,而不是一次模型表演。

  1. 2026-02

    只读上下文

    先看懂再说。

  2. 2026-04

    可回放证据链

    终端和浏览器进入同一条流。

  3. 2026-06

    验证式交付

    当前:以测试和风险说明收尾。

06 / Proof

用命令结果收尾

终端页只放最后一锤:跑了什么、过了什么、还有什么没覆盖。

pnpmexit 0
$ pnpm test184 pass$ pnpm typecheckNo TypeScript errors$ pnpm build✓ Compiled successfully
Terminal artifact: command, result, and scope.

07 / Closing

把结果交还给人

不是“我改好了”,而是把变更、验证和风险放回人的判断里。

  • 改了什么:变更边界清楚
  • 测了什么:证据可以复查
  • 还剩什么:风险没有被藏起来

可信交付,比快速生成更重要。