演示
  1. 00 / Cover

    Codex App:从任务到可验证变更

    一个产品演示脚本:把目标、上下文、执行和验证放进同一条开发流。

    演示重点不是写得快,而是交付可信。

  2. 01 / Brief

    先把任务边界放到屏幕上

    演示一开始不讲模型能力,而是让听众看到人真正给了什么任务。

    task.zhaphar.localbrief
    localhost:3000/tasks/codex-demo

    修复 slides print 的分页错位

    目标:PDF 与浏览器预览保持一致。

    限制:不引入图表库,不扩大阅读栏。

    • 验收:每页 16:9
    • 检查:Playwright 截图
    • 输出:剩余风险说明
    Browser artifact: user-facing task brief.
  3. 02 / Time

    真正耗时的是上下文和验证

    这页把“Agent 只是写代码”的直觉拆开:读、改、验不是同一件事。

    任务输入6
    上下文读取22
    变更执行11
    验证反馈18
  4. 03 / Decision

    先分流,再交给 Agent

    不是每个任务都适合直接自动化。风险和可验证性决定介入方式。

    High / Checkable

    高风险 · 高可验证

    有测试兜底,放手改,验证收尾。

    High / Fuzzy

    高风险 · 低可验证

    先补可观测性,别急着动。

    Low / Checkable

    低风险 · 高可验证

    自动化首选,批量交给 Agent。

    Low / Fuzzy

    低风险 · 低可验证

    文档与重命名,人快速过目即可。

  5. 04 / Context

    上下文要能被指到文件

    这页让听众看到 Agent 不是凭空理解项目,而是在一组可追踪的边界里工作。

    workspacecontext
    1. app/sessions.css
    2. components/session-slide-visual.tsx
    3. tests/content/sessions.test.ts
    4. content/sessions/codex-app-demo
    stage: 1280px × 720pxfooter and folio stay fixedartifact layouts own one evidence areaprint parity is part of the contract
    Editor artifact: files and local rules stay visible.
  6. 05 / Maturity

    从只读到可回放

    这一页把产品能力讲成演进曲线,而不是一次模型表演。

    1. 2026-02

      只读上下文

      先看懂再说。

    2. 2026-04

      可回放证据链

      终端和浏览器进入同一条流。

    3. 2026-06

      验证式交付

      当前:以测试和风险说明收尾。

  7. 06 / Proof

    用命令结果收尾

    终端页只放最后一锤:跑了什么、过了什么、还有什么没覆盖。

    pnpmexit 0
    $ pnpm test184 pass$ pnpm typecheckNo TypeScript errors$ pnpm build✓ Compiled successfully
    Terminal artifact: command, result, and scope.
  8. 07 / Closing

    把结果交还给人

    不是“我改好了”,而是把变更、验证和风险放回人的判断里。

    • 改了什么:变更边界清楚
    • 测了什么:证据可以复查
    • 还剩什么:风险没有被藏起来

    可信交付,比快速生成更重要。