Claude Code 验证清单：怎么证明 AI 真的改对了

Claude Code 说“改好了”不等于真的改好了。AI 编程最容易出问题的地方，不是生成代码，而是验证证据不足：命令没跑、页面没看、diff 没审、旧路径没测，最后把“应该可以”当成“已经通过”。

这篇文章给一份 Claude Code 验证清单，适合每次让 AI 修改项目后使用。

为什么完成不等于验证完成

Claude Code 很擅长读文件、改文件、跑命令和根据错误继续修。但它也可能：

只验证了内部函数，没有验证真实入口；
跑了不相关测试；
忽略构建产物；
漏掉移动端或边界路径；
把“没有报错”当成“功能正确”；
在总结里夸大验证结果。

所以你需要明确告诉它：什么证据才算通过。

验证证据分四类

证据类型	说明	例子
命令证据	真实命令运行结果	`npm test`、`yarn build`、CLI 输出
产物证据	构建后文件或 HTML	`dist/index.html`、meta/canonical
行为证据	用户入口可用	页面点击、API 请求、表单提交
Diff 证据	改动范围可解释	只改目标文件，没有无关重构

一个任务至少需要两类证据。SEO、部署、页面和 CLI 类任务尤其不能只看源码。

通用验证流程

推荐流程：

1	明确目标 → 找真实入口 → 运行验证 → 读取输出 → 对照 diff → 总结证据

可以直接这样要求 Claude Code：

不要只说完成。
请给出：
1. 真实验证入口是什么；
2. 运行了什么命令；
3. 命令输出的关键结果；
4. 构建产物或页面里看到了什么；
5. 哪些范围没有验证。

不同任务的验证清单

任务类型	必须验证
前端页面	构建成功、页面可访问、关键交互可用
后端接口	请求示例、响应体、错误路径、状态码
CLI 工具	真实命令、参数、退出码、错误输出
内容站文章	frontmatter、URL、构建 HTML、内链
SEO 修改	title、description、canonical、sitemap
图片资源	文件存在、页面引用、尺寸不溢出
Git 工作流	diff 范围、测试结果、commit 边界

如果任务是“修 404”，验证就不能只看源码；必须检查构建产物或线上页面是否还链接旧 URL。

前端任务验证

前端任务至少看三件事：

构建是否通过；
目标页面是否能打开；
用户能否完成目标动作。

示例：

验证：
- yarn build 通过；
- /pricing 页面生成；
- CTA 链接指向 /contact；
- 移动端导航不溢出。

如果 Claude Code 只说“组件已修改”，那还不够。

后端和 API 验证

API 任务不能只看单元测试。

至少验证：

成功请求；
缺参数；
权限不足；
错误状态码；
日志是否安全；
返回字段是否兼容旧调用方。

示例：

1
2
3

curl -X POST http://localhost:3000/api/login \
  -H "Content-Type: application/json" \
  -d '{"email":"test@example.com","password":"wrong"}'

内容站和 SEO 验证

内容站最容易出现“源码正确，线上错误”。

检查表：

frontmatter date 是否决定 URL；
description 是否存在且自然；
canonical 是否指向最终 URL；
内链是否指向真实页面；
sitemap 是否包含新 URL；
构建产物是否生成；
线上是否已经部署新版。

站内链接尤其要看最终 HTML，而不是只看 Markdown。

常见伪验证

说法	为什么不够
“我看代码没问题”	没有执行真实入口
“测试通过”	测试可能不覆盖这次改动
“应该可以”	没有证据
“没有报错”	不代表行为正确
“文件存在”	不代表 URL 可访问
“本地好了”	不代表线上已部署

遇到这些总结，要继续追问证据。

可复制提示词

请验证刚才的改动，不要继续改代码。
按下面格式输出：

1. 改动目标：
2. 真实入口：
3. 运行命令：
4. 关键输出：
5. 构建产物或页面证据：
6. diff 是否只包含目标范围：
7. 未验证的风险：

如果没有实际运行命令或检查页面，请明确说未验证。

和代码审查怎么配合

验证证明“它跑过”，review 判断“它该不该这样跑”。两者都需要。

建议顺序：

Claude Code 自己跑验证；
你看验证证据；
用 AI 预审 diff；
人工看业务边界；
决定是否合并。

可以继续看 AI 代码审查流程和 Claude Code Git 工作流。

FAQ

Claude Code 跑了测试，还需要人工看吗？

需要。测试能证明部分行为，但不能替代业务判断、用户体验和影响范围审查。

每次都要完整构建吗？

不一定。小改动可以跑局部测试；但页面、SEO、静态站、部署相关修改，建议构建并检查产物。

如果没有测试怎么办？

至少要做手动验证：打开页面、运行命令、请求 API、检查生成文件，并记录结果。

总结

Claude Code 的价值不是“它说完成了”，而是它能帮助你形成证据链。每次 AI 改完代码，都要追问：真实入口是什么？命令跑了吗？产物看了吗？diff 可解释吗？只有证据完整，AI 编程才算进入可交付状态。

文章作者: AJie

文章链接: https://www.promptnet.cn/2026/06/23/claude-code-verification-checklist/

AI 编程代码审查 Claude Code 测试

相关推荐

2026-06-22

AI 代码审查流程：小团队如何审 AI 写的代码

AI 代码审查流程指南，面向 1-5 人小团队，讲清 AI 生成代码如何经过生成者自查、AI 预审、人工复核和 PR 验证，避免混乱 diff、缺失测试、安全边界和业务意图偏差，让 Claude Code、Cursor、Copilot 的输出更容易合并和维护。

2026-06-02

Claude Code 常见错误与排错清单：从上下文、权限到验证失败怎么处理

Claude Code 常见错误与排错清单，覆盖上下文不足、任务边界过大、权限被拒绝、测试失败、构建失败、幻觉文件、误改 unrelated 文件和验证证据不足等真实开发问题，帮助开发者把 AI 编程从反复试错变成可定位、可回滚、可交付的流程，并提供适用场景、操作步骤、核验方法和常见问题，帮助读者按真实项目逐项排查。

2026-06-01

Claude Code Git 工作流：分支、提交与代码审查怎么配合

Claude Code Git 工作流实战指南，围绕分支管理、任务边界、提交前检查、代码审查、冲突处理和验证记录，讲清如何把 Claude Code 放进日常开发协作流程，让 AI 编程结果更容易 review、回滚和交付，并提供适用场景、操作步骤、核验方法和常见问题，帮助读者按真实项目逐项排查，适合需要快速理解问题边界、执行流程和验证结果的开发者参考。

2026-06-22

小团队 AI 编程工作流：从需求到合并的检查清单

小团队 AI 编程工作流指南，讲清如何把 Claude Code、Cursor、Copilot 等工具放进需求拆解、上下文定位、受控修改、测试验证、代码审查和合并流程，避免 AI 生成代码带来混乱 diff、错误假设和不可复现问题，并提供可直接用于 PR 的检查清单。

2026-06-10

Claude Code Skills 怎么选：从 GitHub 项目到可复用工作流

Claude Code Skills 选择指南，按任务流程、触发条件、边界约束、验证方式和项目适配性评估 GitHub 上的 Skills / Agent Skills 项目。本文不使用过期 stars 数字做排名，而是给出可复用工作流筛选方法，并提供适用场景、操作步骤、核验方法和常见问题，帮助读者按真实项目逐项排查。

2026-05-22

2026 年 AI 编程工具怎么选：Cursor、GitHub Copilot、Claude Code 对比

2026 年 AI 编程工具选择指南，按补全、项目理解、多文件修改、终端执行、PR/CI 工作流和成本边界对比 Cursor、GitHub Copilot、Claude Code。本文不做无来源价格和能力排名，而是给出开发者可验证的选型流程，并提供适用场景、操作步骤、核验方法和常见问题，帮助读者按真实项目逐项排查。