# Workflow Evaluation Criteria Workflow 调优评估标准,由 Phase 03 (Analyze Step) 和 Phase 04 (Synthesize) 引用。 ## Per-Step Dimensions | Dimension | Description | |-----------|-------------| | Execution Success | 命令是否成功执行,退出码是否正确 | | Output Completeness | 产物是否齐全,预期文件是否生成 | | Artifact Quality | 产物内容质量 — 非空、格式正确、内容有意义 | | Handoff Readiness | 产物是否满足下一步的输入要求,格式兼容性 | ## Per-Step Scoring Guide | Range | Level | Description | |-------|-------|-------------| | 90-100 | Excellent | 执行完美,产物高质量,下游可直接消费 | | 80-89 | Good | 执行成功,产物基本完整,微调即可衔接 | | 70-79 | Adequate | 执行成功但产物有缺失或质量一般 | | 60-69 | Needs Work | 部分失败或产物质量差,衔接困难 | | 0-59 | Poor | 执行失败或产物无法使用 | ## Workflow-Level Dimensions | Dimension | Description | |-----------|-------------| | Coherence | 步骤间的逻辑顺序是否合理,是否形成完整流程 | | Handoff Quality | 步骤间的数据传递是否顺畅,格式是否匹配 | | Redundancy | 是否存在步骤间的工作重叠或重复 | | Efficiency | 整体流程是否高效,有无不必要的步骤 | | Completeness | 是否覆盖所有必要环节,有无遗漏 | ## Analysis Depth Profiles ### Quick - 每步 3-5 要点 - 关注: 执行成功、产出完整、明显问题 - 跨步骤: 基本衔接检查 ### Standard - 每步详细评估 - 关注: 执行质量、产出完整性、产物质量、衔接就绪度、潜在问题 - 跨步骤: 衔接质量、冗余检测、瓶颈识别 ### Deep - 每步深度审查 - 关注: 执行质量、产出正确性、结构质量、衔接完整性、错误处理、性能信号、架构影响、边界情况 - 跨步骤: 全面流程优化、重排建议、缺失步骤检测、架构改进 ## Issue Severity Guide | Severity | Description | Example | |----------|-------------|---------| | High | 阻断流程或导致错误结果 | 步骤执行失败、产物格式不兼容、关键数据丢失 | | Medium | 影响质量但不阻断 | 产物不完整、衔接需手动调整、冗余步骤 | | Low | 可改进但不影响功能 | 输出格式不一致、可优化的步骤顺序 |