应用卷术语表
教材第二卷的术语汇总列表。定义在此重复,以避免各章节出现歧义。如果术语已在第一卷中引入,此处提供生产环境补充说明,并指向其在第二卷中实际运作的章节。
不要在开始第二卷之前通读整个术语表。对于第一遍阅读,只需理解 capstone/ 和第一遍的十个强制交付物(完整列表见 README「第一遍强制交付物」章节)。其他术语在需要填写具体文件或理解可运行示例时再查阅。
阅读规则很简单:文件名或 YAML/JSON 键可以保持英文,但在解释中选择一个中文含义。例如,judgment.md 是纠纷裁决文件;tribunal 是文件仲裁,而不是独立产品或 Qwen Code 的内置命令。
散文中推荐默认使用的主要形式(英文键仅在代码块和首次提及时用括号标注):
- 「静默 P0」——用于散文;
silent_p0、silent_p0_cap、silent_p0_ratio——用于所有代码、YAML/JSON 键、命令和指标标签中; - 「规范门控」或「规格门控(Spec CI)」——用于散文;
spec_gate——仅作为.github/workflows/spec-ci.yml中的任务名称; - 「文件仲裁」——用于散文;
tribunal——仅作为examples/tribunal/目录名称及其脚本的名称; - 「紧急模式」——用于散文;「红色按钮」——作为简短标签;
red_button、red_button_mttr_blindness——仅作为 YAML 中的不变量名称。
关键术语翻译表
在第二卷散文中,我们默认使用术语的中文等效词,并在章节首次提及时在括号中给出英文键,例如:「证据标记(evidence_ref)」。本表是工作参考:哪些术语需要翻译,哪些保留英文作为技术名称,哪些作为俄英混合术语使用。「技术名称」类表示 YAML/JSON 标识符、CLI/脚本名称、状态或配置键——不改动。「双重写法术语」类表示外来词用作流程的复合标记;散文中引入中文等效词,但允许两种写法。「散文术语」类表示外来词完全俄化,正文中仅保留中文形式。
| 英文形式 | 中文等效词 | 类别 |
|---|---|---|
evidence_ref | 证据标记,证据引用 | 散文术语 |
evidence, evidence chain | 证据,证据链 | 散文术语 |
counterexample | 反例 | 散文术语 |
silent_p0 | 静默 P0(事件) | 技术名称 |
red button | 紧急模式;「红色按钮」作为简短标签 | 双重写法术语 |
provenance | 来源,出处,起源来源 | 散文术语 |
drift, edge_drift, spec_drift, code_drift | 漂移(行为、规格、代码);指标键不改动 | 双重写法术语 |
escalation | 升级(借词已在中文中固定) | 散文术语 |
| judgment, judgment.md | 纠纷裁决;文件名不改动 | 双重写法术语 | | precedent, precedents.md | 判例;文件名不改动 | 双重写法术语 | | audit_trace_coverage | 审计追踪覆盖率(指标,键名保留) | 技术名称 | | shadow specs, shadow spec | 影子规格;标题中允许两种写法 | 双重写法术语 | | stress spec, stress-spec | 压力规格 | 散文术语 | | guard metric, guard-метрика | 配对反制指标,guard-指标 | 双重写法术语 | | kill switch | 急停开关,kill switch | 双重写法术语 | | playbook | 剧本 | 散文术语(借词) | | runbook | 运行手册 | 散文术语(借词) | | readiness gate, readiness | 就绪门控,就绪度;模型项目名称保留 | 双重写法术语 | | rollback, rollback_condition | 回滚;键 rollback_condition 保留 | 双重写法术语 | | dry run, dry-run | 试运行 | 散文术语 | | webhook | 网络钩子 | 散文术语(借词) | | auction | 拍卖 | 散文术语(借词) |
| tribunal | 争议变更文件仲裁;示例目录和脚本的技术名称 | 技术名称 | | Verifier, Implementor, Safety, Coordinator | 验证者、实现者、Safety(投票)、协调者(non-voting protocolist)——用于散文;YAML 和代码中的角色名称保留英文 | 双重写法术语 | | immunity score | 免疫指标(向量) | 散文术语 | | tier (low/mid/high, local-coder, frontier-reviewer) | 层级(低/中/高)用于散文;YAML 中的键和角色名称不翻译 | 双重写法术语 | | mutation, mutation testing | 变异,变异测试 | 散文术语(借词) | | coverage, coverage-check | 覆盖率,覆盖率检查 | 散文术语 | | scope, scope-check, out-of-scope | 范围,范围检查,超出范围 | 散文术语 | | failover | 故障转移,failover | 双重写法术语 | | blast radius | 影响半径,blast radius | 双重写法术语 | | gate, spec gate | 门控,规格门控(gate) | 双重写法术语 |
| manual_review_floor, manual_review_rate | 人工审核下限,人工审核比例;键保留 | 技术名称 | | genealogy, genealogy.md | 谱系;文件名不改动 | 双重写法术语 | | ttl, time to live | 生存时间(ttl);键保留 | 技术名称 | | few-shot | 少样本示例,few-shot | 双重写法术语 | | scorebook | 评分日志(scorebook);文件名不改动 | 双重写法术语 | | pre-approved actions | 预批准操作 | 散文术语 | | quarantine | 隔离 | 散文术语 | | ask_storm, stage_regress, phase_context_loss | 反模式名称原样保留;章节首次提及时给出简短中文注释 | 技术名称 | | capstone, dossier | 结业考核包,证据包 | 双重写法术语 |
不翻译的技术名称,散文和表格中均保留原样:YAML/JSON 键(immutable_principles、mutable_rules、governance_protocol、incident_type、pipeline_phase、permitted_actions、max_scope、rollback_condition、decision_hash、parent_version、change_log、audit_trace、prompt_hash、decision_source、next_guard 等)、文件名(QWEN.md、requirements.md、plan.md、validation.md、mission.md、tech-stack.md、roadmap.md、constitution.md、judgment.md、precedents.md、genealogy.md)、CLI 命令和脚本名称(qwen -p、python3 scripts/...、git、npm、rg)、自定义命令(/sdd:specify、/plan、/review)、状态(标准 / 推荐 / 前沿)、块标记([runnable]、[project script])、缩写(MCP、CI、LLM、API、KPI、MTTR、SLO、SLA、SRE)。
术语首次引入位置
此映射表帮助快速定位术语首次获得工作定义和应用场景的章节。指标(silent_p0、audit_trace_coverage、manual_review_floor)和记忆键(shadow-scorebook.json、shadow-candidates.yaml、precedents.md、judgment.md)分开列出:指标衡量系统,记忆键存储其历史。
| 分组 | 术语 | 引入章节 |
|---|---|---|
| 角色 | 验证者、实现者(投票) | 4 |
| 角色 | Safety(投票)、协调者(non-voting)、governance_protocol | 3, 8 |
| 交付物 | genealogy.md | 1 |
| 交付物 | 投毒/修复对 | 2 |
| 交付物 | constitution.md、immutable/mutable、ttl、rollback_condition | 3 |
| 交付物 | 反例、repair.patch、schema_delta | 4 |
| 交付物 | judgment.md、precedents.md、decision_hash | 8 |
| 交付物 | readiness.md、25 分模型 | 11 |
| 指标 | strict_reject_rate、depth_of_diagnostics、recovery_time_p95_ms | 5 | | 指标 | mttr_gain、early_signal、coverage、false_escalation | 6 | | 指标 | token_health_min、failover_to_frontier、degraded_queue | 9 | | 指标 | silent_p0、manual_review_floor、audit_trace_coverage | 10 | | 记忆键 | .specify/memory/shadow-candidates.yaml、.specify/memory/shadow-scorebook.json | 6 | | 记忆键 | precedents.md、change_log | 3, 8 | | 机制 | 压力规格,变异测试 | 5 | | 机制 | 影子规格,拍卖,scorebook | 6 | | 机制 | 规格门控(Spec CI) | 7 | | 机制 | 层级路由,local-coder、frontier-reviewer,预算管理员 | 9 | | 机制 | 配对反制指标,anti-Goodhart,紧急模式 | 10 |
| 机制 | 试运行,就绪门控,evidence_ref | 11 |
如果术语在多个章节中出现,列出的章节是其获得工作定义和可运行场景的章节。生产环境补充说明和术语间的关联在第 12 章和第 13 章中详细分析。
与第一卷术语表的关联
本术语表补充而非替代第一卷术语表。SDD 基础术语——QWEN.md、mission.md、tech-stack.md、roadmap.md、requirements.md、plan.md、validation.md、Qwen Code 技能、MCP、ACP、EARS、Given/When/Then——均定义于该处,此处不再重复。
生产环境补充说明叠加于这些基础术语之上:
- 第一卷的
validation.md包含合并准入的事实;第二卷中,它补充了对决的失败案例、anti-Goodhart 检查、漂移字段和追踪记录。 - 第一卷的
QWEN.md存储代理的持久上下文;第二卷中,它成为放置影子规格拍卖的少样本示例及复审期限的位置。
- 第一卷的宪法固定
mission.md+tech-stack.md+roadmap.md;第二卷中,它扩展为明确的constitution.md章节,包含immutable_principles、mutable_rules和governance_protocol。
如果本术语表中的术语显得陌生,请先从第一卷的基础定义开始,然后阅读此处的生产环境补充说明。
教学项目 AgentClinic
应用卷的生产场景在思维上部署于第一卷的教学项目 AgentClinic:TypeScript、Hono、服务端 JSX、SQLite、Vitest。Python 属于第二卷的可运行示例:这些是用于本地检查的小型标准库脚本,而非主应用的技术栈。领域实体——患者代理、疾病、治疗、预约、评价、反馈——描述于第一卷附录 B。教学代码与生产事件之间的对应关系记录于应用卷附录 A 的表格中。
形象化名称
章节中有时使用形象化名称。它们作为辅助标签,而非流程的主要名称。工程等效名称如下:
- 规格恢复——从遗留代码、日志、事件和决策历史中恢复需求;「规格死灵术」仅允许作为辅助标签。
- 投毒规格——故意损坏的教学规格,带有一个受控缺陷。
- 验证器疫苗接种——针对规格和检查的变异测试(mutation testing)。
- 影子规格拍卖(shadow specs)——在将非正式启发式规则纳入工作上下文之前的评估和排序。
- 争议变更文件仲裁——见下文「文件仲裁」章节;
tribunal在文件和目录名称中保留为示例的技术标签。 - 模型层级路由——在不同成本和质量模型之间分配任务。
- 诱饵指标——容易以牺牲系统为代价进行优化的 KPI;工程防护是配对反制指标(guard metrics)。
- 紧急模式(red button)——危险操作(部署、回滚、迁移或自动修复)前的正式安全门控;「红色按钮」是口语标签。
代理角色
验证者(Verifier)——代理或会话,其唯一任务是查找不变量、合同和事实的违反。无权编写代码或修改交付物,仅作出 approve / reject / abstain 裁决并附理由。详见第 4 章和第 8 章。
实现者(Implementor)——在规格批准后以自动编辑模式执行计划的代理。在文件仲裁中,对剧本补丁的适用性投票,但无权绕过验证者或 Safety 角色的裁决。
协调者(Coordinator)——角色(人、CI 作业或外部编排器),根据文件仲裁结果作出最终决定,固定判例并发布 judgment.md。不与验证者、实现者和 Safety 平等投票;负责程序而非内容。
Safety——governance_protocol 中的独立角色,检查影响半径、隐私、备份保护和回滚条件。在 critical_risk 时拥有否决权:即使验证者和实现者均投 approve,补丁仍被拒绝。详见第 3 章。
**模型层级(tier,local-coder / frontier-reviewer)**——层级路由中的模型级别。local-coder——廉价的本地模型,用于代码生成和草稿;frontier-reviewer——昂贵的前沿模型,仅用于关键审查、争议裁决和红色按钮检查。详见第 9 章。
预算管理员(budget keeper)——外部服务或脚本,监控各层级的日令牌配额,并在超出限制时阻止对前沿模型的访问。Qwen Code 本身不管理预算。
规格与交付物
影子规格(shadow spec)——针对不可形式化细微差别的规格:语调、不成文的优先级、未进入主 requirements.md 的历史决策。单独存储,基于评分日志(scorebook)在拍卖中胜出,不替代主规格。详见第 6 章。
评分日志(scorebook)——影子规格的评分日志:公式、权重、预算、阈值以及每个候选的 mttr_gain、early_signal、coverage、false_escalation 组件。文件形式为 .specify/memory/shadow-scorebook.json;由拍卖运行创建或更新。
投毒规格(poisoned spec)——故意在其中引入一个缺陷的教学规格:升级循环、优先级冲突或隐藏越界(hidden out-of-scope)。用于训练验证者和校验器。详见第 2 章。
隐藏越界(hidden out-of-scope)——规格形式上未禁止也未描述,但代理倾向于「顺路」执行的操作。示例:规格要求更改告警路由,代理额外修改了 SLA 策略。防护措施——明确的「越界」章节和规格门控 Spec CI。
覆盖规则(Override-правило)——constitution.md 中的可变规范,允许代理在狭窄上下文中绕过标准行为:针对特定 incident_type、特定 pipeline_phase、有限 max_scope 和强制 ttl。没有这些限制,规则将与不变量竞争。
不可变原则(Immutable principle)——constitution.md 的 immutable_principles 章节中的规则,不能被自动禁用:禁止在无备份的情况下重启生产数据库、禁止删除备份、禁止绕过安全关键命名空间。仅通过团队明确公投变更,不通过代理投票。
可变规则(Mutable rule)——constitution.md 的 mutable_rules 章节中的规则,带强制字段 incident_type、pipeline_phase、permitted_actions、max_scope、ttl、rollback_condition。通过累积不可预测事件时的公投演进。
**proposal.md**——对 constitution.md 的单独修正文件,作为风险合同变更通过。包含 version、parent_version、理由、mutable_rules 的变更、预期效果和 rollback_condition。模板见 [examples/templates/proposal.md](examples/templates/proposal.md);公投程序见第 3 章。
**precedents.md**——文件仲裁的判例日志:每个获准的分歧固定为 case_ref 记录、违反的规则、最终裁决和指向 judgment.md 的链接。用作重复争议的最短解决路径;格式见第 8 章。
**genealogy.md**——恢复规格的来源:对每个需求列出来源列表、置信度级别(confirmed、inferred、hypothesis)和开放问题。在从遗留上下文中恢复规格时创建;详见第 1 章。
规格门控(spec gate)——阻止合并的 CI 检查,如果规格未被计划覆盖、计划未被任务覆盖,或任务未被 validation.md 中的事实覆盖。具体示例见第 7 章的 spec_gate。
结业包(capstone dossier)——第 13 章的文件集合,展示单个事件的完整生产 SDD 路径:需求来源、投毒缺陷、修复、宪法、检查、裁决、预算、anti-Goodhart 限制器、就绪度和反模式审计。
免疫指标与古德哈特定律防护
免疫指标(immunity score)——校验器的评分向量,而非单一总分。由三个组件构成:strict_reject_rate、depth_of_diagnostics、recovery_time_p95_ms。用作规格变异测试时校验器回路的门控。
**strict_reject_rate**——在预期 Given/When/Then 步骤被严格拒绝的退化案例(变异体)比例。此指标上升而 depth_of_diagnostics 下降意味着校验器变得更严格但更「盲目」。
**depth_of_diagnostics**——拒绝前的有用解释深度:校验器在返回裁决前经过了多少追踪步骤。深度 1 是「拒绝」,深度 3+ 是「拒绝,因为步骤 Y 中的字段 X 违反规则 Z」。
**recovery_time_p95_ms**——校验器在规格变更后返回稳定裁决和诊断路径的 p95 时间(毫秒)。超出阈值(例如 1200ms)会诱发规避行为并拖慢 CI。
**silent_p0**——通过自动化而未获人工确认且未在审计追踪中记录的 P0 级别事件比例。Anti-Goodhart 指标:如果 MTTR 下降而 silent_p0 上升,说明自动修复以隐藏风险为代价加速。详见第 10 章。
**manual_review_floor**——即使自动化形式上能够处理,也必须经过人工审核的决策最小比例。防止单向优化的防护:禁止代理将人完全挤出回路。
**audit_trace_coverage**——代理操作中有完整证据链保存的比例:输入负载、规格版本、宪法版本、投票日志、decision_hash。目标值 100%;下降会阻止合并和红色按钮。
Anti-Goodhart(反古德哈特)——将指标与抗体配对设计的通用方法。每个目标指标(MTTR、edge_drift)都对应一个守护指标(silent_p0、manual_review_floor、audit_trace_coverage),CI 门控仅在两者同时满足时通过。
变异与压力测试
变异算子(mutation operator)——获取正确规格并引入恰好一个已知类别缺陷的函数。每个变异分配 mutation_id、预期 expected_failure 和停止步骤 halt_before。详见第 5 章。
Nullify——将必填字段(service_id、owner、timestamp)置空的算子。预期拒绝——在计算 SLA 之前的 EMPTY_REQUIRED_FIELD。
FutureTime——将 response_timestamp 设为未来时间或产生负响应延迟的算子。预期代码——INVALID_TIME_ANCHOR、NEGATIVE_RESPONSE_LAG、STALE_INCIDENT_WINDOW。
EscalationCycle——在升级路由图中添加反向边的算子(已存在 edge_oncall → traffic_sre 时添加 traffic_sre → edge_oncall)。预期拒绝——带最小循环诊断的 CYCLE_ESCALATION。
RecursiveDependency——在计算字段之间创建间接递归的算子:owner 依赖 priority,priority 依赖 blast_radius,blast_radius 又依赖 owner。预期拒绝——带字段链的 RECURSION_LIMIT。在可运行示例 examples/stress-mutator/ 中未实现——在第 5 章中描述为未来扩展。
PriorityContradiction——一个规则将 P1 降为 P2,另一规则在无 tie_breaker 时将 P2 恢复为 P1 的算子。预期拒绝——PRIORITY_REVERSAL;防护是冲突解决策略而非路由图。
文件仲裁
**争议变更文件仲裁(示例名称中的 tribunal)**——针对争议补丁或事件的合议裁决程序:验证者、实现者和 Safety 按固定协议投票,协调者出具 judgment.md。不是 Qwen Code 的内置命令;通过 /review、脚本和规则的组合实现。
判例(precedent)——precedents.md 中关于重复冲突类型和采纳解决方案的记录。在 governance_protocol 中用作 latest_matching_precedent 的决胜机制,并降低下一次仲裁的成本。
**纠纷裁决(judgment.md)**——文件仲裁的最终交付物:投票日志、decision_hash、指向规格、宪法和事件的链接、活跃 ttl 和 rollback_condition。作为不可变痕迹存储于仓库中。
谱系(genealogy)——宪法 change_log 和裁决日志中的 parent_version → version 链。允许事后恢复代理在事件时刻为何有权执行特定操作,并重新计算事后决策。
执行控制
紧急模式(red button)——生产环境中潜在危险操作(回滚、迁移、大规模配置更新)前的正式门控。口语中可称「红色按钮」,但在交付物中需固定启用条件。仅在所有 anti-Goodhart 指标满足时触发;第 10 章示例——red_button = BLOCKED (MTTR=4:50, silent_p0=18%, manual_review_rate=12%)。
影响半径(blast radius)——单个代理操作的最大可能影响范围:节点数、命名空间、用户、数据量。在 mutable_rules 中指定为 max_scope,执行前由门控检查。
生存时间(TTL)——可变规则或临时例外(覆盖)的生存时间。没有 ttl,补丁将变为永久性的,并转化为不变量的隐藏部分。
回滚条件(rollback condition)——取消可变规则的条件:重复事件增长、Safety 否决、silent_p0 超出阈值。必须可自动检查,而非仅保留文本表述。
证据基础
证据链(evidence chain)——与代理决策绑定的结构化交付物链:输入负载、规格版本、活跃宪法规则、仲裁投票日志、应用变更的差异、后置条件检查。生产 SDD 的最低要求。
来源(provenance)——争议需求或规则的起源:作者、来源(工单、事件、监管文件)、日期、不确定度级别。允许区分「团队如此约定」与「需求来自审计」。
重放(replay)——通过当前校验器和当前宪法重新运行历史事件。用作古德哈特定律指标中的门控:新版本不得恶化已分析案例的裁决。详见第 10 章。
漂移(drift)——规格、实现与代理在生产环境中实际行为之间的偏差。应用卷中区分三种:spec_drift(规格过时)、code_drift(实现偏离计划)、edge_drift(校验器对边界案例开始不同反应)。
流程反模式
**ask_storm**——代理循环提出澄清问题而非停止的状态。第 2 章的控制字符串:cycle_count > 0 && ask_storm >= 4 && escalation_path_resolved=false。投毒或内在矛盾规格的标志。
**stage_regress**——无明确原因的 SDD 循环阶段回退:implement 返回 plan,plan 返回 specify。通过将每个阶段绑定到 validation.md 中的事实和固定的过渡标准来治愈。
**phase_context_loss**——阶段间的上下文丢失:specify 固定了决策,plan 未继承,implement 按草稿行动。防护——显式引用 @specs/... 和检查阶段间继承的项目技能。
外部 SDD 框架
GitHub Spec Kit——开源框架,标准循环为 /constitution → /specify → /clarify → /plan → /tasks → /analyze → /implement。第二卷中用作规格门控 Spec CI 和规格门控的参考。
AWS Kiro——自带 SDD 模型的 IDE:规格(requirements.md + design.md + tasks.md)、转向文件、代理钩子。与教材的对照见第一卷附录 A。