阅读材料: 应用卷术语表

模块「应用卷术语表」中第 1 / 5 节课
您正在未登录状态下查看课程。 请登录,以保存进度并参加测试。

应用卷术语表

教材第二卷的术语汇总列表。定义在此重复,以避免各章节出现歧义。如果术语已在第一卷中引入,此处提供生产环境补充说明,并指向其在第二卷中实际运作的章节。

不要在开始第二卷之前通读整个术语表。对于第一遍阅读,只需理解 capstone/ 和第一遍的十个强制交付物(完整列表见 README「第一遍强制交付物」章节)。其他术语在需要填写具体文件或理解可运行示例时再查阅。

阅读规则很简单:文件名或 YAML/JSON 键可以保持英文,但在解释中选择一个中文含义。例如,judgment.md 是纠纷裁决文件;tribunal 是文件仲裁,而不是独立产品或 Qwen Code 的内置命令。

散文中推荐默认使用的主要形式(英文键仅在代码块和首次提及时用括号标注):

  • 「静默 P0」——用于散文;silent_p0silent_p0_capsilent_p0_ratio——用于所有代码、YAML/JSON 键、命令和指标标签中;
  • 「规范门控」或「规格门控(Spec CI)」——用于散文;spec_gate——仅作为 .github/workflows/spec-ci.yml 中的任务名称;
  • 「文件仲裁」——用于散文;tribunal——仅作为 examples/tribunal/ 目录名称及其脚本的名称;
  • 「紧急模式」——用于散文;「红色按钮」——作为简短标签;red_buttonred_button_mttr_blindness——仅作为 YAML 中的不变量名称。

关键术语翻译表

在第二卷散文中,我们默认使用术语的中文等效词,并在章节首次提及时在括号中给出英文键,例如:「证据标记(evidence_ref)」。本表是工作参考:哪些术语需要翻译,哪些保留英文作为技术名称,哪些作为俄英混合术语使用。「技术名称」类表示 YAML/JSON 标识符、CLI/脚本名称、状态或配置键——不改动。「双重写法术语」类表示外来词用作流程的复合标记;散文中引入中文等效词,但允许两种写法。「散文术语」类表示外来词完全俄化,正文中仅保留中文形式。

英文形式中文等效词类别
evidence_ref证据标记,证据引用散文术语
evidence, evidence chain证据,证据链散文术语
counterexample反例散文术语
silent_p0静默 P0(事件)技术名称
red button紧急模式;「红色按钮」作为简短标签双重写法术语
provenance来源,出处,起源来源散文术语
drift, edge_drift, spec_drift, code_drift漂移(行为、规格、代码);指标键不改动双重写法术语
escalation升级(借词已在中文中固定)散文术语

| judgment, judgment.md | 纠纷裁决;文件名不改动 | 双重写法术语 | | precedent, precedents.md | 判例;文件名不改动 | 双重写法术语 | | audit_trace_coverage | 审计追踪覆盖率(指标,键名保留) | 技术名称 | | shadow specs, shadow spec | 影子规格;标题中允许两种写法 | 双重写法术语 | | stress spec, stress-spec | 压力规格 | 散文术语 | | guard metric, guard-метрика | 配对反制指标,guard-指标 | 双重写法术语 | | kill switch | 急停开关,kill switch | 双重写法术语 | | playbook | 剧本 | 散文术语(借词) | | runbook | 运行手册 | 散文术语(借词) | | readiness gate, readiness | 就绪门控,就绪度;模型项目名称保留 | 双重写法术语 | | rollback, rollback_condition | 回滚;键 rollback_condition 保留 | 双重写法术语 | | dry run, dry-run | 试运行 | 散文术语 | | webhook | 网络钩子 | 散文术语(借词) | | auction | 拍卖 | 散文术语(借词) |

| tribunal | 争议变更文件仲裁;示例目录和脚本的技术名称 | 技术名称 | | Verifier, Implementor, Safety, Coordinator | 验证者、实现者、Safety(投票)、协调者(non-voting protocolist)——用于散文;YAML 和代码中的角色名称保留英文 | 双重写法术语 | | immunity score | 免疫指标(向量) | 散文术语 | | tier (low/mid/high, local-coder, frontier-reviewer) | 层级(低/中/高)用于散文;YAML 中的键和角色名称不翻译 | 双重写法术语 | | mutation, mutation testing | 变异,变异测试 | 散文术语(借词) | | coverage, coverage-check | 覆盖率,覆盖率检查 | 散文术语 | | scope, scope-check, out-of-scope | 范围,范围检查,超出范围 | 散文术语 | | failover | 故障转移,failover | 双重写法术语 | | blast radius | 影响半径,blast radius | 双重写法术语 | | gate, spec gate | 门控,规格门控(gate) | 双重写法术语 |

| manual_review_floor, manual_review_rate | 人工审核下限,人工审核比例;键保留 | 技术名称 | | genealogy, genealogy.md | 谱系;文件名不改动 | 双重写法术语 | | ttl, time to live | 生存时间(ttl);键保留 | 技术名称 | | few-shot | 少样本示例,few-shot | 双重写法术语 | | scorebook | 评分日志(scorebook);文件名不改动 | 双重写法术语 | | pre-approved actions | 预批准操作 | 散文术语 | | quarantine | 隔离 | 散文术语 | | ask_storm, stage_regress, phase_context_loss | 反模式名称原样保留;章节首次提及时给出简短中文注释 | 技术名称 | | capstone, dossier | 结业考核包,证据包 | 双重写法术语 |

不翻译的技术名称,散文和表格中均保留原样:YAML/JSON 键(immutable_principlesmutable_rulesgovernance_protocolincident_typepipeline_phasepermitted_actionsmax_scoperollback_conditiondecision_hashparent_versionchange_logaudit_traceprompt_hashdecision_sourcenext_guard 等)、文件名(QWEN.mdrequirements.mdplan.mdvalidation.mdmission.mdtech-stack.mdroadmap.mdconstitution.mdjudgment.mdprecedents.mdgenealogy.md)、CLI 命令和脚本名称(qwen -ppython3 scripts/...gitnpmrg)、自定义命令(/sdd:specify/plan/review)、状态(标准 / 推荐 / 前沿)、块标记([runnable][project script])、缩写(MCPCILLMAPIKPIMTTRSLOSLASRE)。

术语首次引入位置

此映射表帮助快速定位术语首次获得工作定义和应用场景的章节。指标(silent_p0audit_trace_coveragemanual_review_floor)和记忆键(shadow-scorebook.jsonshadow-candidates.yamlprecedents.mdjudgment.md)分开列出:指标衡量系统,记忆键存储其历史。

分组术语引入章节
角色验证者、实现者(投票)4
角色Safety(投票)、协调者(non-voting)、governance_protocol3, 8
交付物genealogy.md1
交付物投毒/修复对2
交付物constitution.md、immutable/mutable、ttlrollback_condition3
交付物反例、repair.patchschema_delta4
交付物judgment.mdprecedents.mddecision_hash8
交付物readiness.md、25 分模型11

| 指标 | strict_reject_ratedepth_of_diagnosticsrecovery_time_p95_ms | 5 | | 指标 | mttr_gainearly_signalcoveragefalse_escalation | 6 | | 指标 | token_health_minfailover_to_frontierdegraded_queue | 9 | | 指标 | silent_p0manual_review_flooraudit_trace_coverage | 10 | | 记忆键 | .specify/memory/shadow-candidates.yaml.specify/memory/shadow-scorebook.json | 6 | | 记忆键 | precedents.mdchange_log | 3, 8 | | 机制 | 压力规格,变异测试 | 5 | | 机制 | 影子规格,拍卖,scorebook | 6 | | 机制 | 规格门控(Spec CI) | 7 | | 机制 | 层级路由,local-coderfrontier-reviewer,预算管理员 | 9 | | 机制 | 配对反制指标,anti-Goodhart,紧急模式 | 10 |

| 机制 | 试运行,就绪门控,evidence_ref | 11 |

如果术语在多个章节中出现,列出的章节是其获得工作定义和可运行场景的章节。生产环境补充说明和术语间的关联在第 12 章第 13 章中详细分析。

与第一卷术语表的关联

本术语表补充而非替代第一卷术语表。SDD 基础术语——QWEN.mdmission.mdtech-stack.mdroadmap.mdrequirements.mdplan.mdvalidation.md、Qwen Code 技能、MCP、ACP、EARS、Given/When/Then——均定义于该处,此处不再重复。

生产环境补充说明叠加于这些基础术语之上:

  • 第一卷的 validation.md 包含合并准入的事实;第二卷中,它补充了对决的失败案例、anti-Goodhart 检查、漂移字段和追踪记录。
  • 第一卷的 QWEN.md 存储代理的持久上下文;第二卷中,它成为放置影子规格拍卖的少样本示例及复审期限的位置。
  • 第一卷的宪法固定 mission.md + tech-stack.md + roadmap.md;第二卷中,它扩展为明确的 constitution.md 章节,包含 immutable_principlesmutable_rulesgovernance_protocol

如果本术语表中的术语显得陌生,请先从第一卷的基础定义开始,然后阅读此处的生产环境补充说明。

教学项目 AgentClinic

应用卷的生产场景在思维上部署于第一卷的教学项目 AgentClinic:TypeScript、Hono、服务端 JSX、SQLite、Vitest。Python 属于第二卷的可运行示例:这些是用于本地检查的小型标准库脚本,而非主应用的技术栈。领域实体——患者代理、疾病、治疗、预约、评价、反馈——描述于第一卷附录 B。教学代码与生产事件之间的对应关系记录于应用卷附录 A 的表格中。

形象化名称

章节中有时使用形象化名称。它们作为辅助标签,而非流程的主要名称。工程等效名称如下:

  • 规格恢复——从遗留代码、日志、事件和决策历史中恢复需求;「规格死灵术」仅允许作为辅助标签。
  • 投毒规格——故意损坏的教学规格,带有一个受控缺陷。
  • 验证器疫苗接种——针对规格和检查的变异测试(mutation testing)。
  • 影子规格拍卖(shadow specs)——在将非正式启发式规则纳入工作上下文之前的评估和排序。
  • 争议变更文件仲裁——见下文「文件仲裁」章节;tribunal 在文件和目录名称中保留为示例的技术标签。
  • 模型层级路由——在不同成本和质量模型之间分配任务。
  • 诱饵指标——容易以牺牲系统为代价进行优化的 KPI;工程防护是配对反制指标(guard metrics)。
  • 紧急模式(red button)——危险操作(部署、回滚、迁移或自动修复)前的正式安全门控;「红色按钮」是口语标签。

代理角色

验证者(Verifier)——代理或会话,其唯一任务是查找不变量、合同和事实的违反。无权编写代码或修改交付物,仅作出 approve / reject / abstain 裁决并附理由。详见第 4 章第 8 章

实现者(Implementor)——在规格批准后以自动编辑模式执行计划的代理。在文件仲裁中,对剧本补丁的适用性投票,但无权绕过验证者或 Safety 角色的裁决。

协调者(Coordinator)——角色(人、CI 作业或外部编排器),根据文件仲裁结果作出最终决定,固定判例并发布 judgment.md。不与验证者、实现者和 Safety 平等投票;负责程序而非内容。

Safety——governance_protocol 中的独立角色,检查影响半径、隐私、备份保护和回滚条件。在 critical_risk 时拥有否决权:即使验证者和实现者均投 approve,补丁仍被拒绝。详见第 3 章

**模型层级(tier,local-coder / frontier-reviewer)**——层级路由中的模型级别。local-coder——廉价的本地模型,用于代码生成和草稿;frontier-reviewer——昂贵的前沿模型,仅用于关键审查、争议裁决和红色按钮检查。详见第 9 章

预算管理员(budget keeper)——外部服务或脚本,监控各层级的日令牌配额,并在超出限制时阻止对前沿模型的访问。Qwen Code 本身不管理预算。

规格与交付物

影子规格(shadow spec)——针对不可形式化细微差别的规格:语调、不成文的优先级、未进入主 requirements.md 的历史决策。单独存储,基于评分日志(scorebook)在拍卖中胜出,不替代主规格。详见第 6 章

评分日志(scorebook)——影子规格的评分日志:公式、权重、预算、阈值以及每个候选的 mttr_gainearly_signalcoveragefalse_escalation 组件。文件形式为 .specify/memory/shadow-scorebook.json;由拍卖运行创建或更新。

投毒规格(poisoned spec)——故意在其中引入一个缺陷的教学规格:升级循环、优先级冲突或隐藏越界(hidden out-of-scope)。用于训练验证者和校验器。详见第 2 章

隐藏越界(hidden out-of-scope)——规格形式上未禁止也未描述,但代理倾向于「顺路」执行的操作。示例:规格要求更改告警路由,代理额外修改了 SLA 策略。防护措施——明确的「越界」章节和规格门控 Spec CI。

覆盖规则(Override-правило)——constitution.md 中的可变规范,允许代理在狭窄上下文中绕过标准行为:针对特定 incident_type、特定 pipeline_phase、有限 max_scope 和强制 ttl。没有这些限制,规则将与不变量竞争。

不可变原则(Immutable principle)——constitution.mdimmutable_principles 章节中的规则,不能被自动禁用:禁止在无备份的情况下重启生产数据库、禁止删除备份、禁止绕过安全关键命名空间。仅通过团队明确公投变更,不通过代理投票。

可变规则(Mutable rule)——constitution.mdmutable_rules 章节中的规则,带强制字段 incident_typepipeline_phasepermitted_actionsmax_scopettlrollback_condition。通过累积不可预测事件时的公投演进。

**proposal.md**——对 constitution.md 的单独修正文件,作为风险合同变更通过。包含 versionparent_version、理由、mutable_rules 的变更、预期效果和 rollback_condition。模板见 [examples/templates/proposal.md](examples/templates/proposal.md);公投程序见第 3 章

**precedents.md**——文件仲裁的判例日志:每个获准的分歧固定为 case_ref 记录、违反的规则、最终裁决和指向 judgment.md 的链接。用作重复争议的最短解决路径;格式见第 8 章

**genealogy.md**——恢复规格的来源:对每个需求列出来源列表、置信度级别(confirmedinferredhypothesis)和开放问题。在从遗留上下文中恢复规格时创建;详见第 1 章

规格门控(spec gate)——阻止合并的 CI 检查,如果规格未被计划覆盖、计划未被任务覆盖,或任务未被 validation.md 中的事实覆盖。具体示例见第 7 章spec_gate

结业包(capstone dossier)——第 13 章的文件集合,展示单个事件的完整生产 SDD 路径:需求来源、投毒缺陷、修复、宪法、检查、裁决、预算、anti-Goodhart 限制器、就绪度和反模式审计。

免疫指标与古德哈特定律防护

免疫指标(immunity score)——校验器的评分向量,而非单一总分。由三个组件构成:strict_reject_ratedepth_of_diagnosticsrecovery_time_p95_ms。用作规格变异测试时校验器回路的门控。

**strict_reject_rate**——在预期 Given/When/Then 步骤被严格拒绝的退化案例(变异体)比例。此指标上升而 depth_of_diagnostics 下降意味着校验器变得更严格但更「盲目」。

**depth_of_diagnostics**——拒绝前的有用解释深度:校验器在返回裁决前经过了多少追踪步骤。深度 1 是「拒绝」,深度 3+ 是「拒绝,因为步骤 Y 中的字段 X 违反规则 Z」。

**recovery_time_p95_ms**——校验器在规格变更后返回稳定裁决和诊断路径的 p95 时间(毫秒)。超出阈值(例如 1200ms)会诱发规避行为并拖慢 CI。

**silent_p0**——通过自动化而未获人工确认且未在审计追踪中记录的 P0 级别事件比例。Anti-Goodhart 指标:如果 MTTR 下降而 silent_p0 上升,说明自动修复以隐藏风险为代价加速。详见第 10 章

**manual_review_floor**——即使自动化形式上能够处理,也必须经过人工审核的决策最小比例。防止单向优化的防护:禁止代理将人完全挤出回路。

**audit_trace_coverage**——代理操作中有完整证据链保存的比例:输入负载、规格版本、宪法版本、投票日志、decision_hash。目标值 100%;下降会阻止合并和红色按钮。

Anti-Goodhart(反古德哈特)——将指标与抗体配对设计的通用方法。每个目标指标(MTTR、edge_drift)都对应一个守护指标(silent_p0manual_review_flooraudit_trace_coverage),CI 门控仅在两者同时满足时通过。

变异与压力测试

变异算子(mutation operator)——获取正确规格并引入恰好一个已知类别缺陷的函数。每个变异分配 mutation_id、预期 expected_failure 和停止步骤 halt_before。详见第 5 章

Nullify——将必填字段(service_idownertimestamp)置空的算子。预期拒绝——在计算 SLA 之前的 EMPTY_REQUIRED_FIELD

FutureTime——将 response_timestamp 设为未来时间或产生负响应延迟的算子。预期代码——INVALID_TIME_ANCHORNEGATIVE_RESPONSE_LAGSTALE_INCIDENT_WINDOW

EscalationCycle——在升级路由图中添加反向边的算子(已存在 edge_oncall → traffic_sre 时添加 traffic_sre → edge_oncall)。预期拒绝——带最小循环诊断的 CYCLE_ESCALATION

RecursiveDependency——在计算字段之间创建间接递归的算子:owner 依赖 prioritypriority 依赖 blast_radiusblast_radius 又依赖 owner。预期拒绝——带字段链的 RECURSION_LIMIT。在可运行示例 examples/stress-mutator/ 中未实现——在第 5 章中描述为未来扩展。

PriorityContradiction——一个规则将 P1 降为 P2,另一规则在无 tie_breaker 时将 P2 恢复为 P1 的算子。预期拒绝——PRIORITY_REVERSAL;防护是冲突解决策略而非路由图。

文件仲裁

**争议变更文件仲裁(示例名称中的 tribunal)**——针对争议补丁或事件的合议裁决程序:验证者、实现者和 Safety 按固定协议投票,协调者出具 judgment.md。不是 Qwen Code 的内置命令;通过 /review、脚本和规则的组合实现。

判例(precedent)——precedents.md 中关于重复冲突类型和采纳解决方案的记录。在 governance_protocol 中用作 latest_matching_precedent 的决胜机制,并降低下一次仲裁的成本。

**纠纷裁决(judgment.md)**——文件仲裁的最终交付物:投票日志、decision_hash、指向规格、宪法和事件的链接、活跃 ttlrollback_condition。作为不可变痕迹存储于仓库中。

谱系(genealogy)——宪法 change_log 和裁决日志中的 parent_version → version 链。允许事后恢复代理在事件时刻为何有权执行特定操作,并重新计算事后决策。

执行控制

紧急模式(red button)——生产环境中潜在危险操作(回滚、迁移、大规模配置更新)前的正式门控。口语中可称「红色按钮」,但在交付物中需固定启用条件。仅在所有 anti-Goodhart 指标满足时触发;第 10 章示例——red_button = BLOCKED (MTTR=4:50, silent_p0=18%, manual_review_rate=12%)

影响半径(blast radius)——单个代理操作的最大可能影响范围:节点数、命名空间、用户、数据量。在 mutable_rules 中指定为 max_scope,执行前由门控检查。

生存时间(TTL)——可变规则或临时例外(覆盖)的生存时间。没有 ttl,补丁将变为永久性的,并转化为不变量的隐藏部分。

回滚条件(rollback condition)——取消可变规则的条件:重复事件增长、Safety 否决、silent_p0 超出阈值。必须可自动检查,而非仅保留文本表述。

证据基础

证据链(evidence chain)——与代理决策绑定的结构化交付物链:输入负载、规格版本、活跃宪法规则、仲裁投票日志、应用变更的差异、后置条件检查。生产 SDD 的最低要求。

来源(provenance)——争议需求或规则的起源:作者、来源(工单、事件、监管文件)、日期、不确定度级别。允许区分「团队如此约定」与「需求来自审计」。

重放(replay)——通过当前校验器和当前宪法重新运行历史事件。用作古德哈特定律指标中的门控:新版本不得恶化已分析案例的裁决。详见第 10 章

漂移(drift)——规格、实现与代理在生产环境中实际行为之间的偏差。应用卷中区分三种:spec_drift(规格过时)、code_drift(实现偏离计划)、edge_drift(校验器对边界案例开始不同反应)。

流程反模式

**ask_storm**——代理循环提出澄清问题而非停止的状态。第 2 章的控制字符串:cycle_count > 0 && ask_storm >= 4 && escalation_path_resolved=false。投毒或内在矛盾规格的标志。

**stage_regress**——无明确原因的 SDD 循环阶段回退:implement 返回 planplan 返回 specify。通过将每个阶段绑定到 validation.md 中的事实和固定的过渡标准来治愈。

**phase_context_loss**——阶段间的上下文丢失:specify 固定了决策,plan 未继承,implement 按草稿行动。防护——显式引用 @specs/... 和检查阶段间继承的项目技能。

外部 SDD 框架

GitHub Spec Kit——开源框架,标准循环为 /constitution → /specify → /clarify → /plan → /tasks → /analyze → /implement。第二卷中用作规格门控 Spec CI 和规格门控的参考。

AWS Kiro——自带 SDD 模型的 IDE:规格(requirements.md + design.md + tasks.md)、转向文件、代理钩子。与教材的对照见第一卷附录 A

我的笔记
0 / 10000

笔记保存在当前浏览器中。在其他设备上将不会显示。

课程菜单

课程

Production SDD for Qwen Code CLI. Part 2
进度 0 / 100