Учебный гайд: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты

Урок 3 из 5 в модуле «Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты»

Вы просматриваете урок без входа. Войдите, чтобы сохранять прогресс и проходить тесты.

Тема: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты

Уровень сложности: Средний

Расчётное время изучения: 2-3 часа

Предварительные требования: Знание принципов командного ревью (Часть 16 первого тома)

Понимание механизмов LLM-дуэлей и работы с контрпримерами

Базовые навыки работы с CLI (запуск Python-скриптов)

Понимание структур данных YAML и JSON

Цели обучения: Понимать различие между LLM-дуэлью и файловым арбитражем (вопросы поиска дефектов vs. вынесения официального вердикта).

Настроить и запустить минимальный учебный сценарий арбитража с использованием скриптов run_duel.py, check_invariants.py и write_judgment.py.

Формировать корректные записи в judgment.md с использованием строгих доказательств (evidence_ref).

Создавать записи в precedents.md для документирования повторяющихся спорных ситуаций.

Применять правило anti-Goodhart для защиты системы от оптимизации метрик за счет скрытых рисков (silent failures, rollback-flapping).

Обзор: Файловый арбитраж превращает разрешение споров по изменениям кода из субъективного обмена мнениями в чате в формализованную, воспроизводимую цепочку доказательств. В этой системе работают четкие роли: Координатор управляет процессом, Имплементор предлагает изменения, Верификатор проверяет их по формальным критериям, а Safety налагает вето при критических рисках. Итогом арбитража становятся артефакты проекта: judgment.md (журнал решений с доказательствами) и precedents.md (база знаний повторяющихся споров). Подход спроектирован так, чтобы вердикт не зависел от конкретной модели ИИ (что проверяется через ротацию ярусов), а спецификация оставалась главным источником истины.

Ключевые концепции: Файловый арбитраж: Коллективная проверка спорного изменения несколькими ролями, где результат фиксируется в виде файлов (артефактов), а не в истории чата.

Роли арбитража: Координатор (ведет протокол, не голосует), Имплементор (предлагает изменения), Верификатор (проверяет формальные критерии), Safety (блокирует критические риски через вето).

Judgment.md: Журнал решений по спорам. Должен содержать вердикт (APPROVE/DENY/DEFERRED), причину и evidence_ref — доказательство из файла, а не пересказ из чата.

Precedents.md: Журнал прецедентов для повторяющихся споров. Содержит стабильный идентификатор, вердикт, доказательство, границы применимости и условие для пересмотра (next_check).

Evidence ref: Строгая ссылка на доказательство (лог хука, различие в diff, JSON Schema, сценарий Given/When/Then). Верификатор не принимает аргументы без evidence_ref.

Ротация ярусов (tier rotation): Тестирование одной и той же спецификации на разных парах агентов (например, дешевая локальная модель + дорогая облачная). Выявляет зависимость вердикта от конкретного ИИ.

Anti-goodhart инварианты: Защитный механизм арбитража, запрещающий улучшать одну метрику (например, MTTR) за счет деградации других (рост false_escalation_rate, rollback-flapping, silent_p0).

Decision trace: Воспроизводимый фазовый протокол решения, описывающий извлеченные факты, проверки красных флагов, примененную политику и итоговый вердикт.

Практические упражнения: Название: Запуск учебного runnable-кейса autoscale_200pct

Проблема: Необходимо провести файловый арбитраж для спецификации autoscale_spec.yaml. Требуется запустить дуэль, проверить anti-Goodhart инварианты и сгенерировать итоговый журнал решений.

Решение: 1. Перейдите в каталог примера: cd book2/examples/tribunal. 2. Запустите скрипт дуэли: python3 scripts/run_duel.py --spec specs/autoscale_spec.yaml --cases cases/ --out out/duel.json. 3. Запустите проверку инвариантов: python3 scripts/check_invariants.py --metrics metrics/validation_metrics.json --out out/invariants.json. 4. Сгенерируйте вердикт: python3 scripts/write_judgment.py --duel-out out/duel.json --invariants-out out/invariants.json --to out/judgment.md.

Сложность: beginner

Название: Перенос конфликта в базу прецедентов

Проблема: В ходе разбора autoscale_200pct выявлен повторяющийся конфликт: автоматический режим требует audit_trace_coverage=1.0, но текущее значение 0.7. Нужно задокументировать этот прецедент.

Решение: Откройте файл precedents.md и добавьте YAML-структуру: case_id: PREC-001, verdict: DENY, evidence_ref: tests/regression_001.json, applies_to: auto-remediation без полного audit_trace, next_check: повторить дуэль при изменении manual_review_floor. В следующем споре сошлитесь на PREC-001.

Сложность: intermediate

Название: Верификация защиты от ловушки Гудхарта

Проблема: Имплементор предложил план снижения MTTR с 6 до 2 минут за счет агрессивной автоэскалации. Вам, как Верификатору, нужно отвергнуть план, если он нарушает инварианты.

Решение: Проверьте логику на соответствие жестким стоп-условиям в validation.md. Убедитесь, что false_escalation_rate <= 0.05, rollback_flapping < 3/ч, и silent_p0_ratio == 0. Если план нарушает хотя бы одно условие, Координатор фиксирует FAIL(reason=metric corruption) в judgment.md.

Сложность: advanced

Кейсы: Название: Арбитраж спора по ограничению частоты запросов (Rate Limiting) в API-шлюзе

Сценарий: Спецификация требует при всплеске запросов временно ограничивать конкретного клиента (tenant), но не блокировать весь сервис. Имплементор предлагает патч, добавляющий tenant_id в ключ дедупликации и окно burst_window_sec=60.

Задача: Необходимо убедиться, что патч действительно изолирует клиентов и не приведет к глобальной блокировке. Важно проверить не только техническую правдоподобность текста, но и наличие строгих доказательств.

Решение: Верификатор требует три доказательства (evidence_ref): 1) JSON Schema, требующую tenant_id, limit_reason, expires_at; 2) Лог PreToolUse, запрещающий изменение глобального лимита; 3) Сценарий Given/When/Then, доказывающий, что всплеск от tenant A не снижает квоту tenant B.

Результат: При A/B-тестировании выяснилось, что при паре «сильный Имплементор + слабый Верификатор» патч отклоняется, так как доказательства спрятаны в длинном тексте, а не вынесены в формализованный diff. В спецификацию был добавлен явный сценарий изоляции tenant-а на языке Gherkin.

Извлечённые уроки: Вердикт должен опираться на формализованные доказательства, а не на авторитет модели или убедительность текста.

Расхождение вердиктов при ротации ярусов означает, что требования спецификации недостаточно переносимы и требуют усиления через diff в validation.md.

Связанные концепции: Ротация ярусов

evidence_ref

JSON Schema

Сценарии Given/When/Then

Советы по изучению: Уделите особое внимание разнице форматов доказательств: слабые модели (local-coder) понимают только minimal_form (короткий diagnostic_code), в то время как сильные (frontier-reviewer) могут работать с extended_form (структура evidence_by_invariant).

Запомните золотое правило арбитража: спор разрешается только через различия (diff) в requirements.md, hooks.md или validation.md. Переписка в чате доказательством не является.

При самостоятельном изучении используйте скрипт matrix.py для проверки того, как меняется вердикт при смене пар ИИ-агентов (C1-C4).

Изучите формат decision_trace — он помогает отделить факты от оценок и делает протокол решения воспроизводимым для других верификаторов.

Дополнительные ресурсы: Пример файлового арбитража (runnable): book2/examples/tribunal/ и book2/examples/tribunal/matrix/

Проектный устав и веса голосования: Часть 3 (part-03-project-constitution.md#ключевые-идеи)

Артефакт проверки фич: Часть 9 (part-09-feature-validation.md) — здесь описан validation.md

Совместимость с qwen code cli: appendix-b-qwen-code-compatibility.md

Резюме: Файловый арбитраж превращает процесс проверки кода из хаотичного обсуждения в строгий процессуальный протокол. Основными инструментами здесь выступают журналы judgment.md и precedents.md, а опорой для принятия решений — формальные доказательства (evidence_ref), такие как логи хуков, схемы JSON и тестовые сценарии Given/When/Then. Подход защищен от искажения метрик с помощью anti-Goodhart инвариантов и от предвзятости конкретных ИИ-моделей с помощью ротации ярусов. Главное правило: если доказательства нет в файле, Координатор не должен превращать впечатление агента в официальный вердикт.

0 / 10000

Заметки сохраняются в этом браузере. На другом устройстве они не появятся.

Курс

Использование SDD в разработке для Qwen Code CLI. Прикладной курс

Прогресс 0 / 95

○ Материал: Прикладная часть 0. Лаборатория AgentClinic-production 🔒 Диаграмма: Прикладная часть 0. Лаборатория AgentClinic-production 🔒 Учебный гайд: Прикладная часть 0. Лаборатория AgentClinic-production 🔒 Тест: Прикладная часть 0. Лаборатория AgentClinic-production 🔒 Карточки: Прикладная часть 0. Лаборатория AgentClinic-production

🔒 Материал: Прикладная часть 1. Восстановление спецификаций из legacy 🔒 Диаграмма: Прикладная часть 1. Восстановление спецификаций из legacy 🔒 Учебный гайд: Прикладная часть 1. Восстановление спецификаций из legacy 🔒 Тест: Прикладная часть 1. Восстановление спецификаций из legacy 🔒 Карточки: Прикладная часть 1. Восстановление спецификаций из legacy

🔒 Материал: Прикладная часть 2. Диагностика дефектов спецификации 🔒 Диаграмма: Прикладная часть 2. Диагностика дефектов спецификации 🔒 Учебный гайд: Прикладная часть 2. Диагностика дефектов спецификации 🔒 Тест: Прикладная часть 2. Диагностика дефектов спецификации 🔒 Карточки: Прикладная часть 2. Диагностика дефектов спецификации

🔒 Материал: Прикладная часть 3. Конституция проекта: первый референдум правил 🔒 Диаграмма: Прикладная часть 3. Конституция проекта: первый референдум правил 🔒 Учебный гайд: Прикладная часть 3. Конституция проекта: первый референдум правил 🔒 Тест: Прикладная часть 3. Конституция проекта: первый референдум правил 🔒 Карточки: Прикладная часть 3. Конституция проекта: первый референдум правил

🔒 Материал: Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях 🔒 Диаграмма: Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях 🔒 Учебный гайд: Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях 🔒 Тест: Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях 🔒 Карточки: Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях

🔒 Материал: Прикладная часть 5. Мутационное тестирование спецификаций 🔒 Диаграмма: Прикладная часть 5. Мутационное тестирование спецификаций 🔒 Учебный гайд: Прикладная часть 5. Мутационное тестирование спецификаций 🔒 Тест: Прикладная часть 5. Мутационное тестирование спецификаций 🔒 Карточки: Прикладная часть 5. Мутационное тестирование спецификаций

🔒 Материал: Прикладная часть 6. Отбор теневых спецификаций 🔒 Диаграмма: Прикладная часть 6. Отбор теневых спецификаций 🔒 Учебный гайд: Прикладная часть 6. Отбор теневых спецификаций 🔒 Тест: Прикладная часть 6. Отбор теневых спецификаций 🔒 Карточки: Прикладная часть 6. Отбор теневых спецификаций

🔒 Материал: Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт 🔒 Диаграмма: Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт 🔒 Учебный гайд: Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт 🔒 Тест: Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт 🔒 Карточки: Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт

🔒 Материал: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты 🔒 Диаграмма: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты ▸ Учебный гайд: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты 🔒 Тест: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты 🔒 Карточки: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты

🔒 Материал: Прикладная часть 9. Маршрутизация моделей и бюджет токенов 🔒 Диаграмма: Прикладная часть 9. Маршрутизация моделей и бюджет токенов 🔒 Учебный гайд: Прикладная часть 9. Маршрутизация моделей и бюджет токенов 🔒 Тест: Прикладная часть 9. Маршрутизация моделей и бюджет токенов 🔒 Карточки: Прикладная часть 9. Маршрутизация моделей и бюджет токенов

🔒 Материал: Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим 🔒 Диаграмма: Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим 🔒 Учебный гайд: Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим 🔒 Тест: Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим 🔒 Карточки: Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим

🔒 Материал: Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя 🔒 Диаграмма: Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя 🔒 Учебный гайд: Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя 🔒 Тест: Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя 🔒 Карточки: Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя

🔒 Материал: Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла 🔒 Диаграмма: Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла 🔒 Учебный гайд: Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла 🔒 Тест: Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла 🔒 Карточки: Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла

🔒 Материал: Прикладная часть 13. Практический зачёт: собрать production SDD-контур 🔒 Диаграмма: Прикладная часть 13. Практический зачёт: собрать production SDD-контур 🔒 Учебный гайд: Прикладная часть 13. Практический зачёт: собрать production SDD-контур 🔒 Тест: Прикладная часть 13. Практический зачёт: собрать production SDD-контур 🔒 Карточки: Прикладная часть 13. Практический зачёт: собрать production SDD-контур

🔒 Материал: Приложение A. Мосты к первому тому 🔒 Диаграмма: Приложение A. Мосты к первому тому 🔒 Учебный гайд: Приложение A. Мосты к первому тому 🔒 Тест: Приложение A. Мосты к первому тому 🔒 Карточки: Приложение A. Мосты к первому тому

🔒 Материал: Приложение B. Совместимость с Qwen Code 🔒 Диаграмма: Приложение B. Совместимость с Qwen Code 🔒 Учебный гайд: Приложение B. Совместимость с Qwen Code 🔒 Тест: Приложение B. Совместимость с Qwen Code 🔒 Карточки: Приложение B. Совместимость с Qwen Code

🔒 Материал: Приложение C. Чек-листы прикладного SDD 🔒 Диаграмма: Приложение C. Чек-листы прикладного SDD 🔒 Учебный гайд: Приложение C. Чек-листы прикладного SDD 🔒 Тест: Приложение C. Чек-листы прикладного SDD 🔒 Карточки: Приложение C. Чек-листы прикладного SDD

🔒 Материал: Приложение D. Калибровка порогов 🔒 Диаграмма: Приложение D. Калибровка порогов 🔒 Учебный гайд: Приложение D. Калибровка порогов 🔒 Тест: Приложение D. Калибровка порогов 🔒 Карточки: Приложение D. Калибровка порогов

🔒 Материал: Глоссарий прикладного тома 🔒 Диаграмма: Глоссарий прикладного тома 🔒 Учебный гайд: Глоссарий прикладного тома 🔒 Тест: Глоссарий прикладного тома 🔒 Карточки: Глоссарий прикладного тома

Учебный гайд: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты

Мои заметки

Меню курса

Курс

Учебный гайд: Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты

Мои заметки

Меню курса

Курс

1. Прикладная часть 0. Лаборатория AgentClinic-production 0 / 5

2. Прикладная часть 1. Восстановление спецификаций из legacy 0 / 5

3. Прикладная часть 2. Диагностика дефектов спецификации 0 / 5

4. Прикладная часть 3. Конституция проекта: первый референдум правил 0 / 5

5. Прикладная часть 4. LLM-дуэль: Верификатор против Имплементора в формальных утверждениях 0 / 5

6. Прикладная часть 5. Мутационное тестирование спецификаций 0 / 5

7. Прикладная часть 6. Отбор теневых спецификаций 0 / 5

8. Прикладная часть 7. Specification CI: спецификация как исполняемый артефакт 0 / 5

9. Прикладная часть 8. Файловый арбитраж спорного изменения: роли, вердикты и прецеденты 0 / 5

10. Прикладная часть 9. Маршрутизация моделей и бюджет токенов 0 / 5

11. Прикладная часть 10. Защита метрик от Гудхарта: сторожевые метрики и аварийный режим 0 / 5

12. Прикладная часть 11. Интеграция с реальным API: от спецификации до деплоя 0 / 5

13. Прикладная часть 12. Антипаттерны production SDD: диагностическая карта прикладного цикла 0 / 5

14. Прикладная часть 13. Практический зачёт: собрать production SDD-контур 0 / 5

15. Приложение A. Мосты к первому тому 0 / 5

16. Приложение B. Совместимость с Qwen Code 0 / 5

17. Приложение C. Чек-листы прикладного SDD 0 / 5

18. Приложение D. Калибровка порогов 0 / 5

19. Глоссарий прикладного тома 0 / 5