backprop

JuliusBrussee

Обновлено 5 days ago

1,004

Тестированиеaitesting

О программе

Навык `backprop` преобразует ошибки в улучшения спецификации путем анализа сбоев и добавления новых инвариантов (§V) для предотвращения их повторения. Он активируется при сбоях тестов, сообщениях об ошибках или инцидентах, обеспечивая обновление спецификации параллельно с исправлением кода. Это ключевое отличие от простого исправления кода, поскольку он систематически укрепляет спецификацию, чтобы отлавливать целые классы будущих ошибок.

Быстрая установка

Claude Code

Рекомендуется

Основной

npx skills add JuliusBrussee/blueprint -a claude-code

Команда плагинаАльтернативный

/plugin add https://github.com/JuliusBrussee/blueprint

Git клонированиеАльтернативный

git clone https://github.com/JuliusBrussee/blueprint.git ~/.claude/skills/backprop

Скопируйте и вставьте эту команду в Claude Code для установки этого навыка

Документация

backprop — bug → spec

Plan-then-execute fixes the code & forgets. SDD fixes the code AND edits spec so recurrence is impossible. That edit is backprop.

WHEN TO BACKPROP

Test failed at /build verification.
User reports bug.
Post-mortem after production incident.
/check flags VIOLATE with root cause found.

SIX STEPS

1. TRACE

Read failure output / bug report. Find exact file:line of wrong behavior. Name root cause in one caveman sentence.

2. ANALYZE

Ask three questions:

Would a new §V invariant catch this class of bug? (most common: yes)
Is §I wrong — did spec claim shape the code cannot deliver? (sometimes)
Is §T wrong — did we build the wrong thing? (rare but real)

3. PROPOSE

Draft the spec change. Never skip §B; §V/§I/§T are case-by-case.

Template:

§B row: B<next>|<date>|<root cause>|V<N>
§V line: V<next>: <testable rule that would have caught it>

Example:

§B row: B3|2026-04-20|refund job ran twice on retry|V7
§V line: V7: ∀ refund → idempotency key check before charge reversal

4. GENERATE TEST

New invariant without test = lie. Add failing test first. Name test so it cites the invariant: TestV7_RefundIdempotent.

5. VERIFY

Fix code. Run test. Must pass. Run full suite. Must not regress.

6. LOG

Commit spec edit + test + code fix together. Commit msg: backprop §B.<n> + §V.<N>: <one-line cause>.

WHAT MAKES A GOOD INVARIANT

Testable in code (grep-able or assert-able).
Scoped to a behavior, not a file.
Stated positively when possible (! hold over ⊥ forbid).
References §I surface where it applies.

Bad: V8: code should be correct. Good: V8: ∀ pg_query ! params interpolated via driver, ⊥ string concat.

WHEN NOT TO ADD §V

Bug was purely mechanical typo with no class (i++ vs i-- in throwaway).
Fix is a one-time migration.
Root cause is external dep (upgrade deps instead, note in §C).

Still append §B entry — record that this failure mode was considered. Future bug with same smell → §B search shows precedent.

OUTPUT SHAPE

Every backprop run produces:

§B entry (always).
§V entry (usually).
Test file (when §V added).
Code fix.
One commit.

No dashboards. No log files. SPEC.md + git is the full history.

GitHub репозиторий

JuliusBrussee/blueprint

Путь: skills/backprop

claude-codeparallel-agentsskillsspec-driven-developmenttest-driven-development

Похожие навыки

evaluating-llms-harness

Тестирование

Этот навык Claude запускает lm-evaluation-harness для тестирования LLM на более чем 60 стандартизированных академических задачах, таких как MMLU и GSM8K. Он предназначен для разработчиков, чтобы сравнивать качество моделей, отслеживать прогресс обучения или сообщать академические результаты. Инструмент поддерживает различные бэкенды, включая модели HuggingFace и vLLM.

Просмотреть навык

cloudflare-cron-triggers

Тестирование

Этот навык предоставляет обширные знания по реализации Cloudflare Cron Triggers для планирования запуска Workers с помощью cron-выражений. Он охватывает настройку периодических задач, заданий технического обслуживания и автоматизированных рабочих процессов, а также решение распространенных проблем, таких как неверные cron-выражения и ошибки часовых поясов. Разработчики могут использовать его для настройки планировщиков обработчиков, тестирования cron-триггеров и интеграции с Workflows и Green Compute.

Просмотреть навык

webapp-testing

Тестирование

Этот навык Claude предоставляет инструментарий на базе Playwright для тестирования локальных веб-приложений с помощью Python-скриптов. Он позволяет проводить проверку фронтенда, отладку интерфейса, создание скриншотов и просмотр логов, одновременно управляя жизненным циклом сервера. Используйте его для задач автоматизации браузера, но запускайте скрипты напрямую, вместо чтения их исходного кода, чтобы избежать загрязнения контекста.

Просмотреть навык

finishing-a-development-branch

Тестирование

Этот навык помогает разработчикам завершать готовую работу, проверяя прохождение тестов и предлагая структурированные варианты интеграции. Он направляет рабочий процесс по слиянию, созданию пул-реквестов или очистке веток после завершения реализации. Используйте его, когда ваш код готов и протестирован, чтобы систематически завершать процесс разработки.

Просмотреть навык