diff --git a/llm_normalizer/docs/runs/README.md b/llm_normalizer/docs/runs/README.md index 3dc5754..f06c428 100644 --- a/llm_normalizer/docs/runs/README.md +++ b/llm_normalizer/docs/runs/README.md @@ -20,6 +20,8 @@ - `run_summary.json` — команды, результаты, ключевые ссылки; - `artifacts/` — отчеты прогонов (test/eval/acceptance/regression); - `prompt_dialogs/` — диалоги user/system/assistant и runtime-контекст. +- `чат.txt` — контрольный прогон по 3 вопросам (основной пакет); +- `чат_2q.txt` — короткий smoke-прогон по 2 вопросам. ## Обязательная структура `prompt_dialogs` @@ -32,6 +34,17 @@ - ответ системы (assistant reply); - технический контекст, доступный для анализа (debug/runtime/decomposition/grounding, если есть). +## Контрольные прогоны по вопросам + +Для новых волн фиксируем два текстовых лога в run-папке: +- `чат.txt` — полный прогон по 3 контрольным вопросам; +- `чат_2q.txt` — короткий прогон по 2 вопросам для быстрого rerun-подтверждения. + +Оба файла ведутся в одном стиле: +- блоки `user` / `assistant`; +- `reply_type`, `trace_id`; +- при необходимости отдельный debug-блок. + ## Важное правило по волнам Артефакты разных волн нельзя смешивать в одной папке.