3.4 KiB
3.4 KiB
Domain Card Template V1
Дата: YYYY-MM-DD
Домен: <domain_name>
Статус: draft | active | shadow | deprecated
Владелец: <owner/team>
1. Scope
Кратко: какую бизнес-задачу закрывает домен и что сознательно не входит в scope.
In-scope intents:
<intent_1><intent_2>
Out-of-scope:
<intent_or_case_not_supported>
2. Intent Contract
Для каждого intent фиксируем контракт.
2.1 <intent_1>
query_shape:FACTUAL_LIST | FACTUAL_SUMMARYrequired_filters:[<filter_a>, <filter_b>]optional_filters:[<filter_c>]resolver_signals: ключевые фразы/паттерны распознаванияambiguity_rules: как разрешаем коллизии (дата vs счет vs номер договора)fallback_policy: только внутри intent, без смены домена
2.2 <intent_2>
query_shape:FACTUAL_LIST | FACTUAL_SUMMARYrequired_filters:[...]optional_filters:[...]resolver_signals:...ambiguity_rules:...fallback_policy:...
3. Recipe Mapping
Связка intent -> recipe_id должна совпадать с runtime catalog (addressRecipeCatalog.ts).
| intent | recipe_id | mcp_method | expected_statuses |
|---|---|---|---|
<intent_1> |
<address_*_v1> |
<method> |
matched_non_empty, no_raw_rows, materialized_but_not_anchor_matched |
<intent_2> |
<address_*_v1> |
<method> |
... |
4. Anchor and Resolver Rules
anchor_type:counterparty | contract | account | date_range | ...anchor_resolution_order: metadata-first порядокmin_confidence: порог для factual-ответаunresolved_behavior: что отдаем при неполной резолюции
5. Limited Reasons (taxonomy)
Разрешенные категории для этого домена:
<limited_reason_category_1><limited_reason_category_2>
Запрещено:
- смешивать произвольные free-form причины;
- выдавать factual при unresolved required filter.
6. Test Coverage
Unit:
- resolver intent positives
- resolver negatives (непересечение с соседними intent)
- filter extraction required/optional
- ambiguity resolution tests
Integration:
- recipe selection
- execution status mapping
- debug payload completeness
Live acceptance:
- canonical questions
- noisy/slang questions
- follow-up chains
7. Gate Criteria
Domain gate:
strict_pass(route)=100%false_factual_rate=0execution_error_rate=0
Global gate:
- baseline stress не ниже текущего эталона
- baseline follow-up не ниже текущего эталона
8. Rollout Plan
shadow: логируем и сравниваем без влияния на prod-ответ.soft-enable: ограниченное включение (feature flag/percentage).prod: полное включение после green global gate.
9. Artifacts
Обязательные артефакты:
domain_<name>_card_v1.mdquestion_sets/domain_<name>_acceptance_<date>.jsonruns/<run_id>/run_summary.jsonruns/<run_id>/full_live_results.jsonruns/<run_id>/failures_only.jsonruns/<run_id>/README.md
10. Change Log
YYYY-MM-DD—<what changed>