158 lines
13 KiB
Plaintext
158 lines
13 KiB
Plaintext
|
||
Отчет по анализу архива address_query
|
||
Инвентаризация разметки 1С, покрытие доменов и статус runtime-сценариев
|
||
Источник: архив address_query.zip | Дата документов внутри архива: 2026-03-29
|
||
Главный вывод
|
||
Архив посвящен не общему налоговому/НДС-контуру, а отдельному runtime-режиму address_query для factual lookup по взаиморасчетам, договорам, документам, банковским операциям и остаткам по счетам.
|
||
Масштаб inventory
|
||
Обработано 7 039 648 строк из 12 monthly snapshot-файлов за 2020 год, parse errors = 0, найдено 286 уникальных сущностей в 10 family-группах.
|
||
Что реально покрыто сейчас
|
||
На уровне V1/M2.3c подтверждены прежде всего сценарии по контрагентам и документам; account-сценарии видны, но еще ограничены materialization/account-scope проблемами; contract-сценарии требуют специализированных recipe.
|
||
Что с НДС
|
||
НДС-сущности и related entities в inventory присутствуют, но в текущий whitelist intents/runtime V1 они не входят как отдельный поддержанный домен.
|
||
1. Что находится в архиве
|
||
• Главный README описывает пакет как набор документов для перехода к отдельному runtime-режиму `question_mode=address_query`.
|
||
• Есть слой системной инвентаризации сущностей 1С по snapshot-корпусу 2020: entity inventory JSON-артефакты, relation/intention support sets, readable summary, run summary.
|
||
• Есть продуктовый слой: scenario matrix, query recipes, runtime contracts, integration plan, readiness matrix, question bank, acceptance suites и UI dry-run наборы.
|
||
• То есть архив сочетает два уровня: исследование структуры 1С-базы и проектирование прикладного factual-query runtime поверх этой структуры.
|
||
2. Структура пакета по смысловым блокам
|
||
Блок
|
||
Ключевые файлы
|
||
Зачем нужен
|
||
Инвентаризация 1С
|
||
entity_map_1c_2020.md, entity_inventory_*.json, run_summary.json
|
||
Показывает, какие сущности есть в snapshot-корпусе, насколько они query-suitable и какие relation patterns обнаружены.
|
||
Сценарии и intents
|
||
address_scenario_matrix.md, question_bank_v1.md
|
||
Фиксирует пользовательские вопросы, intent mapping, приоритеты и expected response types.
|
||
Recipe-слой
|
||
query_recipes_v1.md, address_runtime_contracts.md
|
||
Задает безопасный runtime-контур: intent -> filters -> recipe -> MCP -> factual result.
|
||
Интеграция и готовность
|
||
runtime_integration_plan.md, runtime_readiness_matrix_v1.md, execution_lineup_v1_2026-03-29.md
|
||
Показывает, как это встраивается и какие сценарии уже живы, а какие еще нет.
|
||
Acceptance и dry-run
|
||
curated_positive_live_suite_v1.md, data_aware_positive_acceptance_suite_v1.md, ui_dry_run_*
|
||
Нужны для live-проверки, контроля false factual и ручного прогона поддержанных вопросов.
|
||
3. Масштаб и состав inventory по базе 1С
|
||
• Источник данных: 12 monthly NDJSON snapshots за 2020 год.
|
||
• Обработано 7 039 648 строк без parse errors.
|
||
• Найдено 286 сущностей в 10 family-группах.
|
||
• Наиболее крупный пласт по строкам - INFORMATION_REGISTER (6,3 млн строк), но адресный runtime строится прежде всего на регистрах, документах, журналах и справочниках.
|
||
Family
|
||
Сущностей / строк
|
||
Приоритет
|
||
Комментарий
|
||
DOCUMENT
|
||
77 / 202 636
|
||
все P0
|
||
Главный источник document-level factual lookup.
|
||
ACCOUNTING_REGISTER
|
||
2 / 190 244
|
||
оба P0
|
||
Ключ к остаткам, хвостам и drilldown по проводкам.
|
||
NSI_CATALOG
|
||
50 / 140 050
|
||
3 P0 / 47 P1
|
||
Нужен для договоров, контрагентов и фильтровых резолверов.
|
||
DOCUMENT_JOURNAL
|
||
12 / 126 868
|
||
все P1
|
||
Быстрый индекс документов и банковских выписок.
|
||
ACCUMULATION_REGISTER
|
||
36 / 73 022
|
||
все P0
|
||
В inventory высоко видимы, но в runtime V1 почти не заведены как отдельные intents.
|
||
4. Какие домены реально прорабатываются
|
||
• Ключевой продуктовый домен - адресные factual-вопросы по взаиморасчетам и документам, а не произвольная аналитика по всей базе.
|
||
• Судя по scenario matrix, question bank и runtime contracts, текущий V1 разбит не по классическим бухгалтерским разделам, а по operational query-доменам.
|
||
Домен
|
||
Что входит
|
||
Статус
|
||
Комментарий
|
||
Контрагенты и задолженность
|
||
payables, receivables, open items by counterparty
|
||
ядро V1
|
||
Самый зрелый блок; есть curated positive cases и live-with-limits.
|
||
Счета и остатки
|
||
account balance, balance docs, turnover
|
||
частично
|
||
Структурно готово, но account-scope/materialization ограничивает стабильные non-empty ответы.
|
||
Договоры
|
||
open contracts, docs/open items by contract
|
||
не дожато
|
||
Есть в дизайне, но нужны specialized recipe и resolver path.
|
||
Документы и банковские операции
|
||
docs by counterparty, bank ops, list by type
|
||
ближе к рабочему
|
||
Именно здесь подтверждены live non-empty кейсы по counterparty family.
|
||
НДС и налоговые сущности
|
||
НДС-регистры, счета-фактуры, НДС-документы в inventory
|
||
не runtime V1
|
||
Есть в инвентаризации, но не заведены как whitelist intents.
|
||
5. Какие intents поддержаны по документам
|
||
• P0-ядро, зафиксированное в bootstrap report: `list_open_contracts`, `list_payables_counterparties`, `list_receivables_counterparties`, `account_balance_snapshot`, `open_items_by_counterparty_or_contract`.
|
||
• Как ближайшее расширение v1.1 перечислены: `list_documents_by_counterparty`, `list_documents_by_contract`, `documents_forming_balance`.
|
||
• Фактически в live runtime на момент пакета явно реализованы: `list_documents_by_counterparty`, `bank_operations_by_counterparty`, `documents_forming_balance`.
|
||
ID
|
||
Сценарий
|
||
Статус
|
||
Что мешает
|
||
AQ-P0-02
|
||
payables by counterparty
|
||
live, но с ограничениями
|
||
Широкие промпты пока дают sparse matches.
|
||
AQ-P0-03
|
||
receivables by counterparty
|
||
live, но с ограничениями
|
||
Нужны более точные period hints и anchor refinement.
|
||
AQ-P0-04
|
||
account balance snapshot
|
||
live, но с ограничениями
|
||
Строки приходят, но выпадают до materialization.
|
||
AQ-P0-05
|
||
open items by counterparty
|
||
live, но с ограничениями
|
||
Нужен явный counterparty anchor для стабильного non-empty.
|
||
AQ-P0-07
|
||
documents by counterparty
|
||
live, но с ограничениями
|
||
Есть positive cases, но якоря еще хрупкие.
|
||
AQ-P0-07B
|
||
bank ops by counterparty
|
||
live, но с ограничениями
|
||
Позитив подтвержден, но узкие/широкие варианты нестабильны.
|
||
AQ-P0-01/06/08
|
||
contract-related scenarios
|
||
требует спец. recipe
|
||
Не хватает contract-aware recipe и contract resolver.
|
||
AQ-P0-09
|
||
documents forming balance
|
||
live, но с ограничениями
|
||
Account family still blocked before materialization.
|
||
6. Какие сущности являются опорными
|
||
• Главная структурная опора - `AccountingRegister_Хозрасчетный_RecordType`: через него идут account, document, organization и часть business drilldown связей.
|
||
• Из документов центральны `СписаниеСРасчетногоСчета`, `ПоступлениеНаРасчетныйСчет`, их строки расшифровки платежа, а также `АктСверкиВзаиморасчетов`.
|
||
• Из справочников критичен `Catalog_ДоговорыКонтрагентов`; при этом `Catalog_Контрагенты`, `Catalog_Организации`, `Catalog_БанковскиеСчета` формально в triage отмечены как P1, но фактически обязательны для фильтров и resolver-логики.
|
||
• Document journals (`ДокументыПоставщиков`, `ДокументыПокупателей`, `БанковскиеВыписки`) играют роль быстрого индексного слоя для list/drilldown сценариев.
|
||
7. Что можно сказать про НДС
|
||
• В inventory присутствуют НДС-регистры и связанные сущности: `AccumulationRegister_НДСПредъявленный`, `AccumulationRegister_НДСЗаписиКнигиПокупок`, `AccumulationRegister_НДСЗаписиКнигиПродаж`, документы `СчетФактураПолученный`, `СчетФактураВыданный`, `СписаниеНДС`, журнал `РегламентныеДокументыНДС`.
|
||
• Однако в scenario matrix, recipe catalog и readiness matrix они не оформлены как отдельный runtime-домен текущего `address_query`.
|
||
• Поэтому корректный вывод такой: НДС уже есть в структурной инвентаризации базы, но в текущем пакете это не целевое продуктовое покрытие V1.
|
||
8. Ограничения и риски
|
||
• Часть labels и entity names в исходном экспорте испорчена cp1251/utf8 mojibake; потребуется финальный decoding/cleanup перед production binding.
|
||
• Без business resolvers нельзя надежно переходить от имени контрагента, договора или счета к ID.
|
||
• Free-form query builder специально запрещен; доступ предполагается только через whitelist recipe.
|
||
• Compound factual вопросы пока только детектируются, но не исполняются как multi-intent decomposition.
|
||
• Account-семейство пока не дает стабильный поток до materialization, хотя сырье на входе уже есть.
|
||
9. Выводы по текущему состоянию
|
||
• Архив уже дает хорошую картину по 1С-сущностям и будущему runtime.
|
||
• Сейчас реально прорабатывается не вся база и не весь бухгалтерский домен, а конкретный address-query слой: контрагенты, задолженность, договоры, документы, банковские операции, остатки/расшифровка по счетам.
|
||
• Самый зрелый operational блок - counterparty/document lookup.
|
||
• Contract-specific и account-specific сценарии структурно готовы, но требуют еще одного цикла реализации и настройки.
|
||
• НДС виден в inventory и может стать следующим отдельным доменом, но в данном архиве это пока не активное runtime-покрытие.
|
||
10. Практический next step
|
||
• Собрать отдельную матрицу: “что есть в inventory” vs “что заведено в intents/recipes” vs “что уже реально работает live”.
|
||
• Развести домены на 3 слоя: текущий рабочий V1, design-only backlog и visible-inventory but not productized.
|
||
• Отдельно сделать shortlist по НДС/налоговым сущностям, если следующая цель - расширить покрытие за пределы address_query.
|