docs(backlog): add AI chat backlog documentation

This commit is contained in:
vvzvlad
2026-06-18 05:50:10 +03:00
parent a945b47749
commit cee9f6fb6e
2 changed files with 297 additions and 0 deletions

View File

@@ -0,0 +1,202 @@
# Follow-ups код-ревью фичи ai-chat
Контекст: мульти-аспектное ревью встроенного AI-агента (диапазон коммитов
`6e5d0300..4868ca8e`, вся фича ai-chat) прошло чисто по безопасности,
регрессиям и конвенциям. Ниже — находки, которые НЕ блокируют merge, но
должны быть закрыты: пробелы в тестах на критичном по безопасности коде,
доступность с клавиатуры, устаревшая документация и мелкие рефакторинги.
Сгруппировано по приоритету. Каждая запись: что → где (`file:line`) → почему →
фикс.
Сознательно НЕ входят в этот файл (вынесены отдельно): warning про неусечённый
реплей tool-выводов в `ai-chat.service.ts` и архитектурное предложение про
дублирование набора инструментов между in-app агентом и `packages/mcp`.
---
## Приоритет 1 — тесты на критичном по безопасности коде (warning)
### 1.1 Шифрование ключей провайдеров (AES-256-GCM) — ноль тестов
- **Где:** `apps/server/src/integrations/crypto/secret-box.ts`
`encryptSecret` (`:36-48`), `decryptSecret` (`:51-81`), сообщение об ошибке
(`:78`). Spec-файла нет (подтверждено grep'ом по `*.spec.ts`).
- **Почему:** это единственная защита API-ключей провайдеров в покое. Не
проверено: round-trip `encrypt → decrypt` возвращает исходный текст; два
шифрования одного текста дают разные блобы (random salt+iv, layout
`base64(salt | iv | authTag | ciphertext)`); ветка `catch` бросает ожидаемую
ошибку «APP_SECRET may have changed» на испорченном/обрезанном блобе или
неверном ключе (на это сообщение опирается UI). Ошибка в смещениях layout или
регресс auth-tag молча испортит все сохранённые креды.
- **Фикс:** `secret-box.spec.ts`, 4 кейса — (1) round-trip equality; (2) два
encrypt одного входа → разные блобы, оба декриптятся; (3) decrypt
подделанного ciphertext / флипнутого байта auth-tag → throw с нужным
сообщением; (4) decrypt под другим `APP_SECRET` → throw. `EnvironmentService`
тривиально стабается (`getAppSecret`).
### 1.2 SSRF-guard — ветки allow/deny полностью не покрыты
- **Где:** `apps/server/src/core/ai-chat/external-mcp/ssrf-guard.ts`
`isIpAllowed` (`:40`), `isUrlAllowed` (`:60-104`); `isIpAllowed`
вызывается для IP-литерала (`:80`) и для каждого DNS-резолва (`:97`).
- **Почему:** единственная защита от SSRF для admin-задаваемых URL внешних
MCP-серверов; тестов нет. Каждая непокрытая ветка = реальный эксплойт:
loopback (127.0.0.1, ::1), link-local/metadata (169.254.169.254), private
(10/172.16/192.168), CGNAT (100.64/10), ULA (fc00::/7), unspecified,
IPv4-mapped IPv6, не-http(s) схема, невалидный URL, DNS-rebinding (любой
резолвнутый адрес приватный ⇒ block). `isIpAllowed` — чистая синхронная
функция.
- **Фикс:** `ssrf-guard.spec.ts``isIpAllowed` по каждому блокируемому классу
+ публичный IP (allow); `isUrlAllowed` — bad-scheme, invalid-url,
IP-литерал-private и (с моком `dns.lookup`) кейс rebinding, где
резолвнутый адрес приватный.
### 1.3 `assistantParts()` — логика «сохранить ошибки/tool-calls в истории» без тестов
- **Где:** `apps/server/src/core/ai-chat/ai-chat.service.ts`
`assistantParts` (`:430-495`), родственные `serializeSteps` (`:610`),
`rowToUiMessage`. Spec'а у сервиса нет.
- **Почему:** чистая функция, чей вывод определяет, переиграется ли диалог.
Ключевая ветка (`:472-486`) эмитит синтетический `output-error` для tool-call
без пары — чтобы `convertToModelMessages` не бросил `MissingToolResultsError`
на следующем ходу. Это суть фиксов видимости ошибок (`dbd83b5a`/`4868ca8e`).
Регресс, убравший пару, молча вернёт краш. Не покрыты также ветки: step с
текстом vs без (`:451-453`, `:489-492`), call с результатом
(`output-available`, `:463-471`) vs без, skip битого call
(`!toolName || !toolCallId`, `:461`).
- **Фикс:** экспортировать чистые хелперы (или тонкая обёртка) и в spec
проверить: парный вызов → `output-available`; непарный → `output-error`; skip
битых; fallback на единственный `text` при отсутствии step-текста.
`rowToUiMessage` предпочитает `metadata.parts` над `content`. Тест на ветку
непарного вызова обязан падать на pre-fix коде.
### 1.4 (suggestion) Ветки парсинга JSON-строковых node-аргументов не покрыты
- **Где:** `apps/server/src/core/ai-chat/tools/ai-chat-tools.service.ts`
`patchNode` (`:686-693`), `insertNode` (`:745-752`), `updatePageJson`
(`:800-809`); сообщения об ошибке `:690`, `:749`, `:804`. Существующий
`ai-chat-tools.service.spec.ts` покрывает только guardrail `deletePage` +
наличие инструментов.
- **Почему:** фикс `59b99dba` добавил coercion string→object (то, что чинило
`insert_node` под OpenAI-tool-calls). Невалидная JSON-строка бросает «node was
a string but not valid JSON» / «content was a string…»; `updatePageJson`
различает undefined/null (title-only) vs object vs string-parse. Регресс,
убравший parse, молча вернёт падение `insert_node` под OpenAI.
- **Фикс:** в существующий spec (он уже стабает фейковый клиент) добавить:
JSON-строковый `node` парсится и форвардится как объект; невалидная строка →
throw с нужным сообщением; `updatePageJson` с `content === undefined`
форвардит `doc === undefined` (title-only), объект проходит как есть.
### 1.5 (suggestion) Фильтр размерности / пустые spaces в поиске эмбеддингов не покрыты
- **Где:** `apps/server/src/database/repos/ai-chat/page-embedding.repo.ts`
`searchByEmbedding` (`:143`), early-return на пустом `spaceIds` (`:149`),
фильтр `model_dimensions = queryEmbedding.length` (`:154` + where в запросе).
- **Почему:** early-return на пустых spaceIds — путь access-scoping с нулевым
результатом; фильтр размерности существует, чтобы избежать pgvector
dimension-mismatch, когда остались строки от ранее настроенной модели
эмбеддингов. Регресс, убравший фильтр, вернёт runtime-краш pgvector.
- **Фикс:** минимум — assert, что `searchByEmbedding(ws, vec, [], n)``[]` без
обращения к БД (ветка чистая). При наличии тест-БД — кейс со смешанными
размерностями: скорятся только строки той же размерности.
---
## Приоритет 2 — доступность и документация (suggestion)
### 2.1 Два новых кликабельных `div` без клавиатурной доступности (a11y)
- **Где:** `apps/client/src/features/ai-chat/components/ai-chat-window.tsx:342-354`
(заголовок «Chat history») и
`apps/client/src/features/ai-chat/components/conversation-list.tsx:107-119`
(строка диалога, `onClick` на `:118`).
- **Почему:** несемантические элементы с `onClick`, но без
`role`/`tabIndex`/`onKeyDown` — с клавиатуры/скринридером историю не
развернуть и прошлый чат не открыть. Это ниже планки самого проекта:
`apps/client/src/features/comment/components/comment-list-item.tsx` использует
`role="button"`, и бейдж AI-агента, добавленный в этом же изменении
(`apps/client/src/features/page-history/components/history-item.tsx:77-79`),
корректно ставит `role="button"` + `tabIndex={0}` + обработку Enter/Space.
- **Фикс:** применить тот же паттерн к обоим элементам (или Mantine
`UnstyledButton`).
### 2.2 Устаревший doc-комментарий перечисляет 9 инструментов из текущих ~40
- **Где:** `apps/client/src/features/ai-chat/utils/tool-parts.tsx:1-10`
(список инструментов на `:8-10`).
- **Почему:** комментарий описывает старый набор; после «expose full Docmost
toolset» и `drop updateComment` вводит в заблуждение. Не баг — дружелюбные
подписи `toolLabelKey` всё равно только у перечисленных, остальные идут в
generic-ветку «Ran tool {{name}}».
- **Фикс:** заменить жёсткий список на «см. `ai-chat-tools.service.ts`» (или
пометить, что дружелюбные подписи только у инструментов из `toolLabelKey`).
### 2.3 Реализация `secret-box` противоречит схеме крипто в плане
- **Где:** `apps/server/src/integrations/crypto/secret-box.ts:11-48` vs
`docs/ai-agent-chat-plan.md` §5.3 / §6.3.
- **Почему:** код использует per-record случайную соль
(`scryptSync(APP_SECRET, salt, 32)`) и layout
`base64(salt | iv | authTag | ciphertext)`; план описывает фиксированную
строковую соль `'ai-provider'` и layout без сегмента соли. Реализация лучше,
но план теперь описывает не те байты на диске — введёт в заблуждение при
написании ротации/отладке decrypt. План помечен «иллюстративным», поэтому
suggestion.
- **Фикс:** обновить §5.3 / §6.3 под фактический layout.
---
## Приоритет 3 — стабильность и рефакторинг (suggestion)
### 3.1 Новый чат, упавший на первом ходу, не «усыновляет» созданный сервером chat id
- **Где:** `apps/client/src/features/ai-chat/components/chat-thread.tsx:129-137`
(`useChat` с `onFinish` на `:136`, без `onError`). Целевой колбэк —
`onTurnFinished` в
`apps/client/src/features/ai-chat/components/ai-chat-window.tsx:154-157`
(инвалидирует `AI_CHATS_RQ_KEY`).
- **Почему:** в AI SDK v6 `onFinish` не срабатывает при ошибке стрима, поэтому
`onTurnFinished()` не вызывается. Сервер же уже создал строку чата и сохранил
error-сообщение — но клиент не инвалидирует список чатов и не подхватывает
новый id: ошибочный чат не появляется в истории до постороннего refresh.
Alert с ошибкой показывается, так что это UX-несогласованность, не потеря
данных.
- **Фикс:** передать в `useChat` `onError`, который тоже вызывает
`onTurnFinished()` (или инвалидирует `AI_CHATS_RQ_KEY` + подхватывает новый
id).
### 3.2 Дублированный хелпер `isToolPart` в двух компонентах
- **Где:** `apps/client/src/features/ai-chat/components/message-item.tsx:16` и
`apps/client/src/features/ai-chat/components/message-list.tsx:15`
идентичное `type.startsWith("tool-") || type === "dynamic-tool"`. Оба уже
импортируют из `utils/tool-parts.tsx`.
- **Почему:** копии молча разойдутся, если AI SDK добавит ещё один
tool-part-дискриминатор.
- **Фикс:** экспортировать `isToolPart` один раз из `tool-parts.tsx` (рядом с
`getToolName`), импортировать в оба компонента, локальные определения удалить.
### 3.3 Объект `initialValues` формы продублирован дословно
- **Где:**
`apps/client/src/features/workspace/components/settings/components/ai-mcp-server-form.tsx`
`useForm({ initialValues: {...} })` (`:75-82`) и эффект re-hydration
`form.setValues({...})` (`:87-95`): один и тот же 6-полевой объект из
`server`.
- **Почему:** должны меняться синхронно; добавить поле в одно и забыть второе —
лёгкий баг. (В соседнем `ai-provider-settings.tsx` этой проблемы нет — там
initialValues константны, а эффект мапит из `settings`.)
- **Фикс:** вынести `buildInitialValues(server)` и звать в обоих местах.
### 3.4 Идиома форматирования ошибки провайдера дублирует существующий хелпер
- **Где:** `apps/server/src/core/ai-chat/ai-chat.service.ts:274-275` и `:338-339`
— инлайн `e?.statusCode ? \`${e.statusCode}: ${e.message}\` : e.message`.
- **Почему:** в `apps/server/src/integrations/ai/ai-error.util.ts` уже есть
общий `describeProviderError(err)` (импортируется в
`apps/server/src/integrations/ai/ai.service.ts:14`, используется на `:193`,
`:210`). Два места в `ai-chat.service.ts` переизобретают его инлайном — формат
может разойтись.
- **Фикс:** заменить оба инлайн-места на `describeProviderError(err)` (при
необходимости расширив хелпер fallback-аргументом), чтобы формат ошибок
провайдера был единым.

View File

@@ -0,0 +1,95 @@
# Дублирование определений инструментов: in-app агент vs standalone MCP-пакет
Статус: **зафиксировано в беклоге, код не менялся.** Это forward-looking
стоимость поддержки, НЕ баг — код корректен сегодня. Фиксируем, чтобы при
росте набора инструментов (см. §16) долг не разъезжался молча.
## Суть
Один и тот же набор инструментов поверх одного `DocmostClient` описан
**тремя независимыми рукописными слоями**. Каждое добавление инструмента или
правка его model-facing описания требует синхронной правки в 2–3 местах, а
parity-баги (расхождение копий) приходится чинить/переоткрывать дважды.
## Где дублируется (три слоя)
1. **Standalone MCP-сервер**`packages/mcp/src/index.ts` (~38 `registerTool`).
Для внешних MCP-клиентов (stdio/http). На каждый инструмент: zod-схема +
длинное model-facing описание + тонкий `execute`, вызывающий `DocmostClient`.
2. **Встроенный AI-чат**`apps/server/src/core/ai-chat/tools/ai-chat-tools.service.ts`
(~39 `tool({...})` через `ai`-SDK). Своя zod-схема + своё описание + свой
`execute` поверх ТОГО ЖЕ клиента (`@docmost/mcp` грузится в
`tools/docmost-client.loader.ts:188` через динамический `import()`).
3. **Ручная копия сигнатур** — интерфейс `DocmostClientLike` в
`apps/server/src/core/ai-chat/tools/docmost-client.loader.ts:9` (в комментарии
прямо: «Signatures here mirror that file exactly»), скопирован руками из
`packages/mcp/src/client.ts`.
## Что именно продублировано (с подтверждением по коду)
- **zod-схема + описание** каждого инструмента — в слоях 1 и 2 целиком.
- **Квирк «node как объект ИЛИ JSON-строка»** реализован дважды (НЕ в общем
клиенте):
- in-app: `ai-chat-tools.service.ts:686` (patchNode), `:745` (insertNode),
`:800` (updatePageJson);
- standalone: `index.ts:526` (patch_node), `:578` (insert_node), `:350`
(update_page_json).
- **Guardrail/семантика `transformPage` (dryRun)** описана в обоих:
`ai-chat-tools.service.ts:~935` и `index.ts:~1006`.
## Почему разделение слоёв 1 и 2 само по себе оправдано
У путей разный транспорт и auth-контекст, и это правильно держать раздельно:
in-app путь чеканит per-user JWT + provenance collab-токен (подписанная
agent-claim, `docmost-client.loader.ts:159``getCollabToken`; см. план §6.5),
а standalone обслуживает внешних клиентов по stdio/http. **Но** это оправдывает
два тонких адаптера (`execute` + auth-обвязка), а НЕ две рукописные копии
МЕТАДАННЫХ (схема + описание + квирки). Метаданные можно объявить один раз и
переиспользовать обоими транспортами.
## Доказательство стоимости (наблюдалось при фиксе edit_page_text)
При исправлении ложного «успеха» `edit_page_text` (refuse форматных правок +
`verify`-отчёт):
- **Поведение** легло в общий `DocmostClient` → автоматически дошло до обоих
агентов ОДНОЙ правкой. Это «хороший» случай — логика в едином источнике.
- **Описание** инструмента пришлось править ДВАЖДЫ: в `index.ts` (кодером) и
отдельно в `ai-chat-tools.service.ts:617`, где описание продолжало рекламировать
«Markdown wrappers tolerated via strip-and-retry» — ровно ту формулировку, что
ввела исходного агента в заблуждение. Копия молча разъехалась и какое-то время
встроенный агент получал устаревшую подсказку. Это и есть материализованный
parity-баг.
## Варианты фикса (выбрать при реализации)
- **A. Единый реестр спеков (полное устранение дублирования).** Вынести в
`packages/mcp` один источник на инструмент: `name` + zod-схема + model-facing
описание + общий хелпер нормализации node-строки (для patch/insert/update).
И `index.ts`, и `ai-chat-tools.service.ts` импортируют спеки и добавляют только
свой `execute`/auth. `DocmostClientLike` — выводить из типа реального клиента
(type-only import / генерация), а не копировать руками.
- Ограничение: `@docmost/mcp` — ESM-only, сервер грузит его через трюк
`new Function('import(specifier)')` (`docmost-client.loader.ts:174`), потому
что `module:commonjs` даунлевелит `import()` в `require()`. Реестр спеков
(данные + zod) должен пересекать ту же ESM/CJS-границу — выполнимо тем же
динамическим импортом; `ai`-SDK `tool()` и MCP `registerTool()` имеют разную
форму, поэтому реестр экспортирует транспорт-агностичные `{name, schema,
description}`, а каждая сторона оборачивает их сама. `zod` — общая зависимость
обоих пакетов, типы переносятся.
- **B. Минимально — общий источник описаний + node-хелпер.** Свести в один
модуль только длинные model-facing описания (то, что реально разъезжается и
уже дало баг) и хелпер нормализации node-строки; zod-схемы и `execute` оставить
раздельными. Меньше риска и проще через ESM-границу (описания — просто строки),
закрывает основной симптом (дрейф описаний), но не убирает дубль схем.
Рекомендация: B как дешёвый первый шаг (убирает дрейф описаний — главный
наблюдавшийся вред), A — когда набор инструментов начнёт активно расти (§16) и
дубль схем/квирков станет ощутимым.
## Процесс
- Реализация — режим делегирования (по умолчанию): рефакторинг через два пакета
(packages/mcp + apps/server) → general-purpose кодеру, затем обязательный
прогон `review`. Прогнать `packages/mcp` unit-тесты и серверные spec'и
(`ai-chat-tools.service.spec.ts`).
- Не коммитить; в конце предложить сообщение коммита.