feat(sync): resolve §11 idempotency via canonical comparison + corpus harness

Close Задача №0 (SPEC §11) with the spec-sanctioned option (b): compare a
canonicalized ProseMirror form instead of raw bytes.

- canonicalize.ts: canonicalizeContent/docsCanonicallyEqual — strip node attrs.id,
  drop null/undefined attrs, and drop attrs equal to their type's known non-null
  schema default (KNOWN_DEFAULTS: link target/rel, comment.resolved, orderedList.start,
  diagram/media align) so "absent" ≡ "default"; comment anchors + meaningful attrs kept
- roundtrip.ts: assert markdown byte-stability AND canonical stability; add --corpus
  mode and mutually-exclusive-flag warning
- synthetic corpus (headings, marks, lists, table, callout, code w/ trailing \n,
  diagrams, textStyle/mention) + canonicalize/corpus tests (558 green)
- known converter asymmetries (block image after paragraph; embed width/height
  coercion) converge to a fixpoint after one export->import pass -> handled by
  normalize-on-write at vault-write time; isolated under it.fails
- SPEC §11: record the resolution and normalize-on-write strategy
This commit is contained in:
vvzvlad
2026-06-16 23:23:32 +03:00
parent 90d8f86fda
commit 4b34f4d30a
15 changed files with 1258 additions and 60 deletions

14
SPEC.md
View File

@@ -256,6 +256,20 @@ git диффает побайтово. Если export недетерминир
Это **Задача №0** перед Фазой 2.
### Резолюция (реализовано)
- **Выбран вариант (б):** сравнение по канонизированной форме — `canonicalizeContent`
снимает node-`attrs.id` и сводит к default'у/убирает дефолтные атрибуты (включая
non-null дефолты схемы: `link.target/rel`, `comment.resolved`, `orderedList.start`,
`*.align`), comment-якоря и значимые атрибуты сохраняются (§3). Состояния синка
сравниваем через `docsCanonicallyEqual`, не побайтово.
- **Markdown byte-stable** на синтетическом корпусе (заголовки, марки, списки,
таблицы, callout'ы, код с хвостовым `\n`, диаграммы) — harness `--corpus`.
- **Известные асимметрии конвертера** (блочная картинка после абзаца добавляет
пустой абзац; диаграмма материализует `data-align`) **сходятся к фикспойнту за
один проход** `export→import→export`. Лечатся **normalize-on-write**: при записи
в vault прогоняем один такой проход, дальше форма стабильна. Глубокий фикс
конвертера не требуется.
---
## 12. Безопасность и эксплуатация