Сеть светящихся узлов — метафора структурного понимания большого репозитория ИИ

В первой половине 2026 на GitHub появилась волна open source, которая «рисует карту» репозитория: Understand Anything за несколько месяцев набрал более 36 тысяч звёзд (актуальное число — на странице repo) — в обсуждениях его связывают с надеждой, что ИИ наконец «прочитает большой проект». Рядом MCP-Codebase-Memory, Graphify и другие. Общая боль: monorepo вырос, Cursor опирается на локальные @-файлы — откуда брать структуру?

Мы не объявляем один инструмент «серебряной пулей», а разбираем, какой пробел закрывает граф знаний о коде, как он сочетается с памятью между сессиями и на что смотреть Mac-командам.

1. Где ИИ спотыкается в большом repo

Индекс IDE и @ сильны, но в таких случаях правки ощущаются «вслепую»:

  • Цепочки вызовов через каталоги: меняете API — страдает модуль за три уровня; без callers в контексте PR выглядит верным.
  • Неявная архитектура: запрет import, слой совместимости — в ADR или устно, не в открытом файле.
  • Экономика токенов: grep, огромные файлы, пол-repo в prompt — шум давит сигнал.
  • Онboarding / дежурство: «где вход в payment?» — нужна карта, не список файлов.

Векторный RAG находит «похожие куски», но не гарантирует связи. Граф сначала фиксирует структуру, LLM добавляет смысл — в этом суть звёзд, не только картинка.

Контрпример: маленький repo, правила в lint/CI — полный граф может быть overkill. AGENTS.md и проверки дешевле.

2. Understand Anything: что внутри

Любая кодовая база → исследуемый граф — плагин Claude Code, MCP, Cursor/Copilot/Gemini CLI. MIT; TS/JS/Python.

2.1 Гибридный pipeline

  • Tree-sitter: файлы, функции, классы, рёбра — детерминированно.
  • Multi-agent: scan → файл → архитектура → tour → review — перезапуск, инкремент.
  • LLM-семантика: summary, communities, business-view.

Инкремент по hash файла — иначе full-scan на постоянной разработке не тянется.

2.2 Карта + интерфейс агента

MCP/Skills отдают подграф — сначала «кто зависит от PaymentService?», потом открытие файлов.

3. Сравнение подходов

ОсьIDE + @Векторный RAGГраф кодаПамять / AGENTS.md
СильноеТекущие файлыПохожие фрагментыВызовы, границы, tourПравила, история
СлабоеГлобальная структураОшибки связей, legacyПоддержка индексаНе «понимает» структуру сам
СтоимостьОткрытые файлыEmbeddingАнализ + deltaНизкая, вручную
Вопрос«Хватит файла?»«Релевантно?»«Вход и impact?»«Почему так решили?»

На практике комбинируют: граф для структуры, память и конвенции для поведения между сессиями.

4. Соседние проекты

ПроектСутьКому
Understand AnythingMulti-agent, viz, MCP, инкрементБольшой repo, onboarding-карта
Codebase-MemoryПersistent graph, impact, меньше tokenMCP-агенты
GraphifyРазные источники → graph, дешёвые запросыДок+код, чувствительность к cost
AGENTS.md + CIБез auto-graph, аудируемоМалый/средний repo

5. Как пробовать внедрение

  1. Пилот: один знакомый сервис средней сложности — trace API с/без графа, шаги и token.
  2. Среда индекса: full scan жрёт ресурсы — always-on macOS (mini или выделенный Mac), MCP с dev-машины.
  3. AGENTS.md: «payment → community в графе сначала».
  4. Обновление после merge в main; устаревший граф хуже отсутствия.
  5. Безопасность: пути, внутренние имена — compliance до внешнего индекса.

С OpenClaw + удалённый Mac — job CI/cron на том же узле; как в приватном AI-кластере: тяжёлый анализ в стойке, лёгкая IDE локально.

Важно: звёзды = реальный спрос, не «завтра всем». Beta-права, плагины, MCP supply chain — по корпоративному baseline.

6. Связь со статьёй о памяти

Граф: как устроен repo и кто от кого зависит. Память: как хотим менять и где уже падали. Только граф — «правильные», но нежелательные рефакторинги. Только правила — ручной trace.

Apple-команды: Xcode, SPM, подпись — дерево раздувается. Планируйте индекс вместе с worktree/кешем enterprise Mac CI, чтобы анализ и build не делили одну NVMe.

Личные агенты вроде OpenHuman: граф — карта, память — правила дорожного движения.

7. Итог: карта есть — заблудиться всё равно можно

Ажиотаж вокруг графов — усталость от «кормить модель файлами наугад». Детерминированный parse + инкремент + семантика + MCP бьёт в глобальные связи — ядро «понять большой проект».

Не заменяет память, review и зафиксированные решения. Прагматично: граф для onboarding/impact, AGENTS.md+CI для границ, доверенный Mac для индекса.

Нет macOS-узла с диском под full+delta — имеет смысл выделенный M4 Mac mini: сначала стабилизируйте генерацию/обновление карты, потом думайте о ещё более длинном контексте.