Au premier semestre 2026, GitHub regorge d'outils qui « cartographient » un dépôt : Understand Anything dépasse 36 000 étoiles en quelques mois (chiffre à vérifier sur le dépôt) — souvent vendu comme la clé pour qu'une IA comprenne enfin un gros projet. Côté MCP : Codebase-Memory, Graphify et autres. Même douleur : monorepo énorme, Cursor limité au @ fichier par fichier — d'où vient la structure ?
Pas de miracle unique : on décortique ce que comble un graphe de connaissances, son articulation avec la mémoire persistante en programmation IA, et les pièges pour les équipes Mac.
1. Où l'IA coince dans un gros dépôt
L'index IDE et le @ sont solides — pourtant on patche parfois les yeux fermés :
- Chaînes d'appels cross-dossiers : vous modifiez une API ; l'impact est trois niveaux plus loin, invisible si les callers ne sont pas dans le contexte.
- Architecture implicite : interdictions d'import, couche de compat — souvent dans un ADR ou un oral, pas dans le fichier ouvert.
- Économie des tokens :
grepen boucle, gros fichiers, demi-dépôt injecté — bruit > signal. - Onboarding / astreinte : « où est l'entrée du module paiement ? » — il faut une carte, pas une liste de fichiers.
Le RAG vectoriel retrouve des bouts « ressemblants » sans garantir les bonnes relations. Les graphes visent d'abord la structure, puis le LLM ajoute le sens — d'où les étoiles, pas seulement le visuel.
AGENTS.md + checks exécutables suffisent souvent.2. Understand Anything en bref
Objectif : codebase → graphe explorables, searchable, questionnable — plugin Claude Code, MCP, Cursor, Copilot, Gemini CLI. MIT ; TS/JS/Python dominants.
2.1 Pipeline hybride
- Tree-sitter : fichiers, fonctions, classes, arêtes — sans deviner les symboles.
- Multi-agents : scan → fichier → architecture → tour → review — rejouable, incrémental.
- LLM sémantique : résumés, communautés, vues métier pour les non-devs.
Mises à jour incrémentales par hash de fichier — sinon le coût full-scan tue l'adoption.
2.2 Carte humaine + API agent
Dashboard d'un côté ; MCP/Skills de l'autre — l'agent demande « qui dépend de PaymentService ? » avant d'ouvrir des fichiers.
3. Comparatif des approches
| Axe | IDE + @ | RAG vectoriel | Graphe code | Mémoire / AGENTS.md |
|---|---|---|---|---|
| Fort | Fichiers courants, diff | Snippets proches, doc | Appels, frontières, tour | Règles équipe, historique |
| Faible | Vue globale | Relations fausses, legacy | Index à entretenir | Pas la structure auto |
| Coût | Fichiers ouverts | Embedding | Analyse + delta | Faible, manuel |
| Question | « Ce fichier suffit ? » | « Pertinent ? » | « Entrée & impact ? » | « Pourquoi ce choix ? » |
En prod on combine : graphe pour la structure, mémoire et conventions pour la cohérence entre sessions.
4. Projets voisins (repère rapide)
| Projet | Idée | Profil |
|---|---|---|
| Understand Anything | Multi-agent, viz, MCP, vues métier | Gros dépôt, onboarding cartographié |
| Codebase-Memory | Graph persistant, impact, moins de tokens outil | Workflow MCP natif |
| Graphify | Sources hétérogènes → graph queryable | Doc+code, budget tokens serré |
AGENTS.md + CI | Pas de graphe auto, auditable | PME tech, règles codifiées |
5. Mise en route recommandée
- Pilote : service connu, complexité moyenne — mesurer trace API / module legacy avec et sans graphe.
- Nœud d'index : full scan = CPU/disque — Mac macOS toujours allumé (mini local ou Mac dédié remote), requêtes MCP depuis le poste dev.
- Aligner AGENTS.md : « domaine paiement → community Payment dans le graphe ».
- Rafraîchir après merge main ; graphe périmé pire qu'absent.
- Sécurité : chemins, noms internes, commentaires — revue compliance avant index SaaS.
Avec OpenClaw + Mac distant, job CI/cron de graphe sur le même nœud que le gateway — comme un cluster IA privé : analyse lourde en salle, IDE légère.
6. Lien avec l'article « mémoire »
Graphe : à quoi ressemble le dépôt, qui dépend de qui. Mémoire : comment on veut le modifier, quels pièges. Graphe seul → refactors « valides » mais indésirables. Règles seules → traces manuelles.
Équipes Apple : Xcode, SPM, signatures — arbre de fichiers obèse. Planifier l'index graphe avec la stratégie worktree/cache du pool CI Mac entreprise pour ne pas saturer la même NVMe que les builds.
Agents personnels type OpenHuman : le graphe est la carte, la mémoire le code de la route.
7. Conclusion : une carte n'empêche pas de se perdre
La ruée vers les graphes dit une chose : fini de nourrir l'IA au hasard. Parsing déterministe + structure incrémentale + sémantique + MCP touche les relations globales — le cœur du « comprendre un gros projet ».
Ça ne remplace ni la mémoire, ni la review, ni les ADR. Pragmatique : graphe pour onboarding/impact, AGENTS.md+CI pour les garde-fous, infra Mac fiable pour l'index.
Sans nœud macOS avec disque pour full + delta, un M4 Mac mini dédié vaut le coup — stabilisez génération/màj avant de courir après un contexte encore plus long.