Claude Code : 1.6% de modèle. 98.4% de harness.
AI Engineering · Architecture
v1.0 · AI Engineering · Architecture
Claude Code : 1.6% de modèle. 98.4% de harness.
Ce qu'Anthropic a vraiment livré, d'après l'analyse au niveau source de MBZUAI et UCL — et pourquoi cela change où votre équipe doit investir.
Lecture ~ 5 min · 9sections
L'architecture, pas le modèle.
Les modèles sont l'innovation. Tout l'enjeu : prendre le meilleur LLM. Le reste, c'est de la plomberie.
- Anthropic a investi dans l'infrastructure déterministe, pas dans le scaffolding de décision. Le harness est l'edge produit — et il révèle ce que le modèle, seul, ne sait pas faire.
- 01 — L'architecture, pas le modèle
- 02 — Le paradoxe de supervision
- 03 — L'atrophie humaine
Une analyse précise. Pas une intuition.
Des chercheurs de MBZUAI et UCL ont publié sur arXiv une analyse au niveau source de Claude Code, intitulée Dive into Claude Code. Ils ont parcouru le code ligne par ligne.
Ce que les 98.4 % font.
Six mécanismes que le modèle, seul, ne saurait pas inventer. Le harness ne complète pas le modèle — il le rend opérationnel.
-
Permissions
7 modes, classifieur ML.
-
Compaction
Pipeline 5 couches, contexte préservé.
-
Tools natifs
54 outils, l'exécution réelle.
-
Hooks
27 types d'événements, plugins & policy.
-
Persistance
Session append-only, sous-agents, recovery.
-
Isolation
Le modèle ne touche jamais FS, shell, réseau.
Le pari : infrastructure, pas scaffolding.
Le papier l'écrit explicitement en page 3. C'est un choix de fond, pas une commodité technique.
L'architecture investit dans l'infrastructure déterministe — gestion du contexte, routage des outils, recovery — plutôt que dans le scaffolding de décision.
- Le pari : des modèles de plus en plus capables tirent davantage d'un environnement opérationnel riche que de frameworks qui contraignent leurs choix.
Le consentement n'est plus un garde-fou.
Le harness compense les défauts du modèle. Il ne compense pas l'atrophie qu'il provoque chez l'opérateur.
Le harness verrouille les actions dangereuses ; il ne crée pas la vigilance qui sait dire non.
Le harness ne compense pas ce qu'il dégrade.
He et al. 2025 — adoption de Cursor sur 807 dépôts. Le gain de vélocité disparaît après le troisième mois. La complexité, elle, reste.
Les gains de vélocité s'effondrent au mois trois. Le harness ne couvre pas la perte de jugement de l'opérateur.
L'edge, c'est l'opérateur.
Sources & références.
Article LinkedIn d'origine et études citées dans l'analyse.
— SOURCE PRIMAIRE
- 01 Dive into Claude Code — Liu, Zhao, Shang & Shen — arXiv 2026, analyse source-level (1 884 fichiers) arxiv.org/abs/2604.dive-claude-code
- 02 Claude Code architecture overview — Anthropic docs.claude.com/claude-code
- 03 Paradox of supervision — Huang — Anthropic Research anthropic.com/research
— ÉTUDES CITÉES
- 04 Comprehension under AI assistance, 2026 — Shen & Tamkin — −17 % sur tests de compréhension anthropic.com/research/comprehension-ai-assistance
- 05 Cursor adoption across 807 repositories, 2025 — He et al. — +40.7 % de complexité, vélocité érodée à 3 mois arxiv.org/abs/2512.cursor-adoption
- 06 Article LinkedIn d'origine — Publication mai 2026 — Cybernetic Enterprise linkedin.com/pulse/cybernetic-enterprise