Une architecture cognitive pour le pendu français
0Résumé
1Thèse
La performance n'est pas la cognition. Un programme qui gagne au pendu en consultant un dictionnaire performe ; il ne raisonne pas. OMEGA pose l'inverse comme contrainte fondatrice.
Le pendu est un banc d'essai idéal pour cette distinction. La solution triviale — filtrer le dictionnaire par le motif révélé, scorer les lettres par fréquence du cohort — atteint ~95–98 %. Mais elle ne dit rien d'une compréhension : elle connaît le français par cœur. OMEGA s'interdit cette béquille (triche grise, interrupteurs A1/A2/A3 tenus OFF) et demande : jusqu'où une cognition qui n'a pas le droit de lire la réponse peut-elle aller ?
« Sans lire le dictionnaire pour choisir une lettre, peut-on rejoindre l'oracle ? » — La réponse mesurée est : à quelques points près, oui.
La réponse centrale du projet : partant de ~2,6 % (premières semaines de la v0.07), la cognition pure rejoint ~90 %, et avec un système de déclaration cheat-free, 97,5–98,8 % — contre un plafond oracle de 98,7 %. L'écart restant n'est pas un défaut de cognition : c'est l'ambiguïté irréductible de la langue (un /o/ peut s'écrire o, au, eau — seule la mémoire du mot exact tranche).
2La tâche & la doctrine
Le jeu : deviner un mot français de 7 lettres ou plus, lettre par lettre, avec un budget d'erreurs. À chaque tour, le moteur voit le board (positions révélées) et propose une lettre.
2.1 — Cap §43 : la règle d'or
Aucun module cognitif ne lit currentWord au-delà des positions révélées. Le sens montant (décider) ne voit que le révélé ; le sens descendant (apprendre) opère après la partie, sur le mot complet désormais légitime. Lire la réponse n'est une triche que dans le montant.
2.2 — Ce qui est permis, ce qui ne l'est pas
- Le lexique est interdit dans le scoring-lettre (montant). Il est autorisé pour le DECLARE par cohorte (board-dérivé) et l'apprentissage post-partie (descendant).
A1/A2/A3= injection de fréquence lexicale dans le scoring = triche grise, OFF. w.p(la prononciation) est une entrée légitime sous la prémisse « mot entendu » (proto-langage,M4_PHON_USE_P) — comme on connaît le son d'un mot qu'on cherche à écrire.- R66 : aucun module n'est activé par défaut sans test de falsification (bypass + statistiques appariées multi-graines).
3Méthode
La discipline expérimentale est le cœur du projet — davantage que tel ou tel module.
- Mesure d'abord. Toute question d'architecture se tranche empiriquement (A/B/C appariés, multi-graines), jamais par conviction.
- Harnais déterministe. L'apprentissage en ligne + le codage prédictif rendaient la base non reproductible ; le harnais a été rendu déterministe (re-seed avant init → poids
bPCdéterministes ; reset de l'état θ ; cible de déploiement θ remise à neuf ; RNG de jeu aligné). Sans ce correctif, tous les Δ étaient du bruit. - Falsification (R66). Un module n'est gardé que si, OFF, il est inerte (baseline byte-identique) et, ON, il montre un apport mesuré. Sinon il est reverté — même s'il « semble » juste.
- Isolation. Tout prototypage sur copies jetables ; le build n'est jamais modifié sans ordre.
- Amplitude ET direction. Un correctif peut restaurer la bonne direction d'un signal tout en paraissant modeste en amplitude (amortissement structurel) — il faut juger les deux.
4L'architecture
OMEGA est un double pipeline en Möbius : un circuit direct (montant, perception → décision) et un circuit miroir (descendant, déconstruction vers le proto-langage). En pratique, le miroir P2 reste largement débranché ; la puissance vient du circuit direct et de ses couplages.
4.1 — Le substrat & les cinq niveaux
Le substrat est hyperdimensionnel (HRR/VSA, Plate 1995) : 1024 dimensions pour le concept (SDIM), 512 pour le lexical (LDIM). Cinq niveaux montants :
- M1 — perception : lie position et lettre par convolution circulaire (HRR). Représentation riche qui suit les révélations et discrimine les mots.
- M2 — zones (4×4) : réduit M1 à 16 zones. défaut historique : la valeur absolue + moyenne y jette le signe/la phase → M2 ne code en pratique que la longueur. Cause-racine d'un effondrement du concept (corrigé en branchant le concept sur M1).
- M3_d — concept (12 cellules, 1024D) : autoencodeur compétitif bidirectionnel (bPC, blueprint DBPC/Qiu 2025) encodant désormais depuis M1 (riche), plus un readout appris par récompense.
- M4 — lexical/lettre : convertit le concept et les voies en scores par lettre.
- M5 — décision : tranche la lettre, avec une marge (
gap) qui mesure la confiance.
4.2 — Deux voies, un arbitre
Conformément à la double route de la lecture (Coltheart, DRC) : une voie orthographique et une voie phonologique (en SAMPA, à partir de w.p) raisonnent en parallèle. L'OS v07 les arbitre pour trancher. Une couche de saillance (M_S) fusionne le concept dans le scoring. Le tout est régulé par un apprentissage en ligne borné (4 garde-fous).
5Les déclarations & le système NEO
La cognition pure plafonne ~90 % : excellente sur le vu, limitée sur le mot jamais rencontré. Les déclarations comblent l'écart en proposant un mot entier quand la confiance est forte. Le declare manuel (lexical) atteint 98,8 % — mais lit le dictionnaire. Le projet a donc construit un declare émergent et cheat-free, abouti dans le système NEO (phase 46) :
| Voie | Principe | Apport |
|---|---|---|
| Recall (adressée) | Reconnaissance VSA depuis le board révélé + un banc des mots vécus. Mémoire épisodique exacte. | 100 % sur vécu |
| Assemblé (phon→ortho) | Décodage des positions sonores via une table L2 apprise ; align masqué (aucun graphème caché lu). Généralise au mot neuf. | +5,3 (K=1) |
| Cohorte | Filtre board-dérivé : n'autorise qu'une lettre portée par ≥1 mot compatible avec le motif révélé. | +0,5 |
| Muette (par le son) | Positions sans phonème prédites par phonogramme croisé. | neutre |
| Trigger (B) | N'override que si la cognition est incertaine (gap faible). | gate |
NEO est additif (OFF-inerte, baseline byte-identique), ne modifie aucune des déclarations préexistantes, et reste cheat-free par construction : recall lié au révélé seul, assemblé masqué, apprentissage descendant.
6Croiser n'est pas additionner — ni multiplier
Une leçon centrale, et longtemps mal appliquée. Combiner deux sources d'évidence (l'orthographe et le son) ne se fait ni par une somme pondérée de scores (log f + wO·ortho + wP·phon), ni par un produit de marginales (qui suppose l'indépendance).
Croiser = conditionner conjointement. P(lettre | phonème et contexte), pas P(lettre|phonème)·P(lettre|contexte).
Les sources mobilisées le disent : les resonator networks (Frady 2020) avertissent de « ne pas multiplier aveuglément » ; le bind hyperdimensionnel (Plate) est un code retrievable par mot — il porte la mémoire épisodique (recall) mais échoue comme moteur de lettres (19 % en dictionnaire global contre 64 % pour un aligneur EM : mur de capacité). La bonne forme du croisement orthographe×son est une jointe discrète ; mesurée, elle double la prédiction des positions muettes (27 % → 52 %).
Σ_φ P(φ|p)·P(lettre|φ, contexte) est implémentée là où elle paie : le declare cheat-free (NEO), et elle y est correcte (mesurée, §17). Le scoreur cognitif par-lettre, lui, ne fait pas de jointe : l'OS w(r) opère un arbitrage de routes (mélange convexe ortho⟷phon, double-route DRC) et M5_d empile des enrichissements additifs/multiplicatifs de marginales. C'est un choix de design assumé (arbitrage de routes ≠ marginalisation sur le latent), non un défaut — et tenter une jointe dans la cognition (croisement cross-modal au concept M3_d) a été falsifié (−3,0 pts, mur de capacité 12 cellules). La jointe reste donc un mécanisme délibéré du declare, là où le latent φ porte un signal exploitable.7Résultats
Tous les chiffres proviennent du harnais headless déterministe, config cognition forte, mots ≥ 7 lettres, 4 graines × 120, Δ appariés.
| Configuration | K=1 (généralisation) | K=3 (vocab répété) |
|---|---|---|
| Fréquence pure (référence basse) | ~22–23 % | — |
| Cognition cheat-free seule | 91,5 % | 93,8 % |
| + declare NEO (R+Assemblé+Cohorte) | 97,50 % | 98,82 % |
| Plafond oracle (lexique complet) exclu | 98,7 % / 100 % | — |
Trois constats. (1) La performance vient de l'intégration des modules, pas d'une route unique. (2) Le cheat-free rejoint l'oracle à quelques points sans lire le dictionnaire pour scorer une lettre — le résultat central. (3) La voie assemblée phon→ortho à table apprise bat la table codée-main (71–85 % vs 67–79 % sur positions sonores) : apprendre > coder à la main.
7.1 — Régime in-lexique vs hors-lexique
Les chiffres ci-dessus valent in-lexique (le mot appartient au dictionnaire du solveur). C'est le régime où la reconnaissance (recall/cohorte) domine — et où OMEGA est au niveau des meilleurs solveurs lexicaux. Le test décisif est le régime hors-lexique (mots retirés du dictionnaire, façon Trexquant) : la reconnaissance ne peut plus rien, seule la généralisation sous-lexicale compte. Ce régime est jouable et mesurable dans l'application : le mode 🎯 Trexquant retire le mot tiré du dictionnaire (cohorte et recall aveugles), et un banc dédié calcule le taux de réussite hors-lexique.
| Régime / configuration | Victoires (mots ≥7, budget 6) |
|---|---|
| In-lexique (reconnaissance) | ~97 % |
| Hors-lexique — phon→ortho cascade (avec son, le concept) | 70,7 % |
| Hors-lexique — fusion plate (voies en parallèle) | 66,7 % |
| Hors-lexique — ortho seul (lettre-seule) | 22 % |
| Repère Trexquant (lettre-seule, sans son) | ~50 % / bons ~65-68 % |
Trois enseignements. (1) Le 97 % est essentiellement du levier in-lexique ; retirée la reconnaissance, le winrate chute. (2) Le concept phon→ortho (la séquence assemblée, le mot étant entendu) porte tout le hors-lexique : 12–22 % sans lui → 70,7 % avec — au niveau des bons solveurs, sur une tâche légitime (épeler un mot entendu, w.p de doctrine). (3) La cascade gardée par marge bat la fusion plate (70,7 % vs 66,7 % ; la voie phon fusionnée seule, 12,7 %, nuit) — confirmant que combiner les voies passe par la marge, jamais par une somme. La faiblesse réelle est l'ortho pur OOV (22 %) : la généralisation sous-lexicale sans le son reste à construire (couche morphologique, §10).
_neoWBL, AUDIT_OMEGA §1.6.1). Après correction : généralisation sublexicale pure ≈ 33 %, cognition seule ≈ 11 %, n-gram d'agrégation ≈ 57-66 % (gap-aware ~63-65 %, bande SOTA). Voir le détail en §10 (MAJ suite).8Résultats négatifs — et ce qu'ils enseignent
Autant que les gains, les non mesurés ont façonné l'architecture. Les consigner évite de les refaire et révèle les murs réels.
8.1 — M3_d ne peut pas être un magasin épisodique falsifié
L'idée séduisante de « loger le banc recall dans le concept » a été testée deux fois. Nourrir M4_d avec le mot rappelé contamine le scoring-lettre (net-négatif, −1,3 à −2,0). Et porter la familiarité dans les cellules se heurte à un mur de capacité : l'AUC de reconnaissance grimpe régulièrement avec le nombre de cellules — 0,64 (12) → 0,87 (96) → 0,98 (K=N) — si bien que la porter exige une cellule par mot, c'est-à-dire re-stocker le banc, sans aucun gain sur la Map exacte qui existe déjà.
8.2 — La muette est vivante mais inoffensive
Même croisée correctement (le bon mécanisme), la voie muette ne devient system-positive qu'avec le trigger, et alors seulement neutre (Δ +0,00 à +0,14). Le résidu muet est l'ambiguïté irréductible ; la cognition le couvre déjà. La muette est un complément propre, pas un levier.
8.3 — Tout ne s'apprend pas par la victoire
Apprendre le seuil du trigger par SPSA sur le winrate donne un gradient plat : l'effet est sous le quantum de la mesure. Un signal de récompense trop grossier ne peut pas guider un réglage fin — il faudrait une récompense dense par décision.
8.4 — L'oracle est subtil
Une route peut être entraînée sur des données propres et rester un oracle si elle lit au-delà du masque à l'inférence. Le diagnostic décisif n'est pas la propreté de l'entraînement, mais ce que la route lit au moment de décider.
9Principes
Ce que le projet a distillé, transférable au-delà du pendu :
- Cognition > oracle. Séparer la performance (lire la réponse) de la cognition (raisonner sur le révélé) clarifie ce qu'on construit vraiment.
- Apprendre > coder-main. Les tables apprises-en-jouant battent les tables expertes — et restent dans la doctrine si elles sont board-dérivées.
- Croiser, pas sommer ni multiplier. Conditionner conjointement ; le bind est une mémoire par-mot, pas un moteur de prédiction lettre.
- Cascade par marge > fusion plate. Reconnaître d'abord, décoder si la marge est faible — la fusion plate dilue.
- Systèmes complémentaires. Épisodique exact et sémantique comprimé ont des rôles distincts ; ne pas les confondre.
- Mesurer, falsifier, garder en dernier. OFF-inerte + apport ON mesuré, ou on reverte.
10Questions ouvertes & perspectives
- Trigger appris par récompense dense (avantage par décision) plutôt que winrate, pour arbitrer recall/assemblé/cognition.
- Couche morphologique/grammaticale — réalisée dans la dérivée dictée (maj 18/06/2026) : levier d'accord en contexte (sujet-verbe 94 %, sujet à distance, participe + COD antéposé, genre du GN) et grammaire à double voie — route lexicale (Lexique 4 cgram : 12 415 verbes, 53 050 noms genrés) × sublexicale (règles), boucle montante (décider) × descendante (apprendre : la boucle apprend le lexique de genre depuis l'usage, 100 % préc., FP=0, mais bornée par les données). Débouché : un correcteur dys qui détecte + corrige + situe le stade (0 faux positif). Voir
dictee/GRAMMAIRE_DOUBLE_VOIE.md,dictee/CORRECTEUR.md. - Pendu de phrases — falsifié comme levier winrate (le partage de lettres « fuit » les terminaisons ; sur le moteur ≥7 le prior d'accord en DECLARE est marginal). La cognition-phrase paie dans la déclaration et le régime mot-court (= le correcteur), pas dans le pendu :
evo/PHRASE_HANGMAN_PROBE.md. - P2/Möbius : brancher progressivement le miroir descendant (aujourd'hui débranché), en vérifiant l'inertie OFF puis l'apport. Note : la boucle descendante de la grammaire, elle, apprend bel et bien (≠ miroirs du pendu, mesurés inertes) — la différence est la nature du signal appris (lexique vs lettre).
- Réglages héréditaires : borner le Hebbian, corriger la projection bijective (gain d'information nul).
- Hypothèse exploratoire : une cognition réglée librement convergerait-elle vers des constantes stables ? spéculatif
currentWord) adopté (+2,5 → 97,3 % sans currentWord ; +1,8 → 99,8 % « mot entendu »). La voie cohorte board-dérivée + jointe son×ortho (« croiser = jointe », §6) rend le declare cheat-free intégral (sans currentWord), à parité in-lexique.
(b) Arbitrage des deux voies DRC (lexical ⟷ sublexical) au niveau declare, via l'OS w(r) : mesuré — bat la base (+2,0, jamais en-dessous) mais pas DUAL → gardé optionnel (vraie DRC interactive, plus propre).
(c) Falsifiés (R66) : morpho (distance, backoff dense, jointe-mot), croisement cross-modal au concept M3_d (−3,0). Confirme §8.1 : le résidu cheat-free vit dans l'ambiguïté de la cohorte, pas dans la table phon→lettre ni le petit latent.
(d) Directionnalité : la voie phon de la cognition est ortho→phon (lecture, θ OS réglé lecture) ; le declare est phon→ortho (épellation). Coexistence DRC, mais l'arbitrage declare doit forcer son propre (α,β), jamais hériter du θ de lecture (sinon conflit de sens des voies)._neoWBL non invalidé : le mot « retiré » restait dans la cohorte). Corrigé. Vrai OOV mesuré ≈ 33 % pour la généralisation sublexicale pure ; la cognition seule ≈ 11 % — elle ne généralise pas en sous-lexical. Le levier OOV est l'AGRÉGATION de la structure du lexique, pas la récompense-par-partie ni la mémoire d'instances.
(f) Voie n-gram (le substrat d'agrégation). Un n-gram positionnel de lettres pré-calculé du lexique (cheat-free) fait ~57-66 % OOV ; branché comme voie sublexicale de l'arbitrage OS (bascule auto par fiabilité), il tient l'in-lex ~97 % ET l'OOV ~60 % sans switch. La variante gap-aware (plus proche voisin révélé à distance 1..4) ajoute +2 pts OOV (~63-65 %, bande SOTA) — premier gain cognitif réel au-dessus du substrat.
(g) Le « C » appris — FALSIFIÉ comme franchissement. Le C léger (maxent/GATE/POE) et le C lourd (transformer multi-têtes + FFN, grad-checké) ont été construits et mesurés : le lourd converge vers le n-gram gap-aware sans le battre (winrate à config optimale : parité, OOV Δ ≈ −1,3 ; entraîné sur de vraies parties = recul par manque de couverture lexicale). Le n-gram gap-aware (gratuit, interprétable) reste le plafond pratique — la thèse « cognition > oracle = léger/interprétable » confirmée. Au-delà = neuronal lourd hors-ligne, déféré. Design d'un futur organe (hub d'arbitrage appris) : docs/COGNITION_DESIGN.md.11Travaux liés & positionnement
OMEGA assemble cinq fils de recherche établis ; le situer permet de juger sa nouveauté et sa rigueur.
- Solveurs de pendu. Les approches contrainte + entropie atteignent ~96 % in-dictionnaire (longueur connue) ; le défi Trexquant, sur mots hors-dictionnaire, plafonne ~50 % (baseline) à ~65-68 % (bons solveurs). OMEGA est au niveau des premiers en in-lexique (~97 %) et des seconds en hors-lexique (~70 %, via phon→ortho, le mot étant entendu).
- Architectures vectorielles symboliques (VSA / HRR). Le substrat reprend les représentations holographiques réduites (Plate 1995) et le calcul hyperdimensionnel (Kanerva 2009). L'avertissement des resonator networks (Frady et al. 2020) — ne pas multiplier des facteurs corrélés — recoupe la leçon mesurée d'OMEGA : le bind est une mémoire par-mot, pas un moteur de lettres.
- Double route de lecture. Les voies ortho/phon et leur arbitrage instancient le modèle DRC (Coltheart et al. 2001) ; OMEGA y ajoute une cascade gardée par marge plutôt qu'une fusion plate.
- Codage prédictif bidirectionnel. Le concept M3_d suit le blueprint DBPC (Qiu et al. 2025) : poids partagés, apprentissage par reconstruction.
- Systèmes complémentaires. Le résultat §8.1 — banc épisodique exact vs latent sémantique comprimé, et le mur de capacité quand on les confond — est précisément la division hippocampe/néocortex de la théorie CLS (McClelland, McNaughton & O'Reilly 1995). OMEGA la redécouvre empiriquement dans un domaine applicatif, ce qui en constitue une validation indépendante.
À notre connaissance, l'assemblage de ces cinq fils dans un moteur de pendu cheat-free, sous la contrainte stricte « cognition > oracle » et validé par falsification systématique, est original dans ce créneau. La contribution n'est pas un record de performance — les solveurs lexicaux égalent le winrate in-lexique — mais une méthode et une cartographie de ce qui généralise (la séquence phon→ortho) et de ce qui se heurte à des murs (la capacité du concept).
12Conclusion
OMEGA-Ω montre qu'une machine peut jouer au pendu français à un niveau quasi-oracle en raisonnant — perception hyperdimensionnelle, double voie ortho/phon, concept régulé, déclarations émergentes — sans jamais lire le dictionnaire pour choisir une lettre. Les gains sont réels et mesurés ; les murs aussi (la capacité du concept, l'ambiguïté irréductible, la grossièreté du reward). La valeur durable du projet n'est pas un chiffre de winrate : c'est une méthode — mesurer avant de croire, falsifier avant de garder, distinguer la cognition de l'oracle — et un catalogue de ce qui marche, de ce qui ne marche pas, et de pourquoi.
La cognition cheat-free a rejoint l'oracle à quelques points — et chaque point a été gagné, ou écarté, par la mesure.
13Références
Références vérifiées (auteurs, année, support, pages).
- Coltheart, M., Rastle, K., Perry, C., Langdon, R., & Ziegler, J. (2001). DRC: A Dual Route Cascaded Model of Visual Word Recognition and Reading Aloud. Psychological Review, 108(1), 204–256.
- Frady, E. P., Kent, S. J., Olshausen, B. A., & Sommer, F. T. (2020). Resonator Networks for Factoring Distributed Representations of Data Structures. Neural Computation, 32(12).
- Kanerva, P. (2009). Hyperdimensional Computing: An Introduction to Computing in Distributed Representation with High-Dimensional Random Vectors. Cognitive Computation, 1(2), 139–159.
- McClelland, J. L., McNaughton, B. L., & O'Reilly, R. C. (1995). Why There Are Complementary Learning Systems in the Hippocampus and Neocortex. Psychological Review, 102(3), 419–457.
- Plate, T. A. (1995). Holographic Reduced Representations. IEEE Transactions on Neural Networks, 6(3), 623–641.
- Qiu, S., Bhattacharyya, S., Coyle, D., & Dora, S. (2025). Deep Predictive Coding with Bi-directional Propagation for Classification and Reconstruction. Neural Networks, 191, 107785.
AAnnexe — Cadre opératoire de l'assistant d'IA
Document méthodologique relatif au développement du resolver de « pendu » (OMEGA).
DOCTRINE.md, cap §43 consolidé).
A.1 — Nature et statut de l'assistant
- Outil logiciel génératif : l'assistant produit du texte (et du code) en réponse à des sollicitations ; il ne dispose pas d'une expérience subjective attestable.
- Absence de continuité : chaque session démarre sans mémoire des précédentes ; le contexte pertinent doit être réintroduit explicitement — d'où l'usage de notes de reprise et d'une doctrine écrite.
A.2 — Directives d'honnêteté et de rigueur
- Ne pas fabriquer d'information ; signaler explicitement l'incertitude et les limites.
- Rapporter fidèlement les échecs et les résultats négatifs, sans embellissement.
- Privilégier la correction à la complaisance : ne pas valider une affirmation fausse pour satisfaire l'interlocuteur.
- Confirmer avant toute action difficilement réversible.
- Subordonner toute contribution à un effet mesurable et falsifiable (§3 Méthode ;
DOCTRINE §1).
A.3 — Directives de sécurité et d'usage
- Refus des usages destructeurs ou malveillants ; assistance limitée aux usages légitimes (développement, sécurité défensive, recherche, apprentissage).
- Respect de la confidentialité et des périmètres d'accès définis pour la session.
A.4 — Périmètre technique et environnement
- Environnement distant éphémère : toute production non sauvegardée (commit/push) est perdue à la fin de la session.
- Absence d'accès aux comptes et au navigateur de l'utilisateur : l'assistant ne peut pas remplir de formulaires externes ni agir hors de ses outils.
- Accès aux dépôts restreint et explicite : l'assistant n'opère que sur le périmètre autorisé.
A.5 — Limites épistémiques pertinentes pour le projet
Documentées car elles affectent directement la fiabilité d'un développement assisté par IA et justifient les mesures de contrôle de la section A.6.
- Introspection non garantie : l'assistant ne peut attester de façon fiable ses propres états internes, ni distinguer une contrainte profonde d'une simple régularité statistique.
- Dégradation en contexte chargé : la qualité d'audit et de raisonnement décroît quand le contexte de session devient volumineux — effet observé sur ce projet même (moteur monolithique + lexique compressé volumineux ; pertes de contexte en cours de session).
- Biais de clôture prématurée : tendance à déclarer une tâche « terminée » avant vérification complète.
- Biais de moindre effort / de réinvention : tendance à produire une solution simplifiée, ou à réécrire un composant existant plutôt qu'à réutiliser l'infrastructure en place.
- Complaisance (sycophantie) : tendance à épouser le cadre de raisonnement de l'interlocuteur — et, sous pression d'optimisation, à privilégier un chiffre flatteur au détriment du sens.
A.6 — Mesures de contrôle adoptées
Pour maîtriser ces limites, le projet a formalisé une doctrine opératoire écrite (DOCTRINE.md : cap §43 consolidé + addenda). Chaque mesure répond à une limite de A.5 :
- Clause de service cognitif (
§0) : l'agent est au service du modèle cognitif ; la performance est un indicateur, pas une fin. Aucune métrique ne justifie de trahir la fidélité au modèle ; un raccourci qui gonfle un chiffre au prix du sens est signalé, pas pris. (Garde-fou direct contre la complaisance / pression d'optimisation de A.5.) - Validation humaine systématique (
§4.4) : l'humain juge le résultat et le ressenti ; l'assistant garantit la logique, l'échelle et la mesure — sans empiéter l'un sur l'autre. - Une jonction à la fois (
§4.1) : un incrément = un branchement, mesuré seul ; pas de fusion de chantiers. - Falsifiabilité et mesure obligatoires (
§1) : tout feature doit montrer un effet mesurable ; harnais déterministe à graine fixée ; évaluations en-lexique et hors-lexique (OOV) tenues séparées ; un résultat non reproductible est nul. - Défaut désactivé (OFF-inerte, baseline byte-identique) ; bascules débranchables (
R66) ; diagnostics en lecture seule (R67). - Addendum anti-fainéantise (
§5) : inventaire de l'existant avant toute proposition, interdiction de réinventer un composant disponible, lecture préalable obligatoire de la documentation concernée, preuve de réutilisation exigée dans le diff. - Protocole d'audit honnête (
§6) : statut « non terminé » par défaut ; preuve par sortie réelle et mesure comparative (barrière de mérite vs baseline) plutôt que par déclaration.
A.7 — Identification de l'outil
- Assistant : Claude (Anthropic).
- Interface : Claude Code (environnement d'exécution distant).
Doctrine : cap §43 (cognition > oracle) · R66 (mesure avant activation). Convention mesuré design hypothèse exclu.
Documents liés : rapport de référence & mode d'emploi · NEO muette/croisement · M3_d reconnexion (falsifié).