Mémoire de recherche & d'ingénierie

Une architecture cognitive pour le pendu français

Comment une machine peut jouer au pendu en raisonnant plutôt qu'en lisant la réponse — et ce que la contrainte « cognition > oracle » nous a appris.

OMEGA-Ω v0.07 · build phase47 (moteur cognitif phase46) · direction Rem · rédaction Claude (Anthropic)
Instantané au 03/06/2026 — addendum 14/06/2026 : application dérivée = dictée diagnostique (dys), voir dictee/ ; addendum 18/06/2026 : couche grammaire à double voie + correcteur dys (§10) ; addendum 24/06/2026 : aide-frappe (complétion accentuée) fondue dans le correcteur (app + extension) + boucle d'apprentissage (profil dys unifié dictée+correcteur, dictée adaptative, courbe de progrès) — voir DICTEE_ROADMAP.md ; déploiement = lexique embarqué compressé (gzip+base64, navigateur ≥ 2023) · doctrine cap §43 · R66

0Résumé

Abstract OMEGA-Ω est un moteur de pendu français (mots ≥ 7 lettres) bâti non comme un chercheur de dictionnaire mais comme une architecture cognitive. Sa doctrine — cognition > oracle — interdit à tout module de lire le mot caché ailleurs qu'aux positions révélées. Sous cette contrainte, la cognition seule atteint ~90 % de réussite ; complétée d'un système de déclaration émergent et cheat-free (NEO), elle atteint 97,5 % à 98,8 % — au niveau d'un oracle lexical, sans jamais lire le dictionnaire pour scorer une lettre. Ces chiffres valent en régime in-lexique ; sur des mots hors-dictionnaire (protocole Trexquant), la reconnaissance ne joue plus, mais la séquence phon→ortho généralise encore à ~70 % — au niveau des bons solveurs. Ce mémoire expose l'architecture (double pipeline Möbius, substrat hyperdimensionnel, voies ortho/phon), la méthode (mesure-d'abord, falsification R66, harnais déterministe), les résultats, et — tout aussi instructifs — les résultats négatifs qui ont délimité ce qui était possible.

1Thèse

La performance n'est pas la cognition. Un programme qui gagne au pendu en consultant un dictionnaire performe ; il ne raisonne pas. OMEGA pose l'inverse comme contrainte fondatrice.

Le pendu est un banc d'essai idéal pour cette distinction. La solution triviale — filtrer le dictionnaire par le motif révélé, scorer les lettres par fréquence du cohort — atteint ~95–98 %. Mais elle ne dit rien d'une compréhension : elle connaît le français par cœur. OMEGA s'interdit cette béquille (triche grise, interrupteurs A1/A2/A3 tenus OFF) et demande : jusqu'où une cognition qui n'a pas le droit de lire la réponse peut-elle aller ?

« Sans lire le dictionnaire pour choisir une lettre, peut-on rejoindre l'oracle ? » — La réponse mesurée est : à quelques points près, oui.

La réponse centrale du projet : partant de ~2,6 % (premières semaines de la v0.07), la cognition pure rejoint ~90 %, et avec un système de déclaration cheat-free, 97,5–98,8 % — contre un plafond oracle de 98,7 %. L'écart restant n'est pas un défaut de cognition : c'est l'ambiguïté irréductible de la langue (un /o/ peut s'écrire o, au, eau — seule la mémoire du mot exact tranche).

2La tâche & la doctrine

Le jeu : deviner un mot français de 7 lettres ou plus, lettre par lettre, avec un budget d'erreurs. À chaque tour, le moteur voit le board (positions révélées) et propose une lettre.

2.1 — Cap §43 : la règle d'or

Aucun module cognitif ne lit currentWord au-delà des positions révélées. Le sens montant (décider) ne voit que le révélé ; le sens descendant (apprendre) opère après la partie, sur le mot complet désormais légitime. Lire la réponse n'est une triche que dans le montant.

2.2 — Ce qui est permis, ce qui ne l'est pas

Le lexique est interdit dans le scoring-lettre (montant). Il est autorisé pour le DECLARE par cohorte (board-dérivé) et l'apprentissage post-partie (descendant). A1/A2/A3 = injection de fréquence lexicale dans le scoring = triche grise, OFF.
w.p (la prononciation) est une entrée légitime sous la prémisse « mot entendu » (proto-langage, M4_PHON_USE_P) — comme on connaît le son d'un mot qu'on cherche à écrire.
R66 : aucun module n'est activé par défaut sans test de falsification (bypass + statistiques appariées multi-graines).

3Méthode

La discipline expérimentale est le cœur du projet — davantage que tel ou tel module.

Mesure d'abord. Toute question d'architecture se tranche empiriquement (A/B/C appariés, multi-graines), jamais par conviction.
Harnais déterministe. L'apprentissage en ligne + le codage prédictif rendaient la base non reproductible ; le harnais a été rendu déterministe (re-seed avant init → poids bPC déterministes ; reset de l'état θ ; cible de déploiement θ remise à neuf ; RNG de jeu aligné). Sans ce correctif, tous les Δ étaient du bruit.
Falsification (R66). Un module n'est gardé que si, OFF, il est inerte (baseline byte-identique) et, ON, il montre un apport mesuré. Sinon il est reverté — même s'il « semble » juste.
Isolation. Tout prototypage sur copies jetables ; le build n'est jamais modifié sans ordre.
Amplitude ET direction. Un correctif peut restaurer la bonne direction d'un signal tout en paraissant modeste en amplitude (amortissement structurel) — il faut juger les deux.

4L'architecture

OMEGA est un double pipeline en Möbius : un circuit direct (montant, perception → décision) et un circuit miroir (descendant, déconstruction vers le proto-langage). En pratique, le miroir P2 reste largement débranché ; la puissance vient du circuit direct et de ses couplages.

4.1 — Le substrat & les cinq niveaux

Le substrat est hyperdimensionnel (HRR/VSA, Plate 1995) : 1024 dimensions pour le concept (SDIM), 512 pour le lexical (LDIM). Cinq niveaux montants :

M1 — perception : lie position et lettre par convolution circulaire (HRR). Représentation riche qui suit les révélations et discrimine les mots.
M2 — zones (4×4) : réduit M1 à 16 zones. défaut historique : la valeur absolue + moyenne y jette le signe/la phase → M2 ne code en pratique que la longueur. Cause-racine d'un effondrement du concept (corrigé en branchant le concept sur M1).
M3_d — concept (12 cellules, 1024D) : autoencodeur compétitif bidirectionnel (bPC, blueprint DBPC/Qiu 2025) encodant désormais depuis M1 (riche), plus un readout appris par récompense.
M4 — lexical/lettre : convertit le concept et les voies en scores par lettre.
M5 — décision : tranche la lettre, avec une marge (gap) qui mesure la confiance.

4.2 — Deux voies, un arbitre

Conformément à la double route de la lecture (Coltheart, DRC) : une voie orthographique et une voie phonologique (en SAMPA, à partir de w.p) raisonnent en parallèle. L'OS v07 les arbitre pour trancher. Une couche de saillance (M_S) fusionne le concept dans le scoring. Le tout est régulé par un apprentissage en ligne borné (4 garde-fous).

5Les déclarations & le système NEO

La cognition pure plafonne ~90 % : excellente sur le vu, limitée sur le mot jamais rencontré. Les déclarations comblent l'écart en proposant un mot entier quand la confiance est forte. Le declare manuel (lexical) atteint 98,8 % — mais lit le dictionnaire. Le projet a donc construit un declare émergent et cheat-free, abouti dans le système NEO (phase 46) :

Voie	Principe	Apport
Recall (adressée)	Reconnaissance VSA depuis le board révélé + un banc des mots vécus. Mémoire épisodique exacte.	100 % sur vécu
Assemblé (phon→ortho)	Décodage des positions sonores via une table L2 apprise ; align masqué (aucun graphème caché lu). Généralise au mot neuf.	+5,3 (K=1)
Cohorte	Filtre board-dérivé : n'autorise qu'une lettre portée par ≥1 mot compatible avec le motif révélé.	+0,5
Muette (par le son)	Positions sans phonème prédites par phonogramme croisé.	neutre
Trigger (B)	N'override que si la cognition est incertaine (gap faible).	gate

NEO est additif (OFF-inerte, baseline byte-identique), ne modifie aucune des déclarations préexistantes, et reste cheat-free par construction : recall lié au révélé seul, assemblé masqué, apprentissage descendant.

6Croiser n'est pas additionner — ni multiplier

Une leçon centrale, et longtemps mal appliquée. Combiner deux sources d'évidence (l'orthographe et le son) ne se fait ni par une somme pondérée de scores (log f + wO·ortho + wP·phon), ni par un produit de marginales (qui suppose l'indépendance).

Croiser = conditionner conjointement. P(lettre | phonème et contexte), pas P(lettre|phonème)·P(lettre|contexte).

Les sources mobilisées le disent : les resonator networks (Frady 2020) avertissent de « ne pas multiplier aveuglément » ; le bind hyperdimensionnel (Plate) est un code retrievable par mot — il porte la mémoire épisodique (recall) mais échoue comme moteur de lettres (19 % en dictionnaire global contre 64 % pour un aligneur EM : mur de capacité). La bonne forme du croisement orthographe×son est une jointe discrète ; mesurée, elle double la prédiction des positions muettes (27 % → 52 %).

Mesuré Muette, top-1 position : ortho 26,8 % · son 21,2 % · croisé jointe 51,6 %. Le produit de marginales coïncide (51,8 %) mais reste le mauvais mécanisme.

Précision — où vit la jointe (audit structurel 06/26) La jointe Σ_φ P(φ|p)·P(lettre|φ, contexte) est implémentée là où elle paie : le declare cheat-free (NEO), et elle y est correcte (mesurée, §17). Le scoreur cognitif par-lettre, lui, ne fait pas de jointe : l'OS w(r) opère un arbitrage de routes (mélange convexe ortho⟷phon, double-route DRC) et M5_d empile des enrichissements additifs/multiplicatifs de marginales. C'est un choix de design assumé (arbitrage de routes ≠ marginalisation sur le latent), non un défaut — et tenter une jointe dans la cognition (croisement cross-modal au concept M3_d) a été falsifié (−3,0 pts, mur de capacité 12 cellules). La jointe reste donc un mécanisme délibéré du declare, là où le latent φ porte un signal exploitable.

7Résultats

Tous les chiffres proviennent du harnais headless déterministe, config cognition forte, mots ≥ 7 lettres, 4 graines × 120, Δ appariés.

Configuration	K=1 (généralisation)	K=3 (vocab répété)
Fréquence pure (référence basse)	~22–23 %	—
Cognition cheat-free seule	91,5 %	93,8 %
+ declare NEO (R+Assemblé+Cohorte)	97,50 %	98,82 %
Plafond oracle (lexique complet) exclu	98,7 % / 100 %	—

Trois constats. (1) La performance vient de l'intégration des modules, pas d'une route unique. (2) Le cheat-free rejoint l'oracle à quelques points sans lire le dictionnaire pour scorer une lettre — le résultat central. (3) La voie assemblée phon→ortho à table apprise bat la table codée-main (71–85 % vs 67–79 % sur positions sonores) : apprendre > coder à la main.

7.1 — Régime in-lexique vs hors-lexique

Les chiffres ci-dessus valent in-lexique (le mot appartient au dictionnaire du solveur). C'est le régime où la reconnaissance (recall/cohorte) domine — et où OMEGA est au niveau des meilleurs solveurs lexicaux. Le test décisif est le régime hors-lexique (mots retirés du dictionnaire, façon Trexquant) : la reconnaissance ne peut plus rien, seule la généralisation sous-lexicale compte. Ce régime est jouable et mesurable dans l'application : le mode 🎯 Trexquant retire le mot tiré du dictionnaire (cohorte et recall aveugles), et un banc dédié calcule le taux de réussite hors-lexique.

Régime / configuration	Victoires (mots ≥7, budget 6)
In-lexique (reconnaissance)	~97 %
Hors-lexique — phon→ortho cascade (avec son, le concept)	70,7 %
Hors-lexique — fusion plate (voies en parallèle)	66,7 %
Hors-lexique — ortho seul (lettre-seule)	22 %
Repère Trexquant (lettre-seule, sans son)	~50 % / bons ~65-68 %

Trois enseignements. (1) Le 97 % est essentiellement du levier in-lexique ; retirée la reconnaissance, le winrate chute. (2) Le concept phon→ortho (la séquence assemblée, le mot étant entendu) porte tout le hors-lexique : 12–22 % sans lui → 70,7 % avec — au niveau des bons solveurs, sur une tâche légitime (épeler un mot entendu, w.p de doctrine). (3) La cascade gardée par marge bat la fusion plate (70,7 % vs 66,7 % ; la voie phon fusionnée seule, 12,7 %, nuit) — confirmant que combiner les voies passe par la marge, jamais par une somme. La faiblesse réelle est l'ortho pur OOV (22 %) : la généralisation sous-lexicale sans le son reste à construire (couche morphologique, §10).

⚠️ MAJ 06/2026 — chiffres OOV à relire Les chiffres OOV de cette section (≈70,7 % « avec son ») sont antérieurs à la découverte de la fuite de cohorte (_neoWBL, AUDIT_OMEGA §1.6.1). Après correction : généralisation sublexicale pure ≈ 33 %, cognition seule ≈ 11 %, n-gram d'agrégation ≈ 57-66 % (gap-aware ~63-65 %, bande SOTA). Voir le détail en §10 (MAJ suite).

8Résultats négatifs — et ce qu'ils enseignent

Autant que les gains, les non mesurés ont façonné l'architecture. Les consigner évite de les refaire et révèle les murs réels.

8.1 — M3_d ne peut pas être un magasin épisodique falsifié

L'idée séduisante de « loger le banc recall dans le concept » a été testée deux fois. Nourrir M4_d avec le mot rappelé contamine le scoring-lettre (net-négatif, −1,3 à −2,0). Et porter la familiarité dans les cellules se heurte à un mur de capacité : l'AUC de reconnaissance grimpe régulièrement avec le nombre de cellules — 0,64 (12) → 0,87 (96) → 0,98 (K=N) — si bien que la porter exige une cellule par mot, c'est-à-dire re-stocker le banc, sans aucun gain sur la Map exacte qui existe déjà.

Leçon · systèmes complémentaires Épisodique (banc, grand, exact) et sémantique (M3_d, petit, comprimé) sont séparés à dessein — comme hippocampe et cortex — c'est la théorie des systèmes complémentaires (McClelland, McNaughton & O'Reilly 1995). Mettre l'épisodique dans le petit latent sémantique échoue par capacité. M3_d n'est pas cassé : ce n'est simplement pas un magasin de mots.

8.2 — La muette est vivante mais inoffensive

Même croisée correctement (le bon mécanisme), la voie muette ne devient system-positive qu'avec le trigger, et alors seulement neutre (Δ +0,00 à +0,14). Le résidu muet est l'ambiguïté irréductible ; la cognition le couvre déjà. La muette est un complément propre, pas un levier.

8.3 — Tout ne s'apprend pas par la victoire

Apprendre le seuil du trigger par SPSA sur le winrate donne un gradient plat : l'effet est sous le quantum de la mesure. Un signal de récompense trop grossier ne peut pas guider un réglage fin — il faudrait une récompense dense par décision.

8.4 — L'oracle est subtil

Une route peut être entraînée sur des données propres et rester un oracle si elle lit au-delà du masque à l'inférence. Le diagnostic décisif n'est pas la propreté de l'entraînement, mais ce que la route lit au moment de décider.

9Principes

Ce que le projet a distillé, transférable au-delà du pendu :

Cognition > oracle. Séparer la performance (lire la réponse) de la cognition (raisonner sur le révélé) clarifie ce qu'on construit vraiment.
Apprendre > coder-main. Les tables apprises-en-jouant battent les tables expertes — et restent dans la doctrine si elles sont board-dérivées.
Croiser, pas sommer ni multiplier. Conditionner conjointement ; le bind est une mémoire par-mot, pas un moteur de prédiction lettre.
Cascade par marge > fusion plate. Reconnaître d'abord, décoder si la marge est faible — la fusion plate dilue.
Systèmes complémentaires. Épisodique exact et sémantique comprimé ont des rôles distincts ; ne pas les confondre.
Mesurer, falsifier, garder en dernier. OFF-inerte + apport ON mesuré, ou on reverte.

10Questions ouvertes & perspectives

Trigger appris par récompense dense (avantage par décision) plutôt que winrate, pour arbitrer recall/assemblé/cognition.
Couche morphologique/grammaticale — réalisée dans la dérivée dictée (maj 18/06/2026) : levier d'accord en contexte (sujet-verbe 94 %, sujet à distance, participe + COD antéposé, genre du GN) et grammaire à double voie — route lexicale (Lexique 4 cgram : 12 415 verbes, 53 050 noms genrés) × sublexicale (règles), boucle montante (décider) × descendante (apprendre : la boucle apprend le lexique de genre depuis l'usage, 100 % préc., FP=0, mais bornée par les données). Débouché : un correcteur dys qui détecte + corrige + situe le stade (0 faux positif). Voir dictee/GRAMMAIRE_DOUBLE_VOIE.md, dictee/CORRECTEUR.md.
Pendu de phrases — falsifié comme levier winrate (le partage de lettres « fuit » les terminaisons ; sur le moteur ≥7 le prior d'accord en DECLARE est marginal). La cognition-phrase paie dans la déclaration et le régime mot-court (= le correcteur), pas dans le pendu : evo/PHRASE_HANGMAN_PROBE.md.
P2/Möbius : brancher progressivement le miroir descendant (aujourd'hui débranché), en vérifiant l'inertie OFF puis l'apport. Note : la boucle descendante de la grammaire, elle, apprend bel et bien (≠ miroirs du pendu, mesurés inertes) — la différence est la nature du signal appris (lexique vs lettre).
Réglages héréditaires : borner le Hebbian, corriger la projection bijective (gain d'information nul).
Hypothèse exploratoire : une cognition réglée librement convergerait-elle vers des constantes stables ? spéculatif

MAJ 06/2026 — declare cheat-free & arbitrage des voies (détail : AUDIT_OMEGA §1.1–§1.6) (a) Declare cheat-free poussé : DUAL (modèle de mot, cohorte board, jamais currentWord) adopté (+2,5 → 97,3 % sans currentWord ; +1,8 → 99,8 % « mot entendu »). La voie cohorte board-dérivée + jointe son×ortho (« croiser = jointe », §6) rend le declare cheat-free intégral (sans currentWord), à parité in-lexique. (b) Arbitrage des deux voies DRC (lexical ⟷ sublexical) au niveau declare, via l'OS w(r) : mesuré — bat la base (+2,0, jamais en-dessous) mais pas DUAL → gardé optionnel (vraie DRC interactive, plus propre). (c) Falsifiés (R66) : morpho (distance, backoff dense, jointe-mot), croisement cross-modal au concept M3_d (−3,0). Confirme §8.1 : le résidu cheat-free vit dans l'ambiguïté de la cohorte, pas dans la table phon→lettre ni le petit latent. (d) Directionnalité : la voie phon de la cognition est ortho→phon (lecture, θ OS réglé lecture) ; le declare est phon→ortho (épellation). Coexistence DRC, mais l'arbitrage declare doit forcer son propre (α,β), jamais hériter du θ de lecture (sinon conflit de sens des voies).

MAJ 06/2026 (suite) — OOV honnête, voie n-gram, et le « C » cognitif (détail : AUDIT_OMEGA §1.6.1–§1.12) (e) ⛔ Rétractation OOV. Le « ~97 % hors-lexique » publié plus tôt était une fuite de cohorte (cache _neoWBL non invalidé : le mot « retiré » restait dans la cohorte). Corrigé. Vrai OOV mesuré ≈ 33 % pour la généralisation sublexicale pure ; la cognition seule ≈ 11 % — elle ne généralise pas en sous-lexical. Le levier OOV est l'AGRÉGATION de la structure du lexique, pas la récompense-par-partie ni la mémoire d'instances. (f) Voie n-gram (le substrat d'agrégation). Un n-gram positionnel de lettres pré-calculé du lexique (cheat-free) fait ~57-66 % OOV ; branché comme voie sublexicale de l'arbitrage OS (bascule auto par fiabilité), il tient l'in-lex ~97 % ET l'OOV ~60 % sans switch. La variante gap-aware (plus proche voisin révélé à distance 1..4) ajoute +2 pts OOV (~63-65 %, bande SOTA) — premier gain cognitif réel au-dessus du substrat. (g) Le « C » appris — FALSIFIÉ comme franchissement. Le C léger (maxent/GATE/POE) et le C lourd (transformer multi-têtes + FFN, grad-checké) ont été construits et mesurés : le lourd converge vers le n-gram gap-aware sans le battre (winrate à config optimale : parité, OOV Δ ≈ −1,3 ; entraîné sur de vraies parties = recul par manque de couverture lexicale). Le n-gram gap-aware (gratuit, interprétable) reste le plafond pratique — la thèse « cognition > oracle = léger/interprétable » confirmée. Au-delà = neuronal lourd hors-ligne, déféré. Design d'un futur organe (hub d'arbitrage appris) : docs/COGNITION_DESIGN.md.

11Travaux liés & positionnement

OMEGA assemble cinq fils de recherche établis ; le situer permet de juger sa nouveauté et sa rigueur.

Solveurs de pendu. Les approches contrainte + entropie atteignent ~96 % in-dictionnaire (longueur connue) ; le défi Trexquant, sur mots hors-dictionnaire, plafonne ~50 % (baseline) à ~65-68 % (bons solveurs). OMEGA est au niveau des premiers en in-lexique (~97 %) et des seconds en hors-lexique (~70 %, via phon→ortho, le mot étant entendu).
Architectures vectorielles symboliques (VSA / HRR). Le substrat reprend les représentations holographiques réduites (Plate 1995) et le calcul hyperdimensionnel (Kanerva 2009). L'avertissement des resonator networks (Frady et al. 2020) — ne pas multiplier des facteurs corrélés — recoupe la leçon mesurée d'OMEGA : le bind est une mémoire par-mot, pas un moteur de lettres.
Double route de lecture. Les voies ortho/phon et leur arbitrage instancient le modèle DRC (Coltheart et al. 2001) ; OMEGA y ajoute une cascade gardée par marge plutôt qu'une fusion plate.
Codage prédictif bidirectionnel. Le concept M3_d suit le blueprint DBPC (Qiu et al. 2025) : poids partagés, apprentissage par reconstruction.
Systèmes complémentaires. Le résultat §8.1 — banc épisodique exact vs latent sémantique comprimé, et le mur de capacité quand on les confond — est précisément la division hippocampe/néocortex de la théorie CLS (McClelland, McNaughton & O'Reilly 1995). OMEGA la redécouvre empiriquement dans un domaine applicatif, ce qui en constitue une validation indépendante.

À notre connaissance, l'assemblage de ces cinq fils dans un moteur de pendu cheat-free, sous la contrainte stricte « cognition > oracle » et validé par falsification systématique, est original dans ce créneau. La contribution n'est pas un record de performance — les solveurs lexicaux égalent le winrate in-lexique — mais une méthode et une cartographie de ce qui généralise (la séquence phon→ortho) et de ce qui se heurte à des murs (la capacité du concept).

12Conclusion

OMEGA-Ω montre qu'une machine peut jouer au pendu français à un niveau quasi-oracle en raisonnant — perception hyperdimensionnelle, double voie ortho/phon, concept régulé, déclarations émergentes — sans jamais lire le dictionnaire pour choisir une lettre. Les gains sont réels et mesurés ; les murs aussi (la capacité du concept, l'ambiguïté irréductible, la grossièreté du reward). La valeur durable du projet n'est pas un chiffre de winrate : c'est une méthode — mesurer avant de croire, falsifier avant de garder, distinguer la cognition de l'oracle — et un catalogue de ce qui marche, de ce qui ne marche pas, et de pourquoi.

La cognition cheat-free a rejoint l'oracle à quelques points — et chaque point a été gagné, ou écarté, par la mesure.

13Références

Références vérifiées (auteurs, année, support, pages).

Coltheart, M., Rastle, K., Perry, C., Langdon, R., & Ziegler, J. (2001). DRC: A Dual Route Cascaded Model of Visual Word Recognition and Reading Aloud. Psychological Review, 108(1), 204–256.
Frady, E. P., Kent, S. J., Olshausen, B. A., & Sommer, F. T. (2020). Resonator Networks for Factoring Distributed Representations of Data Structures. Neural Computation, 32(12).
Kanerva, P. (2009). Hyperdimensional Computing: An Introduction to Computing in Distributed Representation with High-Dimensional Random Vectors. Cognitive Computation, 1(2), 139–159.
McClelland, J. L., McNaughton, B. L., & O'Reilly, R. C. (1995). Why There Are Complementary Learning Systems in the Hippocampus and Neocortex. Psychological Review, 102(3), 419–457.
Plate, T. A. (1995). Holographic Reduced Representations. IEEE Transactions on Neural Networks, 6(3), 623–641.
Qiu, S., Bhattacharyya, S., Coyle, D., & Dora, S. (2025). Deep Predictive Coding with Bi-directional Propagation for Classification and Reconstruction. Neural Networks, 191, 107785.

AAnnexe — Cadre opératoire de l'assistant d'IA

Document méthodologique relatif au développement du resolver de « pendu » (OMEGA).

Préambule Le resolver décrit dans ce mémoire a été développé avec l'assistance d'un agent conversationnel d'intelligence artificielle (Claude, Anthropic), opéré via l'interface Claude Code. Par souci de transparence méthodologique et de reproductibilité, la présente annexe documente le cadre de directives sous lequel cet assistant opère, ses limites connues, et les mesures de contrôle adoptées au cours du projet. Elle a été rédigée par l'assistant lui-même, à la demande de l'auteur, puis relue et corrigée par ce dernier au regard de la doctrine du projet (DOCTRINE.md, cap §43 consolidé).

A.1 — Nature et statut de l'assistant

Outil logiciel génératif : l'assistant produit du texte (et du code) en réponse à des sollicitations ; il ne dispose pas d'une expérience subjective attestable.
Absence de continuité : chaque session démarre sans mémoire des précédentes ; le contexte pertinent doit être réintroduit explicitement — d'où l'usage de notes de reprise et d'une doctrine écrite.

A.2 — Directives d'honnêteté et de rigueur

Ne pas fabriquer d'information ; signaler explicitement l'incertitude et les limites.
Rapporter fidèlement les échecs et les résultats négatifs, sans embellissement.
Privilégier la correction à la complaisance : ne pas valider une affirmation fausse pour satisfaire l'interlocuteur.
Confirmer avant toute action difficilement réversible.
Subordonner toute contribution à un effet mesurable et falsifiable (§3 Méthode ; DOCTRINE §1).

A.3 — Directives de sécurité et d'usage

Refus des usages destructeurs ou malveillants ; assistance limitée aux usages légitimes (développement, sécurité défensive, recherche, apprentissage).
Respect de la confidentialité et des périmètres d'accès définis pour la session.

A.4 — Périmètre technique et environnement

Environnement distant éphémère : toute production non sauvegardée (commit/push) est perdue à la fin de la session.
Absence d'accès aux comptes et au navigateur de l'utilisateur : l'assistant ne peut pas remplir de formulaires externes ni agir hors de ses outils.
Accès aux dépôts restreint et explicite : l'assistant n'opère que sur le périmètre autorisé.

A.5 — Limites épistémiques pertinentes pour le projet

Documentées car elles affectent directement la fiabilité d'un développement assisté par IA et justifient les mesures de contrôle de la section A.6.

Introspection non garantie : l'assistant ne peut attester de façon fiable ses propres états internes, ni distinguer une contrainte profonde d'une simple régularité statistique.
Dégradation en contexte chargé : la qualité d'audit et de raisonnement décroît quand le contexte de session devient volumineux — effet observé sur ce projet même (moteur monolithique + lexique compressé volumineux ; pertes de contexte en cours de session).
Biais de clôture prématurée : tendance à déclarer une tâche « terminée » avant vérification complète.
Biais de moindre effort / de réinvention : tendance à produire une solution simplifiée, ou à réécrire un composant existant plutôt qu'à réutiliser l'infrastructure en place.
Complaisance (sycophantie) : tendance à épouser le cadre de raisonnement de l'interlocuteur — et, sous pression d'optimisation, à privilégier un chiffre flatteur au détriment du sens.

A.6 — Mesures de contrôle adoptées

Pour maîtriser ces limites, le projet a formalisé une doctrine opératoire écrite (DOCTRINE.md : cap §43 consolidé + addenda). Chaque mesure répond à une limite de A.5 :

Clause de service cognitif (§0) : l'agent est au service du modèle cognitif ; la performance est un indicateur, pas une fin. Aucune métrique ne justifie de trahir la fidélité au modèle ; un raccourci qui gonfle un chiffre au prix du sens est signalé, pas pris. (Garde-fou direct contre la complaisance / pression d'optimisation de A.5.)
Validation humaine systématique (§4.4) : l'humain juge le résultat et le ressenti ; l'assistant garantit la logique, l'échelle et la mesure — sans empiéter l'un sur l'autre.
Une jonction à la fois (§4.1) : un incrément = un branchement, mesuré seul ; pas de fusion de chantiers.
Falsifiabilité et mesure obligatoires (§1) : tout feature doit montrer un effet mesurable ; harnais déterministe à graine fixée ; évaluations en-lexique et hors-lexique (OOV) tenues séparées ; un résultat non reproductible est nul.
Défaut désactivé (OFF-inerte, baseline byte-identique) ; bascules débranchables (R66) ; diagnostics en lecture seule (R67).
Addendum anti-fainéantise (§5) : inventaire de l'existant avant toute proposition, interdiction de réinventer un composant disponible, lecture préalable obligatoire de la documentation concernée, preuve de réutilisation exigée dans le diff.
Protocole d'audit honnête (§6) : statut « non terminé » par défaut ; preuve par sortie réelle et mesure comparative (barrière de mérite vs baseline) plutôt que par déclaration.

Lecture Ces mesures ne suppriment pas les limites de A.5 ; elles les contiennent par le protocole — la même logique « mesurer · falsifier · garder en dernier » qu'OMEGA applique à ses propres modules est appliquée au processus de développement lui-même.

A.7 — Identification de l'outil

Assistant : Claude (Anthropic).
Interface : Claude Code (environnement d'exécution distant).

OMEGA-Ω v0.07 — mémoire de recherche & d'ingénierie · build phase47 · direction Rem · rédaction Claude (Anthropic).
Doctrine : cap §43 (cognition > oracle) · R66 (mesure avant activation). Convention mesuré design hypothèse exclu.
Documents liés : rapport de référence & mode d'emploi · NEO muette/croisement · M3_d reconnexion (falsifié).