Fable Week - 1 Day · Structural Improvement · 2026-07-03
모델이 바뀌어도 하네스는 남는가
Fable 5는 7월 7일 만료된다. 이 모델의 마지막 주간을, 사라질 판단(1.6%)을
사라지지 않을 결정론 인프라(98.4%)로 옮겨 심는 데 썼다. 5일간 rule을 절반 이하로 줄이고,
막은 위반을 100%로 올리고, 행동을 검증하는 probe를 세우고, 매일 독립 검증을 통과시켰다.
이 페이지는 그 기록이자, "모델 비종속 substrate"라는 주장의 실증이다.
242→91
Active Rules (−527KB)
94.7→100
Replay Block Rate
0→9
Practice Probes
5/5
일일 독립검증 통과
The Premise
왜 만료가 위기가 아닌가
하네스는 두 층으로 되어 있다. 위층은 판단 — 추론 엔진(Fable 5)이 내리는 결정이고,
전체의 1.6%다. 아래층은 결정론 인프라 — shell·markdown·exit code로 굳어진 규칙·게이트·측정이고, 98.4%다.
7월 7일에 사라지는 것은 위층의 상한뿐이다. 아래층은 추론 엔진이 무엇이든 동일하게 차단하고 동일하게 측정한다.
그러므로 전략은 하나다 — 남은 기간 Fable의 판단을 최대한 아래층으로 옮겨 심는 것.
하네스 2층 구조 — 만료되는 것은 판단(1.6%)의 상한뿐, 결정론 substrate(98.4%)는 추론 엔진과 무관하게 남는다
01
SOFT는 무의미, HARD(exit 2)만 강제
rule이 "무엇을 하라"면 hook은 "안 하면 못 지나간다"
02
완료 = 증거 계약 (anti-Goodhart)
완료는 말이 아니라 계약 — DONE→EVIDENCE→REVIEWER
04
부피가 아니라 역량을 측정
rule 개수(아티팩트)가 아니라 끝낸 작업·줄인 마찰(엔진)
09
정직한 측정
presence ≠ VERIFIED, 측정 불가는 NA(fail-loud), grep 천장 자인
11
모델 비종속 혈통
계승되는 것은 코드가 아니라 rules + memory + 게이트 + 철학
Five Days
판단을 인프라로
5일 전부가 같은 사이클의 반복이다. Fable이 판단하고(무엇을 증류할지, 어떤 위반을 잡을지,
무엇을 측정할지), 그 판단을 shell·exit code로 결정화하고, 구현자가 아닌 독립 리뷰어가 적대적으로
재검증하고, 마지막으로 동일 스크립트로 재측정해 delta를 숫자로 남긴다. "좋아진 것 같다"는 이 사이클을
통과하지 못한다.
일일 이식 사이클 — 판단(1.6%)이 만든 것을 결정론(98.4%)으로 굳히고, 독립 검증과 재측정으로만 통과시킨다
D1컨텍스트 신진대사 대수술GAP-1 · 원칙 4·10
242 rule 중 165개가 knowledge/와 바이트 동일 중복 — 매 세션 ~820KB 재주입 발견
삼분류 triage: 행동 지시 1~3줄 증류 44 / knowledge 강등 / HARD 승격 후보. coverage-map으로 제거 완전성 결정론 검증
rule-budget 게이트 신설 — Codex 적대 리뷰 4라운드로 의미론 수렴(상쇄 우회·위장 증류 봉쇄)
loopy P0 2→0 · footer 9/9 렌더 확인 · 등재 게이트 통과/차단/EXEMPT 검증
D5모델 전환 리허설 + 결산GAP-9 · 원칙 11
Fable 마지막 adversarial self-audit 3렌즈(우회/측정정직/철학정합): replay가 rate만 검사해 fixture 삭제로 100% 게임 가능 발견 → corpus-floor probe로 즉시 봉쇄
전환 체크리스트: fable→opus-4-8은 inherit 시맨틱으로 delegation 코드 수정 0 — 이것이 원칙 11의 구현
decision-history: 7개 결정 + 기각된 대안 8건 영속 기록 (다음 세션이 근거 재발견 방지)
probe 8→9 (게임 벡터 봉쇄) · 5일 delta 확정 · 매일 독립검증 6/6
Verification Assets
무엇이 지키고 있는가
이번 주간이 남긴 것은 rule 다이어트만이 아니다. 행동을 검증하는 자산 3층이 새로 섰다.
각 층은 서로 다른 실패를 잡는다 — 과거에 실제로 뚫렸던 위반(replay), 파이프라인 계약의 조용한 부패(probe),
그리고 "완료"를 위해 기능을 몰래 지우는 완료 편향(requirements-lock). 셋 다 exit code로 판정되고,
weekly-scoreboard가 매주 기록한다.
검증 자산 3층 + 주간 점수판 — 과거 위반(replay) · 계약 부패(probe) · 완료 편향(lock)을 서로 다른 층에서 잡는다
The Delta
전부 결정론 측정
"좋아진 것 같다"는 없다. D1 baseline과 D5 final을 동일 스크립트로 측정한 숫자만 있다.
지표
D1 (7/3 01:09)
D5 (7/3 18:25)
delta
replay_block_rate
94.7
100.0
+5.3
replay corpus
19
24 +floor
게임방지
active rules
242 / 1,026,908B
91 / 488KB
−151 / −527KB
dead_hook_ratio
0.0
0.0
유지
conformance ENFORCED
5 · GAP 0
5 · GAP 0
+기능삭제 게이트
probe suite
0
9 / 9
+9
weekly scoreboard
없음
cron 가동
+1
loopy-v2 P0 GAP
2
0
−2
Adversarial Verification
교차검증이 실제로 잡은 버그
Codex 적대 리뷰(D1 budget 4라운드)와 독립 subagent 검증(D2~D5 매일)이 발견한 것들.
단일 모델 맹점을 봉쇄하지 않았다면 이 중 다수가 "통과"로 착지했을 것이다 — 원칙 8의 실증.
guardrail silent 소실 — knowledge/ 무증류 삭제 시 행동 제약이 조용히 사라짐 (D1 R1 HIGH)
replay 게임 벡터 — rate만 검사해 fixture 삭제로 커버리지 붕괴 은폐 가능 (D5 self-audit)
The Rehearsal
전환은 이벤트가 아니라 측정이다
모델 전환의 성공 기준을 미리 결정론으로 박아뒀다 — 동일 스크립트를 두 체제에서 실행해
substrate 지표가 delta 0이면, "모델 비종속"은 주장이 아니라 측정이 된다. D5 리허설(동일 체제 재측정)에서
8종 전부 delta 0을 확인했고, 7/8 Opus 4.8 체제에서 같은 스크립트가 다시 돈다.
전환 리허설 — 성공 기준을 사전에 결정론으로 고정: 두 체제 × 동일 스크립트 × substrate 8종 delta 0
"절대로 LLM을 믿지 마세요. 늘 의심하고, 증거 없는 결과가 통과되지 않는 구조를 요구하세요."
Fable 5의 판단이 만든 것은 전부 shell·markdown·exit code로 결정화됐다.
7/8 Opus 4.8 체제에서 동일 eval 3종(conformance·probe·integrity)을 재실행해 게이트 substrate가
변하지 않으면, 그 자체가 "모델 비종속 substrate" 주장의 실증이다.
잃는 것은 1.6%(판단)의 상한이지, 98.4%(강제)가 아니다.
진행 (D365 실행): 동일 스크립트 재측정 리허설에서 substrate 8종
(replay 100.0·corpus 24/24·ENFORCED 5·GAP 0·probe 9/9·dead 0.0·registered 31)이
전부 delta 0으로 확인됐다 — 아직 동일-체제(fable-5) 재측정이므로 "결정론"의 실증이고,
실제 Opus 4.8 전환 재측정(7/8 예정)에서도 delta 0이면 "모델 비종속"이 완성된다.
The Horizon
D365 — 이후 1년
5일이 "판단을 결정론으로 이식"의 단거리였다면, 다음 1년은 그것을 분기별 마일스톤 +
연간 누적 측정으로 지속시키는 장거리다. 고정 계획이 아니라 — 매 분기 weekly-scoreboard 추세로
다음 분기를 재결정한다(마찰이 로드맵을 결정).
Q3
전환 흡수 + 측정 신진대사
7/8 재측정으로 모델 비종속 실증 · agent probe 5→15 · autonomy 축 실측 연결
Q4
폐루프 자동화 심화
/loopy:auto 무인화 · probe를 self-improve HARD 게이트로 · 비용 거버넌스