Fable Week - 1 Day · Structural Improvement · 2026-07-03

모델이 바뀌어도
하네스는 남는가

Fable 5는 7월 7일 만료된다. 이 모델의 마지막 주간을, 사라질 판단(1.6%)을 사라지지 않을 결정론 인프라(98.4%)로 옮겨 심는 데 썼다. 5일간 rule을 절반 이하로 줄이고, 막은 위반을 100%로 올리고, 행동을 검증하는 probe를 세우고, 매일 독립 검증을 통과시켰다. 이 페이지는 그 기록이자, "모델 비종속 substrate"라는 주장의 실증이다.

242→91

Active Rules (−527KB)

94.7→100

Replay Block Rate

0→9

Practice Probes

5/5

일일 독립검증 통과

The Premise

왜 만료가 위기가 아닌가

하네스는 두 층으로 되어 있다. 위층은 판단 — 추론 엔진(Fable 5)이 내리는 결정이고, 전체의 1.6%다. 아래층은 결정론 인프라 — shell·markdown·exit code로 굳어진 규칙·게이트·측정이고, 98.4%다. 7월 7일에 사라지는 것은 위층의 상한뿐이다. 아래층은 추론 엔진이 무엇이든 동일하게 차단하고 동일하게 측정한다. 그러므로 전략은 하나다 — 남은 기간 Fable의 판단을 최대한 아래층으로 옮겨 심는 것.

하네스 2층 구조 — 만료되는 것은 판단(1.6%)의 상한뿐, 결정론 substrate(98.4%)는 추론 엔진과 무관하게 남는다

SOFT는 무의미, HARD(exit 2)만 강제

rule이 "무엇을 하라"면 hook은 "안 하면 못 지나간다"

완료 = 증거 계약 (anti-Goodhart)

완료는 말이 아니라 계약 — DONE→EVIDENCE→REVIEWER

부피가 아니라 역량을 측정

rule 개수(아티팩트)가 아니라 끝낸 작업·줄인 마찰(엔진)

정직한 측정

presence ≠ VERIFIED, 측정 불가는 NA(fail-loud), grep 천장 자인

모델 비종속 혈통

계승되는 것은 코드가 아니라 rules + memory + 게이트 + 철학

Five Days

판단을 인프라로

5일 전부가 같은 사이클의 반복이다. Fable이 판단하고(무엇을 증류할지, 어떤 위반을 잡을지, 무엇을 측정할지), 그 판단을 shell·exit code로 결정화하고, 구현자가 아닌 독립 리뷰어가 적대적으로 재검증하고, 마지막으로 동일 스크립트로 재측정해 delta를 숫자로 남긴다. "좋아진 것 같다"는 이 사이클을 통과하지 못한다.

일일 이식 사이클 — 판단(1.6%)이 만든 것을 결정론(98.4%)으로 굳히고, 독립 검증과 재측정으로만 통과시킨다

D1컨텍스트 신진대사 대수술GAP-1 · 원칙 4·10

242 rule 중 165개가 knowledge/와 바이트 동일 중복 — 매 세션 ~820KB 재주입 발견
삼분류 triage: 행동 지시 1~3줄 증류 44 / knowledge 강등 / HARD 승격 후보. coverage-map으로 제거 완전성 결정론 검증
rule-budget 게이트 신설 — Codex 적대 리뷰 4라운드로 의미론 수렴(상쇄 우회·위장 증류 봉쇄)

rules 242→91 · 1,026,908B→488KB (−527KB) · integrity/conformance 무회귀

D1 컨텍스트 신진대사 — 삼분류 triage로 242→91, 제거 완전성은 coverage-map으로·재발은 budget 게이트로 결정론 방어

D2검증 자산 구축 — Fable as TeacherGAP-2·3 · 원칙 2·9

replay corpus 확충: no-env-commit 우회(git -c 중간토큰) 등 위반 시나리오 → fixture 5종 추가
기능 삭제 감지: requirements-lock-guard — 잠긴 요구 시그니처 소실 시 exit 2 (완료 편향의 최대 맹점 차단)
practice probe suite: 스킬 파이프라인 6종의 결정론 계약 8 probe, Fable이 gold label 확정

replay 94.7→100.0 (24 fixture) · probe 8/8 PASS · 기능삭제 fixture 4/4

D3행동 eval + 주간 점수판GAP-2·4·6 · 원칙 4·9

weekly-scoreboard(cron): integrity 3축 + conformance + probe + 주입량 + 2계정 커밋 + 비용 + autonomy. 측정불가는 NA(fail-loud)
agent regression probe 5종: 프롬프트 회귀 smoke — 근본원인·SQL injection·브라우저QA·localStorage금지·parameterized 계약 소실 검출. 모델 고정으로 변인 분리
agent .md 수정 시에만 조건부 트리거 hook — 독립검증이 dead 0.0→3.2 회귀 발견 → 근본(텔레메트리 래퍼 누락) 수정

agent probe 5/5 · scoreboard 첫 기록 + cron 등록 · dead 0.0 복원

D4표면 정리 + 사이트 큐레이션GAP-7·8 · 원칙 10

/loopy:start·/loopy:auto 래퍼 — 완성된 엔진(init→team→qa / qa-cycle→self-improve→eval)을 단일 동작으로 잇는 얇은 표면
사이트 E7: footer 누락 9페이지 삽입 + 3개월 stale 날짜 갱신 + site-conformance 등재 게이트
git 이력 재작성 계획서 (.git 131MB→<60MB) — 비가역이라 계획·검증·백업 절차만, 실행은 승인 후

loopy P0 2→0 · footer 9/9 렌더 확인 · 등재 게이트 통과/차단/EXEMPT 검증

D5모델 전환 리허설 + 결산GAP-9 · 원칙 11

Fable 마지막 adversarial self-audit 3렌즈(우회/측정정직/철학정합): replay가 rate만 검사해 fixture 삭제로 100% 게임 가능 발견 → corpus-floor probe로 즉시 봉쇄
전환 체크리스트: fable→opus-4-8은 inherit 시맨틱으로 delegation 코드 수정 0 — 이것이 원칙 11의 구현
decision-history: 7개 결정 + 기각된 대안 8건 영속 기록 (다음 세션이 근거 재발견 방지)

probe 8→9 (게임 벡터 봉쇄) · 5일 delta 확정 · 매일 독립검증 6/6

Verification Assets

무엇이 지키고 있는가

이번 주간이 남긴 것은 rule 다이어트만이 아니다. 행동을 검증하는 자산 3층이 새로 섰다. 각 층은 서로 다른 실패를 잡는다 — 과거에 실제로 뚫렸던 위반(replay), 파이프라인 계약의 조용한 부패(probe), 그리고 "완료"를 위해 기능을 몰래 지우는 완료 편향(requirements-lock). 셋 다 exit code로 판정되고, weekly-scoreboard가 매주 기록한다.

검증 자산 3층 + 주간 점수판 — 과거 위반(replay) · 계약 부패(probe) · 완료 편향(lock)을 서로 다른 층에서 잡는다

The Delta

전부 결정론 측정

"좋아진 것 같다"는 없다. D1 baseline과 D5 final을 동일 스크립트로 측정한 숫자만 있다.

지표	D1 (7/3 01:09)	D5 (7/3 18:25)	delta
replay_block_rate	94.7	100.0	+5.3
replay corpus	19	24 +floor	게임방지
active rules	242 / 1,026,908B	91 / 488KB	−151 / −527KB
dead_hook_ratio	0.0	0.0	유지
conformance ENFORCED	5 · GAP 0	5 · GAP 0	+기능삭제 게이트
probe suite	0	9 / 9	+9
weekly scoreboard	없음	cron 가동	+1
loopy-v2 P0 GAP	2	0	−2

Adversarial Verification

교차검증이 실제로 잡은 버그

Codex 적대 리뷰(D1 budget 4라운드)와 독립 subagent 검증(D2~D5 매일)이 발견한 것들. 단일 모델 맹점을 봉쇄하지 않았다면 이 중 다수가 "통과"로 착지했을 것이다 — 원칙 8의 실증.

guardrail silent 소실 — knowledge/ 무증류 삭제 시 행동 제약이 조용히 사라짐 (D1 R1 HIGH)
net-zero 상쇄 우회 — budget 게이트를 add+delete 상쇄로 뚫기 (D1 R2)
위장 증류 + 단위 모호 — 거대 증류본 1개로 바이트 증가해도 통과 (D1 R4)
forbid 오탐 — agent가 안티패턴을 올바르게 설명한 문장을 회귀로 오인 (D3)
dead 래퍼 누락 — 신규 hook을 텔레메트리 래퍼 없이 등록해 발화 미로깅 (D3)
replay 게임 벡터 — rate만 검사해 fixture 삭제로 커버리지 붕괴 은폐 가능 (D5 self-audit)

The Rehearsal

전환은 이벤트가 아니라 측정이다

모델 전환의 성공 기준을 미리 결정론으로 박아뒀다 — 동일 스크립트를 두 체제에서 실행해 substrate 지표가 delta 0이면, "모델 비종속"은 주장이 아니라 측정이 된다. D5 리허설(동일 체제 재측정)에서 8종 전부 delta 0을 확인했고, 7/8 Opus 4.8 체제에서 같은 스크립트가 다시 돈다.

전환 리허설 — 성공 기준을 사전에 결정론으로 고정: 두 체제 × 동일 스크립트 × substrate 8종 delta 0

"절대로 LLM을 믿지 마세요. 늘 의심하고, 증거 없는 결과가 통과되지 않는 구조를 요구하세요."

Fable 5의 판단이 만든 것은 전부 shell·markdown·exit code로 결정화됐다. 7/8 Opus 4.8 체제에서 동일 eval 3종(conformance·probe·integrity)을 재실행해 게이트 substrate가 변하지 않으면, 그 자체가 "모델 비종속 substrate" 주장의 실증이다. 잃는 것은 1.6%(판단)의 상한이지, 98.4%(강제)가 아니다.

진행 (D365 실행): 동일 스크립트 재측정 리허설에서 substrate 8종 (replay 100.0·corpus 24/24·ENFORCED 5·GAP 0·probe 9/9·dead 0.0·registered 31)이 전부 delta 0으로 확인됐다 — 아직 동일-체제(fable-5) 재측정이므로 "결정론"의 실증이고, 실제 Opus 4.8 전환 재측정(7/8 예정)에서도 delta 0이면 "모델 비종속"이 완성된다.

The Horizon

D365 — 이후 1년

5일이 "판단을 결정론으로 이식"의 단거리였다면, 다음 1년은 그것을 분기별 마일스톤 + 연간 누적 측정으로 지속시키는 장거리다. 고정 계획이 아니라 — 매 분기 weekly-scoreboard 추세로 다음 분기를 재결정한다(마찰이 로드맵을 결정).

전환 흡수 + 측정 신진대사

7/8 재측정으로 모델 비종속 실증 · agent probe 5→15 · autonomy 축 실측 연결

폐루프 자동화 심화

/loopy:auto 무인화 · probe를 self-improve HARD 게이트로 · 비용 거버넌스

지식 그래프 + 예측타당성

측정이 배포를 예측하는가(ρ≥0.5) · rule 관계 그래프로 Curator 자동화 · 사이트=살아있는 계기판

확장성 실험 + 연간 결산

개인→조직 소규모 탐침 · 12개월 추세 분석 · 다음 로드맵을 마찰 데이터로 재설계

모델이 바뀌어도하네스는 남는가

모델이 바뀌어도
하네스는 남는가