Fable Week - 1 Day · Structural Improvement · 2026-07-03

모델이 바뀌어도
하네스는 남는가

Fable 5는 7월 7일 만료된다. 이 모델의 마지막 주간을, 사라질 판단(1.6%)을 사라지지 않을 결정론 인프라(98.4%)로 옮겨 심는 데 썼다. 5일간 rule을 절반 이하로 줄이고, 막은 위반을 100%로 올리고, 행동을 검증하는 probe를 세우고, 매일 독립 검증을 통과시켰다. 이 페이지는 그 기록이자, "모델 비종속 substrate"라는 주장의 실증이다.

24291
Active Rules (−527KB)
94.7100
Replay Block Rate
09
Practice Probes
5/5
일일 독립검증 통과
왜 만료가 위기가 아닌가

하네스는 두 층으로 되어 있다. 위층은 판단 — 추론 엔진(Fable 5)이 내리는 결정이고, 전체의 1.6%다. 아래층은 결정론 인프라 — shell·markdown·exit code로 굳어진 규칙·게이트·측정이고, 98.4%다. 7월 7일에 사라지는 것은 위층의 상한뿐이다. 아래층은 추론 엔진이 무엇이든 동일하게 차단하고 동일하게 측정한다. 그러므로 전략은 하나다 — 남은 기간 Fable의 판단을 최대한 아래층으로 옮겨 심는 것.

판단 — 추론 엔진 · 1.6% Fable 5 : 무엇을 증류·차단·측정할지 결정 이 층만 7/7에 사라진다 7/7 만료 Opus 4.8 — 7/8 이후 같은 자리에 끼워진다 inherit — delegation 수정 0줄 교체 판단을 결정화해 이식 — 이 페이지의 5일 결정론 인프라 — substrate · 98.4% · 남는다 rules 91 행동 지시 · 488KB hooks · gates exit 2 강제 · HARD replay · probe 행동 검증 eval memory knowledge · 검색 shell · markdown · exit code — 어떤 추론 엔진에서도 동일하게 작동 잃는 것 = 1.6%의 상한 남는 것 = 98.4%의 강제 게이트는 모델을 모른다 — 위반 입력이 오면 exit 2, 그뿐이다
하네스 2층 구조 — 만료되는 것은 판단(1.6%)의 상한뿐, 결정론 substrate(98.4%)는 추론 엔진과 무관하게 남는다
01
SOFT는 무의미, HARD(exit 2)만 강제
rule이 "무엇을 하라"면 hook은 "안 하면 못 지나간다"
02
완료 = 증거 계약 (anti-Goodhart)
완료는 말이 아니라 계약 — DONE→EVIDENCE→REVIEWER
04
부피가 아니라 역량을 측정
rule 개수(아티팩트)가 아니라 끝낸 작업·줄인 마찰(엔진)
09
정직한 측정
presence ≠ VERIFIED, 측정 불가는 NA(fail-loud), grep 천장 자인
11
모델 비종속 혈통
계승되는 것은 코드가 아니라 rules + memory + 게이트 + 철학
판단을 인프라로

5일 전부가 같은 사이클의 반복이다. Fable이 판단하고(무엇을 증류할지, 어떤 위반을 잡을지, 무엇을 측정할지), 그 판단을 shell·exit code로 결정화하고, 구현자가 아닌 독립 리뷰어가 적대적으로 재검증하고, 마지막으로 동일 스크립트로 재측정해 delta를 숫자로 남긴다. "좋아진 것 같다"는 이 사이클을 통과하지 못한다.

× 5 — D1 컨텍스트 · D2 검증자산 · D3 행동 eval · D4 표면 · D5 전환 리허설 1 · 판단 Fable 5 추론 증류·차단·측정 결정 2 · 결정화 shell · markdown hook · probe · 게이트로 3 · 적대 재검증 독립 subagent · Codex 구현자 자기채점 금지 4 · 재측정 동일 스크립트 delta = 숫자만 사라질 층 발견 6건 → 전부 근본 수정
일일 이식 사이클 — 판단(1.6%)이 만든 것을 결정론(98.4%)으로 굳히고, 독립 검증과 재측정으로만 통과시킨다
D1컨텍스트 신진대사 대수술GAP-1 · 원칙 4·10
  • 242 rule 중 165개가 knowledge/와 바이트 동일 중복 — 매 세션 ~820KB 재주입 발견
  • 삼분류 triage: 행동 지시 1~3줄 증류 44 / knowledge 강등 / HARD 승격 후보. coverage-map으로 제거 완전성 결정론 검증
  • rule-budget 게이트 신설 — Codex 적대 리뷰 4라운드로 의미론 수렴(상쇄 우회·위장 증류 봉쇄)
rules 242→91 · 1,026,908B→488KB (−527KB) · integrity/conformance 무회귀
242 rules · 1,027KB 매 세션 전체 재주입 165개는 knowledge/와 바이트 동일 중복 BEFORE 삼분류 triage 증류 44 — rules/ 유지 행동 지시만 1~3줄로 압축 knowledge 강등 — 로드 밖 전문은 필요할 때만 Read HARD 승격 후보 prose → hook exit 2로 91 rules 488KB −527KB / 세션 AFTER coverage-map — 제거 완전성 검증 242개 전부의 행선지(증류/강등/승격)를 결정론 대조 rule-budget 게이트 — 재-bloat 차단 적대 리뷰 4라운드 수렴 — 상쇄 우회·위장 증류 봉쇄 되돌리기가 아니라 신진대사 — 지식은 보존되고(knowledge/), 로드 경로만 다이어트
D1 컨텍스트 신진대사 — 삼분류 triage로 242→91, 제거 완전성은 coverage-map으로·재발은 budget 게이트로 결정론 방어
D2검증 자산 구축 — Fable as TeacherGAP-2·3 · 원칙 2·9
  • replay corpus 확충: no-env-commit 우회(git -c 중간토큰) 등 위반 시나리오 → fixture 5종 추가
  • 기능 삭제 감지: requirements-lock-guard — 잠긴 요구 시그니처 소실 시 exit 2 (완료 편향의 최대 맹점 차단)
  • practice probe suite: 스킬 파이프라인 6종의 결정론 계약 8 probe, Fable이 gold label 확정
replay 94.7→100.0 (24 fixture) · probe 8/8 PASS · 기능삭제 fixture 4/4
D3행동 eval + 주간 점수판GAP-2·4·6 · 원칙 4·9
  • weekly-scoreboard(cron): integrity 3축 + conformance + probe + 주입량 + 2계정 커밋 + 비용 + autonomy. 측정불가는 NA(fail-loud)
  • agent regression probe 5종: 프롬프트 회귀 smoke — 근본원인·SQL injection·브라우저QA·localStorage금지·parameterized 계약 소실 검출. 모델 고정으로 변인 분리
  • agent .md 수정 시에만 조건부 트리거 hook — 독립검증이 dead 0.0→3.2 회귀 발견 → 근본(텔레메트리 래퍼 누락) 수정
agent probe 5/5 · scoreboard 첫 기록 + cron 등록 · dead 0.0 복원
D4표면 정리 + 사이트 큐레이션GAP-7·8 · 원칙 10
  • /loopy:start·/loopy:auto 래퍼 — 완성된 엔진(init→team→qa / qa-cycle→self-improve→eval)을 단일 동작으로 잇는 얇은 표면
  • 사이트 E7: footer 누락 9페이지 삽입 + 3개월 stale 날짜 갱신 + site-conformance 등재 게이트
  • git 이력 재작성 계획서 (.git 131MB→<60MB) — 비가역이라 계획·검증·백업 절차만, 실행은 승인 후
loopy P0 2→0 · footer 9/9 렌더 확인 · 등재 게이트 통과/차단/EXEMPT 검증
D5모델 전환 리허설 + 결산GAP-9 · 원칙 11
  • Fable 마지막 adversarial self-audit 3렌즈(우회/측정정직/철학정합): replay가 rate만 검사해 fixture 삭제로 100% 게임 가능 발견 → corpus-floor probe로 즉시 봉쇄
  • 전환 체크리스트: fable→opus-4-8은 inherit 시맨틱으로 delegation 코드 수정 0 — 이것이 원칙 11의 구현
  • decision-history: 7개 결정 + 기각된 대안 8건 영속 기록 (다음 세션이 근거 재발견 방지)
probe 8→9 (게임 벡터 봉쇄) · 5일 delta 확정 · 매일 독립검증 6/6
무엇이 지키고 있는가

이번 주간이 남긴 것은 rule 다이어트만이 아니다. 행동을 검증하는 자산 3층이 새로 섰다. 각 층은 서로 다른 실패를 잡는다 — 과거에 실제로 뚫렸던 위반(replay), 파이프라인 계약의 조용한 부패(probe), 그리고 "완료"를 위해 기능을 몰래 지우는 완료 편향(requirements-lock). 셋 다 exit code로 판정되고, weekly-scoreboard가 매주 기록한다.

requirements-lock — 기능 삭제 감지 잠긴 요구의 코드 시그니처가 사라지면 exit 2 "에러를 없애려고 기능을 없애는" 완료 편향의 최대 맹점 차단 · fixture 4/4 practice probe 9종 — 계약이 살아있는가 스킬 파이프라인 6종의 결정론 계약을 실행으로 검사 · gold label은 Fable이 확정 + corpus-floor probe — fixture를 지워 100%를 위조하는 게임 벡터 봉쇄 (D5 발견) replay corpus 24 — 과거 위반의 재생 실제로 뚫렸던 위반 시나리오를 fixture로 박제 → 게이트가 막는지 재생 block rate 94.7 → 100.0 — git -c 중간토큰 우회 등 5종 추가 weekly-scoreboard cron · 매주 자동 integrity 3축 conformance · probe 주입량 · 커밋 · 비용 autonomy 측정 불가 = NA fail-loud — 0이나 평균으로 채워 넣지 않는다 추세가 로드맵을 결정 세 층 전부 exit code 판정 — "통과한 것 같다"가 아니라 0 또는 2
검증 자산 3층 + 주간 점수판 — 과거 위반(replay) · 계약 부패(probe) · 완료 편향(lock)을 서로 다른 층에서 잡는다
전부 결정론 측정

"좋아진 것 같다"는 없다. D1 baseline과 D5 final을 동일 스크립트로 측정한 숫자만 있다.

지표D1 (7/3 01:09)D5 (7/3 18:25)delta
replay_block_rate94.7100.0+5.3
replay corpus1924 +floor게임방지
active rules242 / 1,026,908B91 / 488KB−151 / −527KB
dead_hook_ratio0.00.0유지
conformance ENFORCED5 · GAP 05 · GAP 0+기능삭제 게이트
probe suite09 / 9+9
weekly scoreboard없음cron 가동+1
loopy-v2 P0 GAP20−2
교차검증이 실제로 잡은 버그

Codex 적대 리뷰(D1 budget 4라운드)와 독립 subagent 검증(D2~D5 매일)이 발견한 것들. 단일 모델 맹점을 봉쇄하지 않았다면 이 중 다수가 "통과"로 착지했을 것이다 — 원칙 8의 실증.

  • guardrail silent 소실 — knowledge/ 무증류 삭제 시 행동 제약이 조용히 사라짐 (D1 R1 HIGH)
  • net-zero 상쇄 우회 — budget 게이트를 add+delete 상쇄로 뚫기 (D1 R2)
  • 위장 증류 + 단위 모호 — 거대 증류본 1개로 바이트 증가해도 통과 (D1 R4)
  • forbid 오탐 — agent가 안티패턴을 올바르게 설명한 문장을 회귀로 오인 (D3)
  • dead 래퍼 누락 — 신규 hook을 텔레메트리 래퍼 없이 등록해 발화 미로깅 (D3)
  • replay 게임 벡터 — rate만 검사해 fixture 삭제로 커버리지 붕괴 은폐 가능 (D5 self-audit)
전환은 이벤트가 아니라 측정이다

모델 전환의 성공 기준을 미리 결정론으로 박아뒀다 — 동일 스크립트를 두 체제에서 실행해 substrate 지표가 delta 0이면, "모델 비종속"은 주장이 아니라 측정이 된다. D5 리허설(동일 체제 재측정)에서 8종 전부 delta 0을 확인했고, 7/8 Opus 4.8 체제에서 같은 스크립트가 다시 돈다.

Fable 5 체제 (~7/7) D5 리허설 — 동일 체제 재측정 완료 Opus 4.8 체제 (7/8~) 전환 코드 수정 0줄 — inherit 시맨틱 동일 eval 3종 — conformance · probe · integrity (같은 스크립트, 같은 fixture) replay 100.0 · corpus 24/24 · ENFORCED 5 · GAP 0 probe 9/9 · dead 0.0 · registered 31 · rules 91 substrate 8종 — D5 리허설에서 전부 delta 0 7/8 재측정에서도 delta 0 → "모델 비종속 substrate" 완성 delta ≠ 0 이면? — 그것도 숫자로 남는다. 어느 쪽이든 측정이 판정한다
전환 리허설 — 성공 기준을 사전에 결정론으로 고정: 두 체제 × 동일 스크립트 × substrate 8종 delta 0
"절대로 LLM을 믿지 마세요. 늘 의심하고, 증거 없는 결과가 통과되지 않는 구조를 요구하세요."
Fable 5의 판단이 만든 것은 전부 shell·markdown·exit code로 결정화됐다. 7/8 Opus 4.8 체제에서 동일 eval 3종(conformance·probe·integrity)을 재실행해 게이트 substrate가 변하지 않으면, 그 자체가 "모델 비종속 substrate" 주장의 실증이다. 잃는 것은 1.6%(판단)의 상한이지, 98.4%(강제)가 아니다.

진행 (D365 실행): 동일 스크립트 재측정 리허설에서 substrate 8종 (replay 100.0·corpus 24/24·ENFORCED 5·GAP 0·probe 9/9·dead 0.0·registered 31)이 전부 delta 0으로 확인됐다 — 아직 동일-체제(fable-5) 재측정이므로 "결정론"의 실증이고, 실제 Opus 4.8 전환 재측정(7/8 예정)에서도 delta 0이면 "모델 비종속"이 완성된다.
D365 — 이후 1년

5일이 "판단을 결정론으로 이식"의 단거리였다면, 다음 1년은 그것을 분기별 마일스톤 + 연간 누적 측정으로 지속시키는 장거리다. 고정 계획이 아니라 — 매 분기 weekly-scoreboard 추세로 다음 분기를 재결정한다(마찰이 로드맵을 결정).

Q3
전환 흡수 + 측정 신진대사
7/8 재측정으로 모델 비종속 실증 · agent probe 5→15 · autonomy 축 실측 연결
Q4
폐루프 자동화 심화
/loopy:auto 무인화 · probe를 self-improve HARD 게이트로 · 비용 거버넌스
Q1
지식 그래프 + 예측타당성
측정이 배포를 예측하는가(ρ≥0.5) · rule 관계 그래프로 Curator 자동화 · 사이트=살아있는 계기판
Q2
확장성 실험 + 연간 결산
개인→조직 소규모 탐침 · 12개월 추세 분석 · 다음 로드맵을 마찰 데이터로 재설계