System Architecture

Loopy-Era
Self-Improvement System

Karpathy의 "AI 자동 개선 시대" 철학을 Claude Code 하네스로 구현한 3축 시스템. fix: 커밋이 실수 시그널이 되고, Stop hook → UserPromptSubmit hook → /self-improve 파이프라인으로 scaffold가 매 세션 자가강화됩니다. HARD gate · user-proxy QA · Codex 이중 리뷰까지, 사용자 개입은 에스컬레이션 시에만 필요합니다.

3
Core Loops
7
HARD Gates
2,854
Memory Bank Facts
43rules
Global Scaffold

세 루프가 맞물린 자가진화 파이프라인

① SELF-IMPROVEMENT LOOP ② HARD ENFORCEMENT GATES ③ USER-PROXY AUTO QA LOOP Session N 개발 작업 git fix: commit (실수 감지 이벤트) Stop Hook self-improve- trigger.sh fix 커밋 감지 pending/ *.json ~/.claude/pending/ Session N+1 새 사용자 요청 additionalContext (pending 주입) UserPromptSubmit self-improve- check.sh 1h 쿨다운 /self-improve skill fix diff 분석 · 마찰 패턴 추출 memory-bank 검색 · scaffold rule 도출 Scaffold + Rules Store {project}-scaffold/SKILL.md ~/.claude/rules/*.md (43 files, cross-project) 2+ 프로젝트 패턴 → global 승격 memory-bank MCP 2854 facts · 20 domains 자동 대화 인덱싱 cross-project 지식 그래프 Edit/Write/Bash hooks · exit 2 = BLOCK (무시 불가) ↺ 강화된 scaffold가 다음 세션에 반영됨 (loopy-era cycle) qa-gate-before-push .qa-cycle-passed 없으면 git push 차단 (100%) scaffold-violation-check NEVER DO 패턴 위반 즉시 감지 (100%) code-quality-check as any / @ts-ignore 즉시 감지 no-localstorage localStorage 사용 즉시 감지 no-env-commit 민감 파일 git add 100% 차단 portless-required dev 서버 portless 누락 경고 (WARNING) task-quality-gate browser_test 미실행 UI 변경 시 차단 SubagentStop hook 서브에이전트 종료 시 user-proxy QA 자동 실행 TaskCompleted hook 태스크 완료 시 완료 검증 자동 self-improve-check 1h 쿨다운 강제 경고 HARD vs SOFT HARD (hook): exit 2 = 물리적 차단 → qa-gate, scaffold-violation 등 SOFT (자연어): Claude 판단 의존 → SKILL.md 절차, 온톨로지 기반 판단 ⚠ SOFT 2회 FAIL → HARD 자동 승격 구현 완료 Trigger 직접 처리 / /manager / /team /auto-issue / /loop / 배포 Build + Type-check npm run build tsc --noEmit L0~L5 QA (3-tool cross) web-qa-tester + agent-browser + expect-cli · screenshot 시각확인 Codex Cross-Review /codex:review --background GPT-5.4 이중 QA ⟳ PASS ? Claude + Codex 양쪽 모두 통과해야 PASS PASS ✓ .qa-cycle-passed git commit + push Telegram ✅ FAIL ✗ bug-fixer 4x Rotation 1차: 직접 수정 · 2차: 구조 변경 · 3차: codex:rescue · 4차: revert + 재시도 매 시도마다 다른 전략 (error-recovery rotation) 성공 시 → QA 재실행 (진전 있는 한 반복) 재QA 루프 🚨 Escalation (3회 수렴 시) 동일 FAIL 3회 반복 → Telegram 알림 전송 또는: 기술 스택 변경 · 비용 결정 · DB 삭제 판단 시 → 사용자 개입 요청 (그 외에는 완전 자동) 📱 Telegram Bot 작업 완료 알림 (소요시간 포함) chat_id: 55511334 🔗 /rc Remote Control Telegram 답장 → Claude Code 세션 원격 지시 라우팅 💾 self-improve 피드백 QA 판단 오류 → memory-bank 학습 다음 세션 자가개선 loop 재진입 🌙 /loop 주기 실행 /loop 10m /auto-issue (GitHub 이슈 자동 처리) /loop 1h /self-improve (hook이 대체하여 불필요) LEGEND Session / User Hook / Skill (Backend logic) State Store / Memory HARD Gate (exit 2) Event Bus / Trigger Decision Point External Service 동기 호출 비동기/루프백 PASS 경로 FAIL / Escalation — Karpathy's "Loopy Era" 철학: AI가 실수에서 자동 학습하여 하네스가 스스로 강해진다
다이어그램 클릭 → 크게 보기

Loopy Era — AI 자동 개선 시대

Andrej Karpathy가 2026년 초에 제안한 개념. "사람이 모든 규칙을 쓰던 시대"는 끝났고, 이제는 AI가 자신의 실수를 관찰해 규칙을 스스로 발견하는 루프가 가능하다는 것. 하네스는 더 이상 정적인 instruction 집합이 아니다. 사용하면 사용할수록 개인의 작업 패턴과 실수 패턴을 흡수해 매 세션마다 더 강해지는 살아있는 시스템이 된다.

Karpathy's Thesis · 2026
AI automatically gets better over time — you don't write the rules anymore, you let the harness discover them from your mistakes.
더 이상 규칙을 직접 쓰지 않는다. 실수로부터 하네스가 규칙을 스스로 발견하도록 만든다. 사람은 실수를 기록하는 방식만 정의하면, 나머지는 시스템이 알아서 학습한다.
— Andrej Karpathy · "The Loopy Era"

5가지 핵심 원칙

01
실수는 학습 시그널
fix: 커밋은 단순한 버그 수정이 아니라 "여기서 내가 실수했다"는 명시적 시그널이다. Stop hook이 이 시그널을 감지해 pending/*.json에 저장하고, 다음 세션에 /self-improve가 fix diff를 분석해 scaffold rule로 결정화한다.
02
Fresh Context > Long Session
장기 세션은 context rot으로 품질이 저하된다. Loopy-Era는 작업을 atomic task로 쪼개고, 상태는 파일 시스템에 persist해 매번 fresh context로 재시작한다. 메모리는 세션이 아니라 memory-bank에 산다.
03
HARD Gate가 없으면 SOFT도 무너진다
자연어 지시(SOFT)는 LLM이 무시할 수 있다. 반드시 지켜야 할 규칙은 exit 2 hook(HARD)으로 물리적 차단해야 한다. SOFT 규칙이 2회 연속 FAIL하면 자동으로 HARD로 승격된다.
04
사용자는 에스컬레이션 시에만 개입
user-proxy 에이전트가 사용자 대신 QA·의사결정·감독을 수행한다. 3회 수렴 실패 · 기술 스택 변경 · 비용 결정 · DB 삭제 같은 되돌릴 수 없는 결정에서만 텔레그램으로 사용자를 호출한다. 나머지는 완전 자동.
05
Closed Loop — 피드백이 돌아와야 진화한다
QA 판정 오류마저 memory-bank에 기록된다. 다음 세션의 self-improve가 이 오류를 읽고 QA 로직 자체를 보정한다. 단순 도구가 아니라 자기 자신을 반성하는 시스템. 이것이 "loopy"라는 이름의 뜻.

실수가 규칙이 되는 순환

① 개발 작업
② fix: 커밋 = 실수 시그널
③ Stop hook → pending 저장
④ /self-improve → rule 추출
⑤ scaffold에 추가
⑥ 다음 세션 자동 적용
Loopy Era
자가진화
하네스
↺ infinite cycle

전통적 하네스 vs Loopy-Era

Axis
Traditional Harness
Loopy-Era Harness
규칙 작성 주체
사람이 직접 작성 · 유지보수
fix 커밋에서 자동 추출 → self-improve가 도출
시간에 따른 변화
엔트로피 증가 · 규칙 노후화
사용할수록 강해짐 · 죽은 규칙 자동 삭제
실수 처리
일회성 fix · 같은 실수 반복
2회 반복 시 HARD 규칙 승격 · 구조적 차단
컨텍스트 관리
긴 세션 누적 · context rot 발생
Fresh context 반복 · memory-bank에 영구화
QA 책임
사람이 수동 검증
user-proxy + Codex 이중 자동 QA
프로젝트 간 학습
프로젝트별 독립 · 지식 단절
2+ 프로젝트 반복 패턴 → global rules 승격
사용자 개입 빈도
매 단계 확인 · 승인
에스컬레이션 시에만 · 텔레그램 알림

루프 구성 요소

① 자가개선 루프

  • Session N: fix: 커밋 발생 = 실수 시그널
  • Stop hook → pending/*.json 저장
  • 다음 세션 UserPromptSubmit hook → self-improve 자동 주입
  • /self-improve: fix diff + memory-bank 분석
  • 결과: scaffold/rules에 새 규칙 자동 추가
  • Karpathy: "AI automatically gets better over time"

② HARD 강제 장치

  • qa-gate-before-push: 100% push 차단
  • scaffold-violation: NEVER DO 패턴 감지
  • task-quality-gate: UI 변경 시 브라우저 증거 요구
  • SubagentStop / TaskCompleted: QA 자동 실행
  • SOFT 2회 FAIL → HARD 자동 승격 규칙
  • exit 2 = 물리적 차단, 자연어 무시 불가

③ user-proxy Auto QA

  • 모든 작업 완료 후 사용자 대리 QA 수행
  • 3-tool cross: web-qa-tester + agent-browser + expect-cli
  • Codex 이중 리뷰 (Claude + GPT-5.4)
  • FAIL 시 bug-fixer 4x 전략 로테이션
  • 3회 수렴 시 Telegram 에스컬레이션
  • 사용자 개입은 에스컬레이션 시에만

핵심 상태 저장소

  • ~/.claude/pending/ — self-improve 트리거
  • ~/.claude/rules/ — 43개 global 규칙 (cross-project)
  • {project}-scaffold/SKILL.md — 프로젝트별
  • memory-bank MCP — 2,854 facts, 20 domains
  • claude-mem-search — 전체 대화 시맨틱 인덱스
  • 상태는 파일로 영구화 (세션 재개 가능)

트리거 이벤트

  • git fix: commit → Stop hook
  • UserPromptSubmit → self-improve-check
  • SubagentStop → user-proxy QA
  • TaskCompleted → 완료 검증
  • /loop 10m /auto-issue → GitHub 이슈 자동
  • 이벤트 기반 자가조율 (Claude 판단 불필요)

오케스트레이터 자동 선택

  • specialist 2개 이하 → manager-orchestrator
  • specialist 3개+ / 풀스택 → team-orchestrator
  • 파일 1~2개 수정 → 직접 처리
  • 사용자가 /team 명시 → team
  • 모든 경로 끝에 user-proxy QA 필수
  • 사용자 명시 불필요 — 즉시 자동 판정