Loopy-Era System Architecture

Full System Diagram

세 루프가 맞물린 자가진화 파이프라인

다이어그램 클릭 → 크게 보기

Philosophy

Loopy Era — AI 자동 개선 시대

Andrej Karpathy가 2026년 초에 제안한 개념. "사람이 모든 규칙을 쓰던 시대"는 끝났고, 이제는 AI가 자신의 실수를 관찰해 규칙을 스스로 발견하는 루프가 가능하다는 것. 하네스는 더 이상 정적인 instruction 집합이 아니다. 사용하면 사용할수록 개인의 작업 패턴과 실수 패턴을 흡수해 매 세션마다 더 강해지는 살아있는 시스템이 된다.

Karpathy's Thesis · 2026

AI automatically gets better over time — you don't write the rules anymore, you let the harness discover them from your mistakes.

더 이상 규칙을 직접 쓰지 않는다. 실수로부터 하네스가 규칙을 스스로 발견하도록 만든다. 사람은 실수를 기록하는 방식만 정의하면, 나머지는 시스템이 알아서 학습한다.

— Andrej Karpathy · "The Loopy Era"

Core Principles

5가지 핵심 원칙

01

실수는 학습 시그널

fix: 커밋은 단순한 버그 수정이 아니라 "여기서 내가 실수했다"는 명시적 시그널이다. Stop hook이 이 시그널을 감지해 pending/*.json에 저장하고, 다음 세션에 /self-improve가 fix diff를 분석해 scaffold rule로 결정화한다.

02

Fresh Context > Long Session

장기 세션은 context rot으로 품질이 저하된다. Loopy-Era는 작업을 atomic task로 쪼개고, 상태는 파일 시스템에 persist해 매번 fresh context로 재시작한다. 메모리는 세션이 아니라 memory-bank에 산다.

03

HARD Gate가 없으면 SOFT도 무너진다

자연어 지시(SOFT)는 LLM이 무시할 수 있다. 반드시 지켜야 할 규칙은 exit 2 hook(HARD)으로 물리적 차단해야 한다. SOFT 규칙이 2회 연속 FAIL하면 자동으로 HARD로 승격된다.

04

사용자는 에스컬레이션 시에만 개입

user-proxy 에이전트가 사용자 대신 QA·의사결정·감독을 수행한다. 3회 수렴 실패 · 기술 스택 변경 · 비용 결정 · DB 삭제 같은 되돌릴 수 없는 결정에서만 텔레그램으로 사용자를 호출한다. 나머지는 완전 자동.

05

Closed Loop — 피드백이 돌아와야 진화한다

QA 판정 오류마저 memory-bank에 기록된다. 다음 세션의 self-improve가 이 오류를 읽고 QA 로직 자체를 보정한다. 단순 도구가 아니라 자기 자신을 반성하는 시스템. 이것이 "loopy"라는 이름의 뜻.

The Loop

실수가 규칙이 되는 순환

① 개발 작업

② fix: 커밋 = 실수 시그널

③ Stop hook → pending 저장

④ /self-improve → rule 추출

⑤ scaffold에 추가

⑥ 다음 세션 자동 적용

Loopy Era

자가진화
하네스

↺ infinite cycle

Before & After

전통적 하네스 vs Loopy-Era

Axis

Traditional Harness

Loopy-Era Harness

규칙 작성 주체

사람이 직접 작성 · 유지보수

fix 커밋에서 자동 추출 → self-improve가 도출

시간에 따른 변화

엔트로피 증가 · 규칙 노후화

사용할수록 강해짐 · 죽은 규칙 자동 삭제

실수 처리

일회성 fix · 같은 실수 반복

2회 반복 시 HARD 규칙 승격 · 구조적 차단

컨텍스트 관리

긴 세션 누적 · context rot 발생

Fresh context 반복 · memory-bank에 영구화

QA 책임

사람이 수동 검증

user-proxy + Codex 이중 자동 QA

프로젝트 간 학습

프로젝트별 독립 · 지식 단절

2+ 프로젝트 반복 패턴 → global rules 승격

사용자 개입 빈도

매 단계 확인 · 승인

에스컬레이션 시에만 · 텔레그램 알림

Component Breakdown

루프 구성 요소

① 자가개선 루프

Session N: fix: 커밋 발생 = 실수 시그널
Stop hook → pending/*.json 저장
다음 세션 UserPromptSubmit hook → self-improve 자동 주입
/self-improve: fix diff + memory-bank 분석
결과: scaffold/rules에 새 규칙 자동 추가
Karpathy: "AI automatically gets better over time"

② HARD 강제 장치

qa-gate-before-push: 100% push 차단
scaffold-violation: NEVER DO 패턴 감지
task-quality-gate: UI 변경 시 브라우저 증거 요구
SubagentStop / TaskCompleted: QA 자동 실행
SOFT 2회 FAIL → HARD 자동 승격 규칙
exit 2 = 물리적 차단, 자연어 무시 불가

③ user-proxy Auto QA

모든 작업 완료 후 사용자 대리 QA 수행
3-tool cross: web-qa-tester + agent-browser + expect-cli
Codex 이중 리뷰 (Claude + GPT-5.4)
FAIL 시 bug-fixer 4x 전략 로테이션
3회 수렴 시 Telegram 에스컬레이션
사용자 개입은 에스컬레이션 시에만

핵심 상태 저장소

~/.claude/pending/ — self-improve 트리거
~/.claude/rules/ — 43개 global 규칙 (cross-project)
{project}-scaffold/SKILL.md — 프로젝트별
memory-bank MCP — 2,854 facts, 20 domains
claude-mem-search — 전체 대화 시맨틱 인덱스
상태는 파일로 영구화 (세션 재개 가능)

트리거 이벤트

git fix: commit → Stop hook
UserPromptSubmit → self-improve-check
SubagentStop → user-proxy QA
TaskCompleted → 완료 검증
/loop 10m /auto-issue → GitHub 이슈 자동
이벤트 기반 자가조율 (Claude 판단 불필요)

오케스트레이터 자동 선택

specialist 2개 이하 → manager-orchestrator
specialist 3개+ / 풀스택 → team-orchestrator
파일 1~2개 수정 → 직접 처리
사용자가 /team 명시 → team
모든 경로 끝에 user-proxy QA 필수
사용자 명시 불필요 — 즉시 자동 판정