완료를 의심하고, 검증하고, 어긋나면 다음 실행을 바꾸는 루프를 설계할 수 있는가
앞 발표가 구조의 필요성을 만들었다면, 이 발표는 구조와 결과 사이의 검증 루프를 닫는다.
이 발표는 그 하나의 답을 찾는 과정입니다.
도구가 약해서가 아니다. 한 번의 생성으로 끝나는 구조여서다. 우리는 이미 수없이 다시 시켰고, 고쳐 시켰고, 또 어긋났다.
그래서 결과와 완료 메시지는 기본적으로 의심하고 검증해야 한다.
## 절대 규칙 - localStorage 금지 - 완료 전 QA 필수 - 테스트 없이 커밋 금지 → 읽히지만, 실행 중 누락
증거는 "보이는 것"이 아니라 재현·검증 가능한 것이다.
전통 harness는 엔트로피가 증가하고 규칙이 노후화된다. Karpathy의 Loopy Era — 사람이 규칙을 쓰는 게 아니라 AI가 자기 실수를 관찰해 규칙을 스스로 발견하게 만든다.
단순 대화 검색을 넘어야 했다. 요약이 틀리면 원문 회수가 불가하고, 프로젝트 의사결정의 변화를 추적할 수 없다 — 그래서 대화를 재사용 가능한 지식 구조로 변환한다.
context 관리는 저장이 아니라, 다음 실행에 주입할 지식의 수명주기 관리다.
모두가 "AI한테 만들어달라"를 배운다. 프롬프트 한 줄로 만든 앱은 한 줄로 만든 다른 앱과 경쟁할 수 없다 — 둘 다 같은 수준이니까. 차이는 폐루프에서 난다.
이 harness는 L6(폐루프)를 넘어 L7(Work OS)를 지향한다.
그래서 보여줄 장면은 발표 질문에 답하는 증거 기준으로 고른다.
그래서 차이는 모델 능력이 아니라 루프(harness)가 복리로 쌓이는가에서 난다 — 이 harness는 loopy-era의 개인 구현이고, 다음 장면들이 그 증거다.
exit 2로 push가 차단된다그래서 확장은 harness 복제가 아니라, 각 조직·팀의 도메인·목표·workflow를 얹는 문제다.
자동화의 가치는 많이 돌리는 데 있지 않고, 잘못 돌았을 때 배울 수 있는 데 있다.
복제되는 것은 도구가 아니라 "PASS의 기준"이다.
AI를 운영한다는 것은 결과를 믿는 것이 아니라,
결과를 의심하고 다음 실행 조건을 바꾸는 것이다.
감사합니다