Executive Verdict
Fable-ish의 핵심은 personality가 아니라 검증 루프다. 현재 harness의 hard gate를 낮추지 말고, `$team`의 각 작업 단위에 Fable-ish식 ledger를 붙이는 것이 맞다.
Architecture Comparison
왼쪽은 portable skill package, 오른쪽은 user-scope와 project-scope에 설치된 control plane이다. 가운데 adapter가 `$team`의 task artifact를 확장한다.
Capability Matrix
이 구간은 다이어그램보다 표가 더 명확하다. capability, Fable-ish input, Codex anchor, integration decision을 한 행에서 비교한다.
| Capability | Fable-ish input | Codex anchor | Integration decision |
|---|---|---|---|
| Goal intake | Work unit + observable exit criterion. | Normalized goal object in hard JSON. | Codex wins: ledger goes under the goal object. |
| Completion rule | Proof or explicit blocker only. | Hard validator + QA + audit gates. | Aligned: final report names proof boundary. |
| Dynamic exits | Delta-zero, runtime, deployment boundaries. | Strong gates, weaker per-task labels. | Add `proof_boundary_rung` in plan + QA evidence. |
| Missing harness | Create the smallest proof tool. | Project validators already exist. | Localize `missing_harness_decision` per task. |
| Review lenses | Correctness, removed behavior, contracts. | Acceptance QA + subagent routing. | Add queue only for high-risk work units. |
| Subagents | Output is hypothesis. | Bounded ownership, no stale model hardcode. | Codex wins: copy hypothesis-only rule into handoff. |
| Artifact QA | Registry, format, render, consumer proof. | Upgrade audit closes prose-only gap. | Aligned: parser + render smoke required. |
| Loop governance | Raise bar when proof is weak. | Loopy-era eval/report/scorecard. | Bridge levels: proof gaps become scorecard issue IDs. |
Apply To `$init-project` And `$team`
변경 지점은 `$init-project` 생성물, `$team` 계획, Phase 4 QA evidence, scorecard feedback 네 곳이다. 전부 prose가 아니라 artifact edge로 내려야 한다.
Recommended Artifact Schema
`$team`의 task shape에 Fable-ish 정보를 붙이고, QA evidence와 scorecard가 같은 ID를 따라가게 만든다.
Evidence Inventory
출처와 runtime 검증을 같은 그래프에 묶었다. HTML 주장은 이 경로의 파일과 validator output을 근거로 한다.
Final Assessment
Fable-ish의 가장 큰 가치는 더 많은 agent를 띄우는 것이 아니라, 각 작업을 invariant, risk, exit criterion, proof로 쪼개고 proof가 실제 위험을 검증하지 못하면 기준을 올리는 규율이다.
결론: 현재 Codex harness는 이미 hard contract와 `$team` preflight가 강하다. 다음 업그레이드는 Fable-ish의 micro-loop 정보를 QA evidence와 scorecard로 흡수해서, 작업 단위별 proof quality를 기계가 읽을 수 있게 만드는 것이다.