인라인 자체 검토로 서브에이전트 검토 루프 대체
서브에이전트 검토 루프(계획/스펙 검토를 위해 새로운 에이전트 디스패치)는 실행 시간을 두 배로 늘렸으나(약 25분 오버헤드) 계획 품질을 측정 가능하게 개선하지 못했습니다. 5개 버전과 각 5회 시행에 걸친 회귀 테스트 결과, 검토 루프 실행 여부와 관계없이 동일한 품질 점수를 보였습니다.
- brainstorming — 스펙 검토 루프(서브에이전트 디스패치 + 3회 반복 제한)를 인라인 스펙 자체 검토 체크리스트로 대체: 플레이스홀더 스캔, 내부 일관성, 범위 확인, 모호성 확인
- writing-plans — 계획 검토 루프(서브에이전트 디스패치 + 3회 반복 제한)를 인라인 자체 검토 체크리스트로 대체: 스펙 범위, 플레이스홀더 스캔, 타입 일관성
- writing-plans — 계획 실패를 정의하는 명시적인 "No Placeholders" 섹션 추가 (TBD, 모호한 설명, 정의되지 않은 참조, "Task N과 유사")
- 자체 검토는 약 30초 내에 실행당 3~5개의 실제 버그를 포착하며, 서브에이전트 방식과 비교할 수 있는 결함률을 유지합니다(약 25분 대비)
브레인스토밍 서버
- 세션 디렉토리 재구성 — 브레인스토밍 서버 세션 디렉토리는 이제 두 개의 피어 서브디렉토리를 포함합니다:
content/(브라우저에 제공되는 HTML 파일)과 state/(이벤트, server-info, pid, log). 이전에는 서버 상태와 사용자 상호작용 데이터가 제공되는 콘텐츠와 함께 저장되어 HTTP를 통해 접근 가능했습니다. screen_dir과 state_dir 경로는 모두 server-started JSON에 포함됩니다. (吉田仁님 보고)
버그 수정
- Owner-PID 라이프사이클 수정 — 브레인스토밍 서버의 owner-PID 모니터링에 60초 이내 거짓 종료를 유발하는 두 가지 버그가 있었습니다: (1) 크로스 사용자 PID(Tailscale SSH 등)의 EPERM이 "프로세스 중지"로 취급되었고, (2) WSL에서 부모 PID가 첫 번째 라이프사이클 확인 전에 종료되는 단명한 서브프로세스로 해석되었습니다. EPERM을 "활성"으로 처리하고 시작 시 owner PID를 검증함으로써 수정됨 — 이미 중지되어 있으면 모니터링이 비활성화되고 서버는 30분 유휴 타임아웃에 의존합니다. 또한 서버가 이제 일반적으로 처리하므로
start-server.sh에서 Windows/MSYS2 특정 제외를 제거합니다. (#879)
- writing-skills — SKILL.md 프론트매터가 "2개 필드만 지원"한다는 잘못된 주장을 수정; 이제 "2개 필수 필드"라고 명시하고 지원되는 모든 필드에 대해 agentskills.io 스펙 링크 추가 (@arittr의 PR #882)
Codex App 호환성
- codex-tools — Claude Code의 명명된 에이전트 타입을 Codex의
spawn_agent와 워커 역할로 변환하는 방법을 문서화한 명명된 에이전트 디스패치 매핑 추가 (@arittr의 PR #647)
- codex-tools — 워크트리 인식 스킬을 위한 환경 감지 및 Codex App 완료 섹션 추가 (@arittr작성)
- Design spec — 읽기 전용 환경 감지, 워크트리 안전 스킬 동작, 샌드박스 폴백 패턴을 다루는 Codex App 호환성 설계 스펙 추가 (PRI-823) (@arittr작성)