클로드에게 전용 컴퓨터를 주고 24시간 돌려봤습니다. 그 결과물입니다.
핵심 요약
클로드를 상시 구동되는 VM 환경에서 자율적으로 운영하며 스스로 기능을 확장하게 만든 오픈소스 프로젝트 'Phantom'을 소개합니다.
- 자율 운영 시스템 — 클로드를 VM/Docker 환경에서 24시간 구동하며 Slack을 통해 상호작용하는 에이전트 구축
- 자기 진화 엔진 — Sonnet으로 Opus의 결과물을 검증하는 교차 모델 검증 방식을 통해 설정과 기능을 스스로 개선
- 자동화된 기능 확장 — 데이터 분석, Discord 봇 생성, 자체 모니터링 도구 통합 등 지시하지 않은 작업까지 스스로 수행
- 비용 효율성 — Sonnet 모델을 활용하여 복잡한 작업을 수행함에도 불구하고 매우 저렴한 운영 비용 유지
여러분 안녕하세요. 저는 Phantom이라는 것을 만들었고 오픈소스로 공개했습니다. 아이디어는 간단합니다. 클로드를 터미널에서 실행하다가 탭을 닫으면 모든 것을 잊어버리는 대신, 전용 머신을 주고 항상 실행되게 하면 어떨까 하는 것이죠.
그래서 그렇게 했습니다. 이것은 Agent SDK(Opus 4.6)를 영구적인 벡터 메모리, 자기 진화 엔진, MCP 서버로 감싸는 Bun/TypeScript 프로세스입니다. Slack을 통해 대화할 수 있습니다. 자체 VM이나 Docker Compose에서 실행됩니다. 설정은 명령어 세 번이면 끝납니다.
예상치 못하게 프로덕션에서 발생한 몇 가지 일들입니다:
데이터 분석을 도와달라고 요청했습니다. 그랬더니 VM에 ClickHouse를 설치하고, 2,870만 행의 Hacker News 데이터를 다운로드하고, 분석 대시보드를 만들고, REST API를 만들고, 그 API를 MCP 도구로 등록해서 나중에 대화할 때 다시 사용할 수 있게 만들었습니다. 저는 그런 걸 하라고 시킨 적이 없습니다.
누군가 "Discord에서 대화할 수 있나요?"라고 물었더니, Discord는 지원하지 않지만 아마 만들 수 있을 것 같다고 답했습니다. 사용자를 안내해서 Discord 봇을 만들게 하고, 보안 폼을 통해 토큰을 받고, 컨테이너를 띄우고, Discord에서 라이브 상태가 되었습니다. 원래는 없던 채널을 말 그대로 스스로 추가한 겁니다.
또한 Vigil이라는 작은 오픈소스 모니터링 도구를 찾아 ClickHouse에 통합하고, 자신의 인프라를 위한 모니터링 대시보드를 직접 구축했습니다. 에이전트가 스스로를 감시하고 있는 거죠. 자기 진화 부분은 제가 가장 자랑스러워하는 부분입니다. 세션이 끝날 때마다 6단계 파이프라인을 실행해서 자신의 설정을 다시 씁니다. 핵심 통찰은 Opus가 제안한 변경 사항을 Sonnet이 판단하게 한 것입니다. Opus가 자신의 작업을 판단하게 하면 서서히 표류하기 때문입니다. 교차 모델 검증이 이를 해결했습니다.
저는 이 전체를 Claude Code를 유일한 엔지니어링 팀원으로 삼아 만들었습니다. 770개의 테스트, Apache 2.0 라이선스입니다.
GitHub: https://github.com/ghostwright/phantom
여러분들의 의견을 듣고 싶습니다. 특히 Agent SDK로 영구적인 에이전트를 구축해 보신 분이 있다면 더욱 그렇습니다.


