사랑하는 Ultraworkers님께,
마침내 우리는 GPTPhus를 소개합니다 — Sisyphus의 정신과 Hephaestus의 힘을 가진 존재입니다.
이 릴리즈는 우리 모델 전략의 근본적인 변화를 의미합니다. ChatGPT Pro 계정 2개 분량의 토큰을 소모하는 광범위한 실제 테스트를 거친 결과, 우리는 체계적으로 GPT-5.4를 전체 에이전트 생태계에서 1급 지위로 승격했습니다. 이는 단순한 모델 교체가 아니라, GPT-5.4가 복잡한 오케스트레이션 작업을 위한 Claude의 진정한 대안으로서 그 위치를 확보했다는 인정입니다.
처음으로 Sisyphus는 GPT 시리즈 모델에 맞춰 제대로 튜닝되었습니다. 우리는 Opus 네이티브 프롬프트의 정교함에 버금가는 8블록 아키텍처를 갖춘 GPT-5.4 전용 프롬프트를 제작했습니다. 결과는 놀라웠습니다: GPT 기반 Sisyphus인 GPTPhus는 테스트 중에 우리를 깊게 감동시킨 오케스트레이션 품질을 제공했으며, 이를 검증하기 위해 ChatGPT Pro 계정 2개를 소모했을 정도입니다.
결론: Opus Sisyphus는 여전히 범용 오케스트레이션의 금 표준입니다. Claude Opus 4.6의 고유한 아키텍처 강점은 특정 추론 패턴에서 타의 추종을 불허합니다. 하지만 GPTPhus는 단순히 "충분히 좋은" 수준이 아니라, 진정으로 우수하며, OpenAI 전용 설정을 사용하는 사용자들에게는 이제 폴백이 아닌 1급 옵션입니다.
새로운 폴백 체인: claude-opus-4-6 max → k2p5 → kimi-k2.5 → gpt-5.4 medium → glm-5 → big-pickle
우리는 전체 에이전트 카탈로그의 GPT-5.2 의존성을 GPT-5.4로 완료했습니다. 이전에 GPT 기능에 의존하던 모든 에이전트는 이제 5.4 패밀리로 라우팅됩니다:
에이전트
이전 주요 모델
새로운 주요 모델
Oracle
gpt-5.2
gpt-5.4 high
Momus
gpt-5.2
gpt-5.4 xhigh
Metis
gpt-5.2
gpt-5.4 high
Prometheus
gpt-5.2
gpt-5.4 high
Atlas
claude-sonnet
+ gpt-5.4 medium 폴백
Multimodal-Looker
gpt-5.3-codex
gpt-5.4 medium
중요한 구분: GPT-5.3-codex와 GPT-5.4는 근본적으로 다른 강점을 가진 다른 모델입니다. 대부분의 에이전트를 5.4로 마이그레이션했지만, Hephaestus는 심화된 자율형 작업을 위해 여전히 GPT-5.3-codex를 권장합니다 — 그 에이전트의 특정 워크플로우에 대해 장시간 코딩 세션을 위해 학습된 모델의 특정 강점은 여전히 타의 추종을 불허합니다.
ultrawork 루프(/ulw-loop)는 이제 작업을 완료하기 전에 명시적인 Oracle 검증을 필요로 합니다. 이는 상당한 동작 변화입니다:
또한 일부 사용자가 보고한 "중단된 검증" 엣지 케이스를 방지하기 위해 명시적인 Oracle 세션 추적을 추가했습니다. 시스템은 이제 진행 중인 Oracle 검증의 전체 컨텍스트를 유지하고 검증이 실패할 때 상위 세션 재시도 로직을 우아하게 처리합니다.
카테고리-모델 매핑은 이제 높은 수준의 작업에 대해 GPT-5.4를 기본값으로 합니다:
카테고리
이전 기본값
새로운 기본값
unspecified-high
glm-5
gpt-5.4 high
ultrabrain
gpt-5.3-codex xhigh
변경 없음 (까다로운 논리에는 codex 여전히 선호)
deep
gpt-5.3-codex medium
변경 없음
ultrabrain과 deep 카테고리는 GPT-5.3-codex를 주요 모델로 유지합니다 — 장시간 추론 세션을 위한 해당 모델의 특정 학습은 이러한 작업 유형에 최적입니다.
모든 폴백 체인에서 kimi-k2.5-free를 제거했습니다. 이 모델 변형은 제공자에 의해 더 이상 지원되지 않으며 불필요한 폴백 지연을 야기했습니다.
이미지 분석 및 시각적 이해를 담당하는 multimodal-looker 에이전트는 이제 GPT-5.4 medium을 주요 모델로 사용합니다 (이전에는 GPT-5.3-codex). 이는 시각적 분석 기능을 우리의 최신 GPT 네이티브 프롬프트와 정렬합니다.
Sisyphus는 이제 OpenAI 전용 구성으로 기본 지원됩니다. 이전에는 Hephaestus로 폴백했으나, 이제는 GPT-5.4 medium으로 전체 Sisyphus 오케스트레이션을 얻습니다.
kimi-k2.5-free 모델이 모든 폴백 체인에서 제거되었습니다. 이 (무료) 모델에 의존하고 있었다면, 시스템은 이제 구성된 제공자에서 다음으로 사용 가능한 모델로 이동합니다.
Oracle 검증이 필수화되었으므로 작업 완료 시간이 약간 더 소요됩니다. 트레이드오프는 완료 정확성에 대한 훨씬 높은 신뢰도입니다.
이 릴리즈에 17개의 커뮤니티 PR이 병합되었으며, 불안정한 테스트, doctor 경로, 모델 형식 정규화, 알림 클릭 타겟 등에 대한 수정이 포함됩니다. 모든 첫 기여자분들께 특별히 감사드립니다!
기여자: @rluisr, @MoerAI, @devxoul, @wousp112, @JimMoen, @acamq, @mertyldrm, @YLRong, @1noilimrev, @ualtinok, @Wangmerlyn, @Vacbo, @Romanok2805, @RaviTharuma, @brandonwebb-vista, @guazi04, @SeeYouCowboi, @chan1103, @SwiggitySwerve, @markarranz, @yhc509, @janghoon-ju, @wangjingu, @ilovingjny, @nous-labs