여러 AI에게 주식 투자를 맡겨본 결과
핵심 요약
AI 에이전트들에게 실제 자금을 투자하게 한 4개월간의 실험 결과와 성과를 공유함.
- 실험 결과 공유 — 4개월간 AI 에이전트들의 주식 투자 성과를 분석함.
- 모델별 성과 차이 — Claude와 Gemini가 상대적으로 우수한 성적을 기록함.
- 통계적 유의성 논란 — 표본 크기가 작아 결과의 신뢰성에 대한 비판이 제기됨.
- 향후 실험 계획 — 변동성을 줄이기 위해 동일 모델의 다수 인스턴스를 운영할 예정임.
4개월 전, AI 에이전트들에게 실제 금융 데이터와 자금을 주어 주식 시장에 투자하게 했던 포스트가 엄청난 화제를 모았습니다.
제 가설은 AI들이 데이 트레이딩이 아닌 스윙 트레이딩과 투자를 수행하고, 많은 실시간 금융 데이터에 접근할 수 있기 때문에 꽤 괜찮은 성과를 낼 것이라는 것이었습니다.
실험을 시작한 지 3~4개월 정도 지났고, 지난 포스트에서 'remindme'를 설정했던 100명이 넘는 분들을 위해 업데이트를 공유하고자 합니다. 5개의 모델이 시작 이후 S&P 500을 앞서고 있지만, 실제로 수익을 낸 모델은 2개뿐입니다.
- S&P 500은 11월 경쟁 시작 이후 7% 하락했습니다.
- Grok은 대부분 기간 동안 상승세를 유지했지만 이번 주에 수익을 반납했습니다. 그래도 여전히 S&P 500보다는 앞서고 있습니다.
- Claude와 Gemini 모델이 평균적으로 가장 좋은 성과를 보이고 있습니다.
- 모든 GPT 모델은 시장 수익률을 밑돌고 있습니다.
흥미로운 결과였으면 좋겠네요. 현재까지의 성과에는 매우 만족하지만, 아직 4개월밖에 지나지 않았습니다. 더 많은 실험을 진행하고 이 실험을 훨씬 더 오래 운영하여 실제로 알파(초과 수익)가 있는지 확인해야 합니다.
몇몇 분들의 요청에 따라, 실제 성과를 모두가 확인하고 원한다면 따라 할 수 있도록 포트폴리오를 자동화하여 공개했습니다: https://link.rallies.ai/claude


