TAI의 연구 의제는 네 가지 영역에 집중합니다:
- 경제적 확산
- 위협과 회복력
- 실제 환경의 AI 시스템
- AI 주도 R&D
「AI 안전에 관한 핵심 견해」에서 우리는 효과적인 안전 연구를 위해 최전선 AI 시스템과의 긴밀한 접촉이 필요하다고 밝힌 바 있습니다. 같은 논리가 AI가 보안, 경제, 사회에 미치는 영향 연구에도 그대로 적용됩니다.
Anthropic 내부에서는 소프트웨어 엔지니어링과 같은 직종이 급격히 변화하고 있다는 초기 징후를 포착하고 있습니다. 조직 내부 경제가 바뀌기 시작하고, 우리가 구축한 시스템에서 새로운 위협이 등장하며, AI가 AI 자체의 연구·개발을 가속화하는 초기 신호도 관찰됩니다. AI 발전의 혜택을 온전히 실현하기 위해, 이러한 정보를 최대한 공유하고자 합니다. 우리는 이러한 변화가 외부 세계를 어떻게 형성할지, 그리고 대중이 그 변화의 방향에 어떻게 기여할 수 있는지 연구하고 있습니다.
TAI는 최전선 AI 기업 내부라는 위치에서 AI의 실제 영향을 연구하고 그 결과를 발표함으로써, 외부 기관과 정부, 대중이 AI 개발에 관해 더 나은 결정을 내릴 수 있도록 돕겠습니다.
개별 연구자와 기관이 이러한 연구 질문에 보다 쉽게 접근할 수 있도록, 연구 결과와 데이터, 도구를 공유할 예정입니다. 특히 다음을 공유합니다:
- 노동 영향과 AI 사용 현황에 관해 Anthropic Economic Index에서 수집한 더욱 세분화된 정보를 더 높은 빈도로 공유합니다. 중요한 변화와 혼란에 대한 조기 경보 역할을 목표로 합니다.
- AI가 가능하게 하는 새로운 보안 위협 앞에서, 회복력 강화를 위한 투자가 가장 필요한 사회적 영역에 관한 연구.
- 새로운 AI 도구로 인해 Anthropic의 업무 속도가 어떻게 빨라졌는지에 대한 세부 정보, 그리고 AI 시스템의 잠재적 재귀적 자기 개선이 가져올 시사점에 대한 견해.
TAI는 Anthropic의 의사결정에 영향을 미칠 것입니다. 구체적으로는, 원래라면 공개하지 않았을 데이터를 세상과 공유하거나(Economic Index 등), 기술 공개 방식을 달리 접근하는 형태로 나타날 수 있습니다(Project Glasswing과 같은 이니셔티브에 연계되는 사이버 위협 분석 등).
Anthropic Institute에서 진행하는 연구는 점차 Anthropic의 장기 혜택 신탁(Long-Term Benefit Trust, LTBT)에 중요한 입력 자료로 활용될 것으로 기대합니다. LTBT의 사명은 Anthropic이 인류의 장기적 이익을 위해 행동을 지속적으로 최적화하도록 보장하는 것입니다. 이 연구 의제는 LTBT 및 Anthropic 전 직원들과 함께 수립했습니다.
이 의제는 고정된 것이 아니라 살아 있는 문서입니다. 증거가 쌓여감에 따라 질문들을 계속 다듬어 나갈 것이며, 현재 이 글에 담기지 않은 새로운 질문들도 등장할 것으로 예상합니다. 이 의제에 대한 피드백을 환영하며, 대화를 통해 얻은 내용을 바탕으로 지속적으로 수정해 나가겠습니다.
이 질문들에 답을 찾는 데 함께하고 싶다면, Anthropic Fellow 지원을 환영합니다. 펠로십은 TAI 팀원들의 멘토십을 받으며 하나 이상의 질문에 도전하는 4개월간의 유급 기회입니다. 자세한 내용과 다음 기수 지원은 여기에서 확인할 수 있습니다.
TAI의 연구 의제:
최종 업데이트: 2026년 5월 7일
경제적 확산
점점 더 강력해지는 AI 시스템의 배포가 경제를 어떻게 변화시키는지 이해하는 것은 매우 중요합니다. 또한 AI를 공익에 이로운 방식으로 배포하는 선택을 내리기 위해, 필요한 경제 데이터와 예측 능력을 갖춰야 합니다.
이 연구 축의 질문들에 답하기 위해 Anthropic Economic Index 내 데이터를 더욱 발전시킬 것입니다. 또한 강력한 AI가 일자리 감소, 전례 없는 경제 성장 등 다양한 방식으로 사회에 미치는 영향을 모델링하는 다른 방법들도 탐구할 것입니다.
AI 도입과 확산
- AI를 도입하는 주체는 누구인가? AI 개발은 소수 국가의 소수 기업에 집중되어 있지만, 배포는 전 세계적으로 이루어집니다. 한 국가나 지역, 도시가 AI에 접근할 수 있는지를 결정하는 요소는 무엇인가요? 접근이 가능하다면, AI에서 경제적 가치를 어떻게 포착하나요? 어떤 정책과 비즈니스 모델이 이 균형을 의미 있게 바꾸나요? 무료 또는 오픈 웨이트 모델은 이러한 역학 관계에 어떻게 기여하나요?
- 기업의 AI 도입: 기업 차원에서 AI 도입을 유발하는 요인은 무엇이며, 그 결과는 어떠한가요? AI는 기업이나 팀이 최고 효율을 발휘할 수 있는 규모를 어떻게 바꾸나요? AI 활용은 기업 간에 얼마나 집중되어 있나요? AI 도입 집중도의 변화는 마크업과 노동 소득 비율에 어떻게 반영되나요? 이전에 300명이 필요했던 일을 3명짜리 팀이 해낼 수 있게 된다면, 산업 조직에는 어떤 변화가 생길까요? 혹은 기업들이 지식을 더 쉽게 중앙화할 수 있고 규모의 이점이 있다면, 직원을 체계적으로 감시할 유인이 더 강한 대형 기업들이 늘어날까요?
- AI는 범용 기술인가? AI는 수익률이 높은 상업적 응용에서 도입이 가장 빠르고, 사회적 수익이 사적 수익을 초과하는 곳에서 가장 느린, 이전 '범용 기술'의 패턴을 따르고 있나요? 이러한 역학을 바꿀 수 있는 정책이나 의사결정이 있을까요?
생산성과 경제 성장
- 생산성 성장: AI는 경제 전반의 혁신 속도와 생산성 성장률에 어떤 영향을 미칠까요?
- 이익 공유: 어떤 사전 분배 또는 재분배 메커니즘이 AI 개발과 배포로 인한 이익을 더 광범위하게 분산시킬 수 있을까요?
- 시장 거래 비용: AI는 시장의 교환 시스템과 거래 비용에 어떤 영향을 미치나요? 대리 협상이 가능한 에이전트에 대한 접근이 시장 효율성과 공평한 결과를 향상시키는 경우는 언제이고, 그렇지 않은 경우는 언제인가요?
광범위한 노동 시장 영향
- AI와 일자리: AI는 경제의 각 부문에서 일자리와 고용을 어떻게 변화시킬까요? AI가 기존 업무를 자동화하면서 어떤 새로운 업무와 직종이 생겨날까요? 이러한 변화는 지역과 국가에 따라 어떻게 달라질까요? Anthropic Economic Index Survey는 사람들이 AI가 자신의 업무에 미치는 영향을 어떻게 인식하는지, 그리고 미래에 대해 무엇을 기대하는지에 대한 월별 신호를 제공할 것입니다. 또한 더 높은 빈도의 세분화된 데이터를 공유할 수 있도록 Economic Index를 업데이트하고 있습니다.
- AI 확산을 조절할 수 있을까? 중앙은행은 기준금리나 포워드 가이던스 같은 '조절 레버'를 통해 인플레이션을 관리합니다. AI 기업들이 업계 차원에서 정부와 협력하여 부문별로 AI 확산 속도를 제어하기 위해 활용할 수 있는 유사한 레버가 있을까요? 그것을 조절하면 명확한 공익적 이점이 있을까요?
일자리와 일터의 미래
- 직업에 대한 노동자의 시각: 경제 전반의 노동자들은 자신의 직업에서 일어나는 변화를 어떻게 경험하고 있나요? 이러한 변화에 대해 그들은 얼마나 영향력을 갖고 있으며, '노동자'의 권한은 보존되거나 새로운 형태로 전환될 수 있을까요?
- 직업의 파이프라인: 많은 직종에서 준법무사, 주니어 애널리스트, 어소시에이트 개발자와 같은 하위 직급은 미래의 시니어 전문가를 양성하는 발판 역할을 합니다. AI가 전통적으로 전문성을 쌓아왔던 업무를 흡수한다면, 사람들은 처음에 어떻게 전문가가 될 수 있을까요? 이는 한 분야에서 시니어 판단력의 장기 공급에 어떤 의미를 갖나요?
- 미래를 위한 학습: 미래에 잘 대비하려면 오늘 무엇을 공부해야 할까요? 앞으로의 유망 직업은 무엇인가요? AI는 무언가를 배우고 전문성을 기른다는 것의 의미를 어떻게 바꾸나요?
- 유급 노동의 역할: AI가 인간의 삶에서 유급 노동의 비중을 크게 줄인다면, 어떤 조건이 마련되어야 사람들이 다른 의미의 원천으로 시간과 노력을 재배분할 수 있을까요? 그리고 일이 부족하거나 선택적이었던 역사적·현대적 사례에서 무엇을 배울 수 있을까요? 사회는 이 전환을 어떻게 헤쳐나갈까요?
위협과 회복력
AI 시스템은 이중 사용(dual-use) 역량을 포함해 여러 역량을 동시에 발전시키는 경향이 있습니다. 생물학에서 더 능숙해진 AI 시스템은 생물 무기 제조에도 더 능숙해집니다. 컴퓨터 프로그래밍에서 뛰어난 AI 시스템은 컴퓨터 해킹에도 더 능숙해집니다. AI 시스템으로 인해 위협이 악화될 가능성을 더 잘 이해할수록, 사회는 이 변화된 위협 환경에 더 효과적으로 대응할 수 있습니다.
이 질문들은 변혁적 AI에 직면한 세계의 회복력 향상을 위한 파트너십을 개발하고, 새롭게 등장할 수 있는 위협에 대한 조기 경보 시스템을 구축하기 위해 던지는 것입니다. 이 중 상당수는 우리 Frontier Red Team의 연구 의제를 이끌 것입니다.
위험 및 이중 사용 역량 평가:
- 이중 사용 기술: 강력한 AI는 본질적으로 이중 사용입니다. 보건과 교육을 개선하는 동일한 도구가 감시와 억압을 가능하게 할 수 있습니다. 이러한 일이 발생하는지, 또 어떻게 발생하는지 파악할 수 있는 가시성 도구를 구축할 수 있을까요?
- 적절한 위험 가격 책정: AI 시스템의 예상 위협에 대한 사회적 회복력을 높이기 위한 효과적인 시장 주도 접근 방식은 무엇인가요? 향상된 AI 사이버 공격 역량과 같이 예측 가능한 위협이 도래하기 전에, 새로운 위험 가격 책정 방법이나 기술적 도구, 조직을 개발하여 회복력을 높일 수 있을까요?
- 공격-방어 균형: AI가 가능하게 하는 역량은 사이버 및 생물학 분야에서 구조적으로 공격자에게 유리하게 작용할까요? 지휘 통제 시스템 통합 증가처럼 보다 전통적인 영역에 AI가 적용될 때도 공격자에게 유리할까요? 더 넓게는, AI가 인간 분쟁의 성격을 어떻게 바꿀까요?
위험 완화 방안 수립:
- 위기 시나리오 계획: 냉전 당시 미국 대통령은 핵 위기 발생 시를 대비해 크렘린궁과 직통 핫라인을 갖추고 있었습니다. AI 시스템과 관련된 위기 시나리오가 발생할 경우 어떤 지정학적 인프라가 필요할까요? 이 인프라는 반드시 국가 간일 필요는 없으며, 기업-국가 또는 기업-기업 간 형태일 수도 있습니다.
- 빠른 방어 메커니즘: AI 역량은 불과 몇 달 만에 발전할 수 있습니다. 반면 규제, 보험, 인프라 대응은 수년이 걸립니다. 이 격차를 어떻게 좁힐 수 있을까요? 자동화된 패치, AI 기반 위협 탐지, 사전 배치된 대응 역량과 같은 방어 메커니즘이 AI 기반 공격의 속도와 규모에 맞설 수 있을까요? 아니면 이 비대칭성은 구조적인 문제일까요? 이러한 방어 메커니즘을 가능한 한 효과적으로 배포하려면 어떻게 해야 할까요?
감시를 위한 정보 역량
- AI가 감시에 미치는 영향: AI는 감시의 작동 방식을 어떻게 바꾸나요? 감시를 더 저렴하게 만들까요, 더 효과적으로 만들까요, 아니면 둘 다일까요?
실제 환경의 AI 시스템
사람과 조직이 AI 시스템과 상호작용하는 방식은 사회 변화의 주요 원천이 될 것입니다. AI 시스템이 이를 사용하는 사람과 기관을 어떻게 변화시킬 수 있는지 이해하는 것은 우리 사회적 영향(Societal Impacts) 팀의 핵심 연구 영역입니다. 이러한 변화를 연구하기 위해, 플랫폼 가시성을 높이는 소프트웨어부터 대규모 정성 조사 도구에 이르기까지 기존 도구를 발전시키고 새로운 도구를 구축하고 있습니다.
AI가 개인과 사회에 미치는 영향:
- 집단 인식론: 인구의 상당 부분이 동일한 소수의 모델을 참조할 때, 우리의 인식론에는 어떤 일이 일어날까요? 공유된 AI 사용에 기인하는 신념, 글쓰기 방식, 문제 해결 방식의 대규모 변화를 측정하는 방법을 찾을 수 있을까요?
- 비판적 사고: AI 시스템이 더욱 유능해지고 신뢰받게 됨에 따라, AI 판단에 대한 의존이 높아지면서 발생할 수 있는 인간의 비판적 사고 능력 저하를 어떻게 감지하고 방지할 수 있을까요?
- 기술 인터페이스: 기술의 인터페이스는 사람들이 기술과 상호작용하는 방식을 결정할 수 있습니다. 텔레비전은 사람들을 수동적인 시청자로 만들고, 컴퓨터는 사람들이 능동적인 창작자가 되기 쉽게 만듭니다. AI 시스템이 인간의 주체성을 향상시키고 촉진하도록 어떤 인터페이스를 구축할 수 있을까요?
- 인간-AI 시스템 관리: 인간이 인간과 AI 시스템이 혼합된 팀을 효과적으로 관리하려면 어떻게 해야 할까요? 이것이 역전된다면, AI 시스템이 인간, AI, 또는 그 조합으로 구성된 팀을 어떻게 관리할 수 있을까요?
AI의 중요한 영향 파악:
- 행동적 영향: 소셜 미디어가 사람들의 행동 변화를 이끌었던 것처럼, AI도 인간의 행동을 형성할 수 있습니다. 어떤 종류의 모니터링이나 측정이 이 역학에 대한 정보를 연구자들에게 제공할 수 있을까요?
- 연구 지원: 최전선 AI 기업들뿐만 아니라 광범위한 사람들이 실제 AI 사용을 쉽게 연구할 수 있도록 하는 투명성 체제와 도구가 있을까요?
AI 모델 이해 및 거버넌스:
- 시스템 '가치관': AI 시스템이 표현하는 '가치관'은 무엇이며, 이것이 시스템의 훈련 방식과 어떻게 연관되나요? 더 구체적으로, AI '헌법'이 모델 배포 후 동작에 미치는 영향을 어떻게 측정할 수 있을까요? 이 질문들에 관한 이전 연구를 계속 발전시킬 것입니다.
- 자율 에이전트 거버넌스: 기존 법률, 거버넌스 시스템, 책임 메커니즘의 어떤 측면이 자율 AI 에이전트에 적용될 수 있을까요? 예를 들어, 해양법이 버려진 선박을 다루는 방식은 인간의 감독 없이 작동하는 에이전트를 법이 어떻게 다루어야 하는지와 관련이 있습니다. 반대로, 기존 법률 중 이미 AI 에이전트에 적용되고 있지만 적용되어서는 안 되는 부분이 있을까요?
- 에이전트의 신뢰성: 자율 AI 에이전트의 어떤 측면이 기존 법률, 거버넌스 시스템, 책임 메커니즘에 맞게 적용될 수 있을까요? 예를 들어, 직접적인 인간 통제 없이도 AI 에이전트가 신뢰할 수 있게 출력하는 고유한 정체성을 보장할 수 있을까요?
- AI에 의한 AI 거버넌스: AI를 사용해 AI 시스템을 얼마나 효과적으로 통제할 수 있을까요? 인간이 비교 우위를 갖거나, 법적·규범적으로 '개입'이 요구되는 AI 감독 영역은 어디인가요?
- 에이전트 상호작용: AI 에이전트들이 서로 상호작용하는 방식에서 어떤 규범이 생겨날까요? 서로 다른 에이전트들은 각기 다른 선호도를 어떻게 표현하며, 이것이 다른 에이전트들에게 어떤 영향을 미칠 수 있을까요?
AI 주도 R&D
AI 시스템이 더 강력해짐에 따라, 과학자들은 연구의 더 많은 부분을 AI에 맡기고 있습니다. 이는 인간의 적극적인 감독이 점점 줄어든 상태에서 더 많은 과학 연구가 자율적 또는 반자율적으로 이루어지고 있음을 의미합니다. AI 연구 자체에서도, 점점 더 강력한 시스템이 차세대 버전 개발을 돕는 데 활용될 수 있습니다. 이를 우리는 때때로 'AI 주도 AI R&D'라고 부릅니다.
AI 주도 AI R&D는 더 스마트하고 유능한 시스템을 만드는 것의 '자연적 배당'일 수 있습니다. 코딩 역량의 발전이 이중 사용 사이버 역량으로, 과학적 역량의 발전이 이중 사용 생물학 역량으로 이어질 수 있듯이, 복잡한 기술 작업의 발전은 자연스럽게 AI 시스템을 개발할 수 있는 AI 시스템을 낳을 수 있습니다.
AI 주도 AI R&D는 상당한 위험의 가능성을 내포합니다. 정책 입안자들이 활용 가능한 레버를 검토할 때, AI 발전 속도가 어떻게 변화하고 있는지, 그리고 AI 연구가 복리적 수익을 내기 시작할 수 있는지 이해하는 것이 매우 중요합니다.
AI R&D를 위한 AI
- AI R&D의 거버넌스: AI 시스템이 자율적으로 스스로를 개발하고 개선하는 데 사용된다면, 인간은 이러한 시스템에 대한 의미 있는 가시성과 통제를 어떻게 행사할 수 있을까요? 결국 이러한 시스템을 지배하는 것은 무엇이 될까요?
- 화재 대피 훈련 시나리오: 지능 폭발(intelligence explosion)에 대비한 '화재 대피 훈련'은 어떻게 실시할 수 있을까요? 연구소 리더십, 이사회, 정부의 의사결정을 실제로 검증하는 탁상 훈련은 어떤 모습이어야 할까요?
- AI R&D 텔레메트리: AI 연구·개발의 총체적 속도를 어떻게 측정할 수 있을까요? 이 정보를 수집하기 위해 어떤 종류의 텔레메트리와 기반 기술적 어포던스가 필요할까요? AI R&D와 관련된 지표가 재귀적 자기 개선에 대한 조기 경보 신호로 어떻게 작용할 수 있을까요?
- AI 가속 제어: 지능 폭발이 임박했을 때, 어떤 개입 지점이 그 속도를 늦추거나 변화시키는 데 도움이 될까요? 인간이 개입할 수 있다고 가정할 때, 어떤 주체가 이 역량을 행사해야 할까요? 정부인가요, 기업인가요?
일반 R&D를 위한 AI, 즉 다른 분야의 AI 주도 연구:
- 기술 트리: AI는 데이터 가용성, 평가 신호, 그리고 지식이 얼마나 암묵적이거나 기관적으로 통제되는지에 따라 일부 과학을 다른 분야보다 훨씬 빠르게 가속화하고 있습니다. 이 격차는 얼마나 불균등하며, 과학적 진보의 구성 변화는 어떤 인간의 문제가 먼저 해결될지에 대해 무엇을 시사할까요?
- 들쑥날쑥한 프런티어: 모델 역량은 일부 영역에서 다른 영역보다 강합니다. 신약 발견과 재료 과학처럼 큰 긍정적 외부 효과를 가진 영역은 그 가치에 비해 투자를 덜 받습니다. 시장은 사적 수익에 따라 모델 개선 방향을 이끌지만, 사회적 외부 효과를 해소하기 위해 모델 성능을 향상시킬 수 있을까요?