Anthropic은 신뢰할 수 있고, 해석 가능하며, 제어 가능한 AI 시스템을 만들기 위해 연구하는 AI 안전 연구 기업입니다.
인공지능이 정말로 업무 속도를 높여줄까? AI가 가장 잘 지원하는 작업은 무엇이며, 사람들의 직업 자체를 어떻게 변화시킬 수 있을까?
Anthropic은 바로 이런 질문에 답하기 위해, 실제 AI 사용 현황을 지속적으로 측정하고 있습니다. 프라이버시를 보호하는 분석 방법론을 통해 Claude.ai(주로 일반 소비자 사용)와 자사 API(주로 기업 사용)에서 이루어지는 대화를 분석합니다.1 지금까지 발표한 보고서에서는 직업 및 임금 수준별 AI 활용 현황을 평가하고, 소프트웨어 개발 분야를 심층적으로 살펴보았으며, 국가별·미국 주별 AI 사용 양상도 분석한 바 있습니다.
이번에는 경제 지표(Economic Index)에 한 단계 더 정밀한 분석 체계를 도입합니다. 네 번째 보고서에서 새롭게 소개하는 경제 기본 지표(economic primitives)는 Claude의 경제적 영향을 시계열로 추적하기 위한 다섯 가지 핵심 측정 항목입니다. 초기 항목에는 작업 복잡도, 기술 수준, 용도(업무·교육·개인), AI 자율성, 성공 여부가 포함됩니다.2 이 기본 지표는 샘플에 포함된 모든 대화에 대해 Claude가 공통된 질문 세트에 답하도록 하여 도출합니다.
이러한 기본 지표는 AI의 잠재적 경제 영향을 가늠하는 선행 지표 역할을 하며, AI가 이미 일자리를 어떻게 변화시키고 있는지에 대한 훨씬 복잡한 질문에도 답할 수 있게 해줍니다. 2025년 11월 대화를 샘플링한 이번 최신 보고서(주로 Claude Sonnet 4.5 사용)에서는 기본 지표를 활용해 다양한 질문을 탐구합니다. 예를 들어, 작업이 복잡해질수록 Claude의 성공률이 어떻게 변하는지, 그리고 현재까지의 Claude 사용 패턴이 많은 직업에서 전반적인 탈숙련화(deskilling)를 예고하는지 등을 다룹니다.
네 번째 경제 지표 보고서 전문은 여기에서 확인할 수 있습니다. 아래에서는 주요 결과를 요약합니다.
경제 기본 지표를 개별 작업, 직업, 그리고 관찰된 변화의 총체적 영향 순으로 적용해 분석했습니다. (기본 지표의 정확도 검증 방법을 포함한 전체 방법론은 보고서 전문 2장에 상세히 기술되어 있습니다.)
분석 결과, 복잡한 작업일수록 Claude를 통한 속도 향상 폭이 더 컸습니다. 이는 대화 입력을 이해하는 데 필요한 학력 연수를 Claude가 추정하는 방식으로 측정합니다. Claude.ai에서 고등학교 학력(12년)이 필요한 작업은 속도가 9배 빨라졌고, 대학 학위(16년)가 필요한 작업은 12배 빨라졌습니다. (API에서는 속도 향상 폭이 더 컸습니다.) 이 결과는 AI의 생산성 향상이 현재 비교적 높은 인적 자본을 요구하는 작업에 집중되고 있음을 시사하며, 화이트칼라 전문직이 업무에서 AI를 더 많이 활용한다는 기존 연구 결과와도 일치합니다.
작업 성공률을 반영해 보정해도 같은 추세가 유지되지만, 그 정도는 다소 약해집니다. Claude는 대학 학위가 필요한 작업을 66%의 확률로 성공적으로 완료하는 반면, 고등학교 학력 미만이 필요한 작업은 70%의 성공률을 보입니다. 이로 인해 전체 효과는 줄어들지만, 사라지지는 않습니다. Claude의 속도 향상 효과는 복잡도에 따라 가파르게 증가하는 반면, 복잡도에 따른 성공률 하락 폭은 상대적으로 완만하기 때문입니다.
METR의 AI 작업 시간 범위(task horizons) 측정에 따르면, 작업 시간이 길수록 AI 모델이 완료하기 어렵습니다. 하지만 모델 성능이 향상됨에 따라 AI 모델이 처리할 수 있는 작업 시간은 꾸준히 늘어나고 있으며, 이 지표는 이제 AI 발전을 가늠하는 핵심 척도로 자리 잡았습니다.
경제 기본 지표를 활용하면 METR의 분석을 보완할 수 있습니다. 아래 그래프는 사람이 동일한 작업을 수행하는 데 걸리는 시간 대비 Claude의 작업 수준 성공률을 Claude.ai와 API 각각에 대해 보여줍니다.

METR의 벤치마크에 따르면 Claude Sonnet 4.5(이번 분석에 사용된 모델)는 2시간짜리 작업에서 50% 성공률을 달성합니다. 반면, 자체 API 데이터에서는 거의 두 배인 약 3.5시간짜리 작업에서 50% 성공률을 보였고, Claude.ai에서는 약 19시간으로 훨씬 더 깁니다. 하지만 이 차이가 보이는 것만큼 모순되지는 않습니다. 측정 방법론에 중요한 차이가 있기 때문입니다. 우리 샘플에서는 사용자가 복잡한 작업을 작은 단계로 나눌 수 있어 피드백 루프가 형성되고, Claude가 방향을 수정할 수 있습니다. 또한 고정된 작업 세트 대신, 사용자가 성공 가능성이 높다고 판단하는 작업을 가져온다는 점에서 일종의 선택 편향이 존재합니다.
이 분석은 Claude의 실효적 작업 시간 범위가 일관된 작업 세트를 사용한 연구와 달라 보일 수 있음을 보여줍니다. 향후 보고서에서도 이 지표를 지속적으로 추적할 예정입니다.
분석 결과, 경제 발전 단계가 다른 국가들에서 Claude는 매우 다른 종류의 작업에 활용되고 있었습니다. 1인당 GDP가 높은 국가에서는 업무나 개인 용도로의 활용 비중이 훨씬 높은 반면, 그 반대쪽에 위치한 국가들에서는 교육 과제에 활용되는 비율이 더 높았습니다. 이는 직관적인 '도입 곡선(adoption curve)' 패턴과 일치합니다. 저소득 국가에서는 교육과 소수의 업무 작업에 AI 사용이 집중되고, 국가가 부유해질수록 개인적 용도까지 활용이 다양화되는 것입니다.
이 결과는 교육 분야 AI 사용과 낮은 1인당 소득의 상관관계, 여가 분야 AI 사용과 높은 소득의 상관관계를 밝힌 Microsoft의 최근 연구와도 일치합니다. 르완다 정부 및 기술 교육 기관 ALX와의 최근 파트너십도 이러한 맥락에서 설계되었습니다. 참가자들은 먼저 AI 활용 역량을 개발하고, 일부 수료자에게는 Claude Pro 1년 이용권을 제공하는 파일럿 프로그램을 운영하여 교육 용도에서 더 광범위한 활용으로의 전환을 지원하고 있습니다.
2025년 1월 데이터를 기반으로 한 첫 번째 보고서에서는 샘플 내 직업의 36%가 전체 작업 중 최소 4분의 1 이상에서 Claude를 활용하고 있었습니다. 여러 보고서의 데이터를 종합하면 이 수치는 49%로 상승했습니다. 하지만 Claude의 성공률을 반영하면(해당 작업의 수행 빈도와 소요 시간으로 가중치를 부여), AI의 영향을 가장 크게 받는 직업에 대한 그림이 달라집니다.
아래 그래프에서 x축은 기존의 직업별 작업 커버리지, y축은 새로 보정한 측정값을 나타냅니다. 두 지표 간에 분명한 상관관계가 있지만, 데이터 입력 담당자나 영상의학과 전문의 같은 직업은 작업 커버리지만으로 보는 것보다 AI의 영향을 훨씬 크게 받고 있으며, 반대로 교사나 소프트웨어 개발자 같은 직업은 상대적으로 영향이 적은 것으로 나타납니다.
다만, 이렇게 보정한 평가에도 여전히 한계가 있습니다. Claude.ai에서 수행된 작업만을 평가 대상으로 삼고 있으며, 이러한 대화가 실제 현장의 변화에 어떻게 대응하는지 항상 명확하지는 않습니다. 향후 보고서에서 이 부분을 더 깊이 파고들 계획입니다.
추가로 탐구한 질문은, AI가 커버하는 작업이 해당 직업 내에서 고숙련 영역인지 저숙련 영역인지 여부입니다. 각 작업에 필요한 기술 수준을 추정한 결과, Claude는 상대적으로 높은 학력을 요구하는 작업을 더 많이 커버하는 것으로 나타났습니다. 구체적으로, Claude가 커버하는 작업은 평균 14.4년의 교육(미국 준학사 학위 수준)을 필요로 하며, 이는 경제 전체 평균인 13.2년보다 높습니다(아래 참조). 이 결과는 화이트칼라 근로자가 Claude를 더 많이 활용한다는 앞선 발견과 일맥상통합니다.
실험적으로, Claude가 커버하는 작업을 제거했을 때 직업의 작업 구성이 어떻게 변하는지 추정해 보았습니다. 1차적 효과로는 고학력 작업이 제거되므로 직업이 평균적으로 탈숙련화됩니다. 테크니컬 라이터, 여행사 직원, 교사 등의 직업이 영향을 받으며(보고서에서 더 자세히 논의합니다), 드물지만 부동산 관리자처럼 반대 방향의 영향을 받는 직업도 있습니다.
이러한 탈숙련화가 반드시 일어날 것이라고 예측하는 것은 아닙니다. 설령 AI가 현재 지원하는 작업을 완전히 자동화하더라도, 노동 시장은 이 분석에서 포착하지 못하는 방식으로 동태적으로 조정될 수 있습니다. (물론 모델이 발전하면 AI가 커버하는 작업의 구성도 달라질 것입니다.) 그럼에도 이 분석은 가까운 미래에 AI가 직업에 미칠 가장 즉각적인 영향을 가늠하는 유용한 신호를 제공한다고 판단합니다.3
이전 연구에서는 AI가 광범위하게 도입될 경우 향후 10년간 미국 노동 생산성 성장률이 연간 1.8%p 높아질 수 있다고 추정한 바 있습니다. 이는 추세 성장률의 약 두 배에 해당합니다. 새로운 기본 지표를 통해 이 분석을 재검토했습니다.
작업별 속도 향상만을 기준으로 하면, API 데이터를 추가하더라도 기존의 1.8%p 증가 추정치가 재현되었습니다. 그러나 작업 신뢰도, 즉 작업의 성공 확률로 작업 수준 시간 절감 추정치를 보정하면, Claude.ai에서 완료된 작업의 경우 약 3분의 1 감소한 연간 1.2%p로, API에서 완료된 일반적으로 더 난이도 높은 작업의 경우 약간 더 감소한 1.0%p로 추정치가 낮아집니다.
그럼에도 연간 노동 생산성 성장률이 1%p 증가하는 것만으로도 상당히 주목할 만한 수치입니다. 미국의 생산성 성장률이 1990년대 후반~2000년대 초반 수준으로 회복되는 것을 의미하기 때문입니다. 또한 이전 연구에서 언급했듯이, 이 최상위 추정치는 AI 모델의 성능이 크게 향상되거나 업무에서의 AI 활용이 훨씬 정교해질 가능성을 반영하지 않은 것입니다. 이러한 요인은 수치를 훨씬 더 끌어올릴 수 있습니다. 실제로 이번 조사 이후 Claude Opus 4.5가 출시되면서 Claude의 성능은 크게 향상되었습니다.
기본 지표 외에도, 이전 보고서에서 추적해온 측정 항목에 대해 새로운 데이터를 수집했습니다. 이를 통해 2025년 1월부터 11월까지 AI 사용의 추세를 파악할 수 있었습니다. 대부분의 항목에서 기존 분석 결과와 크게 다르지 않은 소폭의 변화만 관찰되었으며, Claude 사용이 불균등하게 분포한다는 기존 결론이 유지되었습니다.
첫째, Claude 사용은 여전히 특정 작업에 고도로 집중되어 있습니다. Claude.ai에서 3,000개의 고유한 업무 작업이 샘플에 포함되어 있지만, 상위 10개 작업이 전체의 24%를 차지하며, 이 비율은 2025년 1월의 21%에서 꾸준히 상승했습니다. 특히 컴퓨터 및 수학 관련 작업이 Claude 사용을 압도적으로 주도하고 있어, Claude.ai 전체 대화의 약 3분의 1, API 트래픽의 거의 절반을 차지합니다.
둘째, 이번 보고서에서 Claude.ai의 상호작용 패턴을 보면 증강(augmentation, 52%)이 자동화(automation, 45%)를 추월했습니다. 8월 샘플에서는 자동화가 49% 대 47%로 앞섰던 것과 반대 결과입니다. 다만 더 긴 시간 프레임으로 보면, 자동화의 비중은 여전히 완만하게 상승하는 추세입니다. 작년 1월에는 증강이 55% 대 41%로, 3월에는 55% 대 42%로 앞서 있었습니다.
셋째, 이전 보고서에서 논의한 AI 사용의 지리적 집중 현상은 여전히 뚜렷합니다. 미국, 인도, 일본, 영국, 한국이 Claude.ai 전체 사용량에서 여전히 상위를 차지하며, 도입률은 1인당 GDP로 잘 설명됩니다. 다만 미국 내부에서는 주목할 만한 변화가 관찰되었습니다. Claude 사용이 미국 각 주 간에 눈에 띄게 균등해지고 있으며, 이 추세가 유지된다면 2~5년 내에 전국적으로 사용이 균등화될 것으로 모델은 예측합니다. 이 모델에 대한 자세한 내용은 보고서에서 다룹니다.
이번 최신 경제 지표 보고서에서 가장 직접적으로 도출되는 결론은, AI가 글로벌 노동력에 미치는 영향이 여전히 매우 불균등하다는 점입니다. AI 사용은 특정 국가와 직업에 집중되어 있으며, 작업 커버리지 분석이 보여주듯 직업마다 받는 영향도 크게 다릅니다.
더 넓은 시각에서, 이번 보고서는 향후 조사와 비교할 수 있는 새로운 기준선을 마련했습니다. Claude가 발전할수록 더 어려운 작업이 요청되고, 성공률도 높아질 것으로 기대합니다. 또한 작업이 신뢰성을 갖추면서 Claude.ai에서 API로(즉, 소비자 중심에서 기업 중심으로) 이동할 가능성도 있습니다. 만약 그렇게 된다면 이는 경제적 영향의 또 다른 선행 지표가 될 수 있습니다. AI의 생산성 효과에서 기업 도입이 핵심적인 역할을 하기 때문입니다. 기본 지표를 통해 이러한 변화가 실제 결과에 미치는 영향—사람들의 업무 성격이 어떻게 달라지는지, 누가, 어디서 가장 큰 영향을 받는지—을 이 급격한 기술 전환 시기에 지속적으로 측정해 나갈 것입니다.
한편, 연구자, 언론인, 그리고 일반 대중은 이 데이터를 자신의 연구와 사고에 활용하고, 필요한 정책 대응의 실증적 토대로 삼을 수 있습니다. 위에서 다룬 각 주제에 대한 더 자세한 내용은 보고서 전문을 참고하시기 바랍니다.