사회과학자 1,260명을 대상으로 AI 및 코딩 에이전트 사용 현황을 조사한 결과를 담았다.
인문사회과학은 전환점을 맞고 있다. 핵심 연구 작업을 기계에 맡길 수 있게 된 것은 사상 처음 있는 일이다. AI 챗봇은 권위 있는 학술지와 사회과학 분야를 포함해 과학 연구 전반에서 점점 더 큰 역할을 담당하고 있다. 이를 두고 AI가 연구 생산성을 끌어올릴 수 있다는 낙관론이 부상하는 한편, 동료 심사 과부하와 AI가 생산한 저품질 논문의 범람에 대한 우려도 함께 커지고 있다.
그러나 순서를 주고받는 방식의 AI 챗봇이 주로 글쓰기 보조에 쓰였다면, 코딩 에이전트는 사회과학 연구의 구조 자체를 더 근본적으로 재편할 가능성이 있다. Claude Code나 Codex 같은 에이전트 기반 코딩 플랫폼은 연구 아이디어와 데이터셋을 받아 분석을 설계·실행하고, 결과를 해석하며 자율적으로 수정을 반복할 수 있다. 실증 연구에서 인간만이 할 수 있다고 여겨졌던 단계들이 처음으로 자동화될 수 있게 된 것이다. 극단적인 사례로는 컴퓨터과학 연구를 자동화하거나 사회과학 연구 아이디어를 자율적으로 실행하는 멀티 에이전트 파이프라인을 구축한 경우도 있다.
이 도구들은 과학 연구를 가속하고 더 대담한 시도를 가능하게 할 수 있다. 연구 실행 속도가 빨라지면 새로운 발견이 더 빠르고 풍부하게 이뤄질 수 있다. 반면 연구 자원의 격차를 심화시키고, 학술 기록의 과잉을 부추길 위험도 있다. 더 근본적으로는, AI가 점점 더 넓은 범위의 연구 작업을 떠맡게 되면서, AI 특유의 분석 방식이 경제·사회·인간 자신에 대한 우리의 집단적 이해를 형성해나갈 수도 있다.
이 글에서는 2026년 초에 진행한 정량적 사회과학자 1,260명 대상 설문을 바탕으로 첫 번째 결과를 공개한다. 이 설문은 코딩 에이전트가 연구 생산성에 미치는 영향을 파악하기 위한 대규모 장기 연구의 기초 조사로, Claude Code 접근 권한을 제공하는 무작위 실험도 포함된다. 해당 실험 결과는 추후 발표할 예정이다. 이번 글에서는 기초 조사를 통해 드러난 내용, 즉 누가 어떤 목적으로 이 도구를 사용하는지, 사용자와 비사용자 간에 연구 산출물이 어떻게 다른지, 그리고 연구자들이 확산되는 도입에 대해 어떤 전망을 갖고 있는지를 살펴본다.
설문은 2026년 2월 말부터 3월까지 진행됐으며, 정량적 방법론을 활용하는 현직 사회과학자를 대상으로 했다. 이는 대표 표본이 아니다. 응답자는 Claude Max 계정 접근 권한을 제공하는 연구에 참여하도록 모집됐기 때문에, AI 도구에 관심 있는 연구자들 쪽으로 표본이 편향될 수 있다. 다만 응답자들의 특성은 보다 일반적인 초청장을 받은 이전 표본과 큰 차이를 보이지 않았다(부록의 표 A2 참고).
응답자는 경제학, 정치학, 사회학에 고르게 분포했으며 각 분야가 전체의 약 5분의 1을 차지했고, 경영학과 심리학이 그 뒤를 이었다(표 A1 참고). 공중보건, 교육학, 커뮤니케이션 분야 응답자도 소수 포함됐다. 직급별로는 정교수·부교수가 약 40%, 조교수가 25%, 박사과정생이 약 30%였다.
전반적인 AI 사용 여부는 두 가지 방식으로 측정했다. 먼저 "연구 과정에서 생성형 AI 모델을 활용한 적이 있습니까?"라고 물었고, 81%가 그렇다고 답했다.
그렇다면 갈수록 강력해지는 코딩 에이전트를 실제 워크플로에 도입한 연구자는 얼마나 될까? 이를 파악하기 위해 "명령줄에 통합된 AI 코딩 어시스턴트(Codex, Cursor, Claude Code 등)를 주 1회 이상 정기적으로 사용합니까?"라고 질문했고, 후속 질문을 통해 해당 도구(또는 Google Antigravity)를 실제로 사용하는지 확인했다.1
코딩 에이전트를 사용하는 응답자는 전체의 20%에 불과했다. 설문은 2025년 12월 말부터 시작된 Claude Code와 Opus 4.6 관련 논의 열풍이 지난 약 두 달 후에 진행됐다. 그럼에도 AI 도구에 관심을 갖고 자발적으로 참여한 응답자들 사이에서조차 에이전트를 워크플로에 도입한 비율은 5분의 1에 그쳤다. 가장 많이 사용하는 코딩 에이전트는 Claude Code로, 사용자의 86%가 이를 활용한다고 밝혔다. 그다음으로 많이 쓰이는 Codex는 31%였다.

그림 1에서 볼 수 있듯이 분야별 도입률 편차는 크다. 경제학자는 39%, 정치학자는 25%인 반면, 공중보건(6%), 교육학(4%), 커뮤니케이션(6%)은 한 자릿수에 머물렀다. 이러한 격차는 분야별 전반적인 AI 사용률 차이와 대체로 비슷한 양상을 보이지만, 코딩 에이전트 도입률 격차는 평균적으로 더 가파른 편이다.
박사과정생과 박사후연구원 중에서는 4명 중 1명 이상이 코딩 에이전트를 주 1회 이상 사용하는 반면, 정교수의 경우 그 비율이 절반 이하로 떨어진다. 코딩 에이전트를 먼저 받아들이는 건 주니어 연구자들이다. 이들은 기술 친화도가 높고, 코드와 데이터를 직접 다루는 경우가 많으며, 연구 성과에 대한 경력 압박도 상대적으로 크다.

도입률 격차는 분야와 경력 단계를 넘어 더 광범위하게 나타난다. 연구자 이름을 성별 기준으로 분류한 결과, 남성으로 분류된 이름을 가진 연구자의 코딩 에이전트 도입률은 여성으로 분류된 연구자의 두 배를 웃돌았다. 상위권 및 사립대학 소속 연구자들의 사용률도 눈에 띄게 높았다. 이러한 차이는 모두 p<0.05 수준에서 통계적으로 유의하다. 전반적인 AI 사용률 격차보다 훨씬 두드러진 이 수치는, 적어도 코딩 에이전트 초기 도입 단계에서 불평등이 상당하다는 점을 시사한다.
코딩 에이전트 사용의 성별 격차는 단순히 AI를 처음 시도하는 비율의 차이에서 비롯된 것이 아니다. 연구에 AI를 활용해본 경험이 있는 응답자들만 따로 보면, 코딩 에이전트 정기 사용에서의 성별 격차는 전체 표본에서보다 오히려 더 크게 나타난다. 같은 분야와 경력 단계 내에서 비교해도 이 격차는 유지된다.

코딩 에이전트든 챗봇이든 AI를 사용하는 연구자들은 실제로 어디에 활용하고 있을까? 학술 연구에서 AI를 둘러싼 논의는 주로 글쓰기에 집중되어 왔다. 환각으로 가득한 문헌 검토, 판에 박힌 서론에 등장하는 "이것은 X가 아니라 Y다"식 표현들, 그리고 완전 자동화된 논문 작성 가능성 같은 문제들이 주된 관심사였다.
그러나 그림 4를 보면, 코딩 에이전트 사용자와 비사용자 모두에서 가장 흔한 활용 목적은 정량적 데이터 분석 코드 작성이었다. 코딩 에이전트 사용자의 97%, 다른 AI 사용자의 77%가 코드 생성에 활용한다고 답했다. 그다음으로 많은 것은 문장 교정이었고, 연구 방법론 조언 요청과 선행 연구 탐색이 뒤를 이었다. 코딩 에이전트 사용자와 비사용자를 합산하면, AI를 이용해 문장을 초안 형태로 작성해본 경험이 있는 사용자는 전체의 3분의 1에 불과했다. 경제학자와 경영학 연구자만이 AI를 활용한 문장 초안 작성을 일반적으로 한다는 점을 제외하면, 이러한 패턴은 분야를 막론하고 대체로 일관되게 나타났다.

코딩 에이전트가 연구자의 생산성을 실제로 높이고 있는가? 이것이 이번 설문을 시작점으로 한 대규모 연구의 핵심 질문이다. 이 문제를 규명하기 위한 실험은 현재 진행 중이다. 기초 조사만으로도 연구 과정의 여러 단계에 걸쳐 코딩 에이전트 사용자와 비사용자를 비교할 수 있다. 이 비교는 순전히 서술적 분석이다. 코딩 에이전트 사용을 자발적으로 선택한 연구자와 그렇지 않은 연구자를 비교하는 것이므로, 두 집단 사이에는 통제하기 어려운 여러 차이가 있을 수 있다. 여기서 도출된 차이는 인과관계가 아닌, 사용자와 비사용자 간의 1차적 비교로 이해해야 한다.

그림 5는 설문 시점 기준 지난 6개월간 연구 과정 각 단계별 자기 보고 산출물을 보여준다. 프로젝트 착수부터 논문 투고까지의 흐름을 담았다. 조정 추정치는 경력 단계, 분야, 설문 완료 시점을 통제한 상태에서 코딩 에이전트 사용자와 비사용자를 비교한 결과다. 코딩 에이전트 사용자들은 프로젝트 착수, 워킹페이퍼 게시, 연구비 신청 건수가 더 많았고, 학술대회 발표 제출도 더 많은 것으로 나타났다.
그렇다면 코딩 에이전트 사용자들은 실제로 더 많은 논문을 쓰고 있을까? 먼저 연구 파이프라인 초기 단계의 산출물 차이를 살펴보면, 코딩 에이전트 사용자는 비사용자보다 프로젝트를 약 0.25편, 워킹페이퍼를 약 0.5편 더 많이 시작하거나 게시했다. 비율로 환산하면, 코딩 에이전트 사용자는 같은 분야·경력 단계의 비사용자보다 약 10%(실증 프로젝트 착수)에서 75%(워킹페이퍼 게시)가량 생산성이 높은 것으로 나타났다.
그러나 이러한 생산성 차이는 파이프라인 초기 지표에서만 확인된다. 코딩 에이전트 사용자가 학술지에 신규 논문을 더 많이 투고하거나 재투고를 더 빠르게 한다는 근거는 발견되지 않았다. 이는 코딩 에이전트 사용이 최근의 현상인 만큼, 논문이 투고 단계에 이르기까지 걸리는 시간을 반영하는 것일 수 있다. 동시에 코딩 에이전트가 프로젝트를 빠르게 궤도에 올리는 데는 유용하지만, 학술지 투고를 위해 논문을 완성도 높게 다듬는 마지막 단계에서는 그 효과가 제한적일 가능성도 있다.
연구자들이 AI 도구에 갖는 기대는 어떨까? AI가 사회과학자의 논문 작성 생산성을 실제로 높여줄 것인가? 그리고 AI가 사회과학 자체를 더 나은 방향으로 발전시킬 것이라고 보는가, 아니면 그 반대인가?
AI가 논문 작성 생산성을 높여줄 것이라는 기대는 전반적으로 높았다. 1~10점 척도에서 응답자의 88%가 5점 초과를 선택했고, 절반은 8점 이상을 매겼다. 그림 6에서 볼 수 있듯이, 이러한 평가는 AI 사용 방식과 뚜렷한 상관관계를 보인다. 그래프 왼쪽을 보면 더 다양한 용도로 AI를 활용하는 연구자일수록 낙관적인 태도를 보인다. 오른쪽을 보면 코딩 에이전트 사용자가 비사용자보다 더 긍정적으로 평가하는 경향이 있다.

설문 응답자들이 AI 도구를 직접 사용해보고자 하는 의지를 갖고 참여한 만큼, 생산성에 대한 낙관론이 나타나는 것은 자연스럽다. 그러나 이러한 낙관론자들 사이에서도, 논문 작성 생산성을 높이는 데 AI가 도움이 된다는 견해와 사회과학 전반에 긍정적인 영향을 미칠 것이라는 전망 사이에는 분명한 간극이 존재했다. 응답자의 70%는 분야 전반의 영향보다 논문 생산성에 대해 더 낙관적이었다. 반대로 논문 생산성보다 분야 전반의 영향에 더 긍정적인 응답자는 극히 드물었고, 분야 영향에 더 비관적인 응답자는 상당수였다.
코딩 에이전트를 사용하는 사회과학자들은 워킹페이퍼를 더 많이 게시하고, 연구비도 더 적극적으로 신청하고 있다. 같은 분야와 경력 단계의 연구자들과 비교해도 프로젝트 착수 건수가 더 많다. 그러나 2026년 3월 현재, 이것이 학술지 투고 증가로 이어지고 있다는 징후는 아직 없다. 프로젝트 착수 증가는 생산성 향상의 초기 신호일 수 있지만, 얼리어답터들이 원래부터 더 생산성 높은 연구자였을 가능성도 배제할 수 없다.
전반적으로 코딩 에이전트의 초기 도입은 초기 경력 연구자, 남성, 그리고 상위권 대학 소속 연구자에게 편중되어 있다. 현재 코딩 에이전트 사용의 분포 불균형은 LLM 전반의 사용 불균형보다 더 심한 편이다. 또한 연구자들은 논문 생산성 향상이라는 즉각적인 이점이 분야 수준의 비용을 수반할 수 있다는 점을 우려하는 것으로 보인다. 논문이 늘어나면 주목받기 위한 경쟁과 혼잡이 심화될 수 있다는 점, 또는 일부 연구자들이 AI 도구를 선택적 보고나 위험 회피적이고 점진적인 연구 같은 사회과학의 기존 문제들을 더 악화시키는 방식으로 사용할 것을 우려하는 것으로 해석할 수 있다.
이번 보고서에는 몇 가지 한계가 있다. 여기서 제시하는 데이터는 워크플로와 AI 사용에 관한 연구 참여를 명시적으로 제안받은 정량적 사회과학자들을 대상으로 한 이메일 설문에 기반한다. 응답자들은 LLM을 더 많이 사용하고, 비응답자보다 더 낙관적일 것으로 예상된다. 앞서 언급한 초기 단계의 생산성 차이는 서술적 비교로만 해석해야 한다. 코딩 에이전트 얼리어답터들은 비채택자보다 더 생산적이고 다방면에서 다른 특성을 지닐 수 있으며, 이러한 차이를 설문만으로는 직접 측정하기 어렵다. 마지막으로, 이번 분석은 연구자들이 보고한 프로젝트 수에만 초점을 맞추며, 연구 품질에 대해서는 다루지 않는다. 향후 업데이트에서는 코딩 에이전트 사용자와 명확한 비교 집단 간의 결과를 제시하고, 코딩 에이전트로 보완된 연구 결과물이 양적 차이뿐만 아니라 내용 면에서도 차이를 보이는지 살펴볼 예정이다.
이러한 한계에도 불구하고, 코딩 에이전트가 사회과학 분야로 확산되고 있다는 사실은 분명하다. 예를 들어 경제와 정치를 연구하는 방식이 AI 코딩 에이전트의 분석 결정에 점점 더 많이 의존하게 되는 것이다. 이러한 자동화의 가능성과 위험성에 관한 추가 근거를 향후 보고서에서 계속해서 제시할 계획이다.
Thomas Lyttelton, Maxim Massenkoff, Nathan Wilmers
Tim Belonax, Keir Bradwell, Jake Eaton, Rebecca Hiscott, Peter McCrory, Kerry Persen, Sarah Pollack, Santi Ruiz, Heather Whitney, Jack Clark.
여기에서 확인할 수 있다.
@online{lyttelton2026agents,
author = {Thomas Lyttelton and Maxim Massenkoff and Nathan Wilmers},
title = {Coding Agents in the Social Sciences},
date = {2026-05-27},
year = {2026},
url = {https://www.anthropic.com/research/http://www.anthropic.com/research/coding-agents-social-sciences},
}Alvero, A. J., Stoltz, D. S., Stuhler, O., & Taylor, M. A. (2026). Generative AI in Sociological Research: State of the Discipline. Sociological Science, 13, 45-62.
Korinek, A. (2025). AI agents for economic research (No. w34202). National Bureau of Economic Research. NBER Working Paper Series.
Liang, W., Zhang, Y., Wu, Z., Lepp, H., Ji, W., Zhao, X., ... & Zou, J. (2025). Quantifying large language model usage in scientific papers. Nature Human Behaviour, 1-11.
Lu, C., Lu, C., Lange, R. T., Yamada, Y., Hu, S., Foerster, J., ... & Clune, J. (2026). Towards end-to-end automation of AI research. Nature, 651(8107), 914-919.
Wilmers, N., & Engzell, P. (2026). The Paper Factory. SocArXiv Preprints.