즐겨 찾는 SNS를 열어보면, 어딘가 모르게 서로 비슷비슷해 보이는 게시물들로 가득하다는 걸 금세 알아챌 수 있습니다:
이를 가장 선명하게 볼 수 있는 곳은 교육 현장입니다. 공동 연구팀(Wharton 동료들 포함)이 발표한 두 편의 논문은 AI를 생각의 지름길로 쓰는 것과 생각을 돕는 도구로 쓰는 것의 차이를 잘 보여줍니다. 첫 번째 논문은 터키의 한 고등학교에서 약 천 명의 수학 학습자를 대상으로 진행한 실험입니다. 한 집단은 ChatGPT를 사용하고, 나머지는 AI 없이 공부했습니다. ChatGPT를 쓴 학생들은 숙제를 더 잘 해냈고 스스로도 더 많이 배우고 있다고 느꼈지만, 막상 시험에서는 AI 없이 공부한 학생들보다 낮은 점수를 받았습니다. AI가 도움이 되는 조수로 설계되다 보니 결국 답을 그냥 떠먹여 주었고, 진짜 학습에는 정신적 노력이 필요하기 때문입니다. 노력을 우회하면 학습도 우회됩니다. AI가 교실 학습에 미치는 초기 결과들이 이토록 우려스러운 이유가 바로 여기에 있습니다.
그런데 같은 저자들 중 상당수가 참여한 두 번째 논문에서는 전혀 다른 결과가 나왔습니다. 타이베이 열 곳의 고등학교에서 천 명 가까운 학생들을 대상으로 5개월짜리 파이썬 과정을 운영한 연구입니다. AI 튜터가 개인 맞춤형 문제 순서를 제공받은 학생들은 AI 도움 없이 치른 최종 시험에서 0.15 표준편차 높은 점수를 기록했습니다. 일부 추정에 따르면, 이는 수업 시간이나 교사 업무 부담을 전혀 늘리지 않고도 6~9개월치 추가 교육 효과에 해당합니다. AI가 학생 개개인에게 맞는 학습을 설계하는 데 쓰인 덕분입니다. 이는 AI 튜터링에 관한 다른 연구 결과들과도 맥을 같이 합니다. 제대로 활용할 때 맞춤형 튜터가 학습 효과를 크게 높일 수 있다는 것입니다.

AI를 어떻게 쓰느냐의 차이는 사실 그리 크지 않지만, 결과는 판이하게 달라집니다. 더 큰 문제는 인간의 본성이 우리를 잘못된 선택으로 이끈다는 점입니다. 학습이란 스스로의 무지를 직면하고 힘겨운 지적 작업을 해내는 과정인데, 이것은 본능적으로 불편합니다. 학생들이 어려운 문제를 직접 풀 때 더 많이 배우면서도 재미있는 강의를 더 교육적이라고 평가하는 이유가 바로 그것입니다. AI를 통해 학습의 혜택을 누리려면, AI에게 문제를 해결시키는 방식에서 AI가 스스로 문제를 풀도록 밀어붙이는 방식으로 전환해야 합니다.
다행히도 주요 AI 기업 세 곳 모두 AI를 튜터처럼 활용해 학습을 지원하는 기능을 제공하고 있습니다. 아쉽게도 접근 방법이 직관적이지는 않습니다. 가장 쉬운 건 Gemini입니다. 플러스 버튼을 눌러 '안내식 학습(Guided Learning)'을 선택하면 됩니다. ChatGPT는 채팅창에 "/learn"을 입력하면 됩니다. Claude는 플러스 버튼을 누른 뒤 '스타일 사용(use style)'을 선택하고 '학습(learning)'을 고르면 됩니다(Anthropic은 이 방식을 변경할 예정이라고 발표했지만 아직 관련 문서는 공개되지 않았습니다). 어떤 경우든 가능하면 추론 모델이나 고급 모델을 사용하는 것이 좋고, 특히 STEM 과목에서는 더욱 그렇습니다. 다만 이런 모드들은 배우고자 하는 의지가 있는 사람을 뒷받침해줄 뿐, 부정행위를 막아주지는 않습니다.
AI가 반드시 사고 능력을 갉아먹는 건 아닙니다. 하지만 잘못 사용하면 그렇게 될 수 있고, 잘못된 방식이 기본값인 경우가 많습니다. Wharton의 동료들은 이를 "인지적 항복(cognitive surrender)"이라 부르며, AI가 틀린 답을 내놓을 때조차 사람들이 생각을 멈추고 AI에게 모든 걸 맡겨버리는 현상을 실증적으로 보여줬습니다. 이 문제의 일부는 이런 도구들이 설계된 방식에서 비롯된다고 생각합니다.

AI 시스템이 복잡한 대화를 주고받아야 했고 오류도 잦았을 때는, 인간이 매 단계에서 능동적으로 개입해야 했습니다. 에이전트 시스템은 그냥 알아서 처리해버리도록 설계되어 삶을 편하게 만들어 줍니다. 무언가를 해내는 데는 더할 나위 없지만, 무언가를 배우거나, 진정성을 유지하거나, 인지적 항복을 피하는 데는 독이 됩니다. 어려운 요청을 던졌더니 답이 나왔을 때, 그냥 AI의 답을 받아들이고 싶은 유혹이 생기는 건 당연합니다.
Fabrizio Dell'Acqua와 Harvard, MIT, University of Warwick, BCG 등 여러 기관의 동료들과 함께 최근 발표한 논문에서(3년 전에 이 글에서 다룬 바 있지만, 학술 논문 출판이라는 게 시간이 오래 걸리더군요!), 우리는 Boston Consulting Group 컨설턴트 758명을 대상으로 실험을 진행했습니다. 그 중 절반에게 GPT-4 접근 권한을 부여했는데, AI를 활용한 컨설턴트들은 그렇지 않은 컨설턴트들을 크게 앞질렀습니다. 하지만 우리가 AI가 실패할 것이라고 알고 있던 문제를 풀게 했을 때, AI를 사용한 컨설턴트들이 오히려 그렇지 않은 컨설턴트들보다 정답을 맞힐 가능성이 현저히 낮았습니다. AI가 권위 있어 보이지만 사실은 틀린 답을 제시했는데, 다른 모든 분야에서 탁월한 성과를 보인 그 엘리트 컨설턴트들 대부분이 이를 잡아내지 못한 것입니다. 물론 이제 AI는 그 문제도 척척 풀어내니, 오류율이 핵심 문제는 아닙니다. 진짜 문제는 같은 항복의 충동에 이끌려 훌륭한 컨설턴트가 되는 법을 배울 기회를 잃는다는 것입니다.
다시 말하지만, 이것이 기본값이 될 필요는 없습니다. Anthropic이 진행한 소규모 연구에서, 프로그래머들이 AI를 활용해 새로운 작업을 수행했습니다. AI에게 모든 걸 맡겨버린 사람들은 자신이 한 작업에 대한 질문에 제대로 답하지 못했는데, 이는 항복의 전형적인 징후입니다. 반면 AI에게 자신이 하는 일을 설명해달라고 요청하거나, 일부 작업에만 AI 도움을 받은 사람들은 그런 결과를 피할 수 있었습니다.
해결책의 일부는 도구 자체에 있을 수 있지만, 그것만으로는 한계가 있습니다. 매번 답하기 전에 "직접 생각해보도록 유도해드릴까요, 아니면 바로 답을 드릴까요?"라고 묻거나, "이건 직접 쓰시는 게 더 진정성 있을 것 같아요"라고 알려주는 ChatGPT는 대부분의 상황에서 그저 짜증스러울 뿐입니다. 그러나 우리가 반드시 이런 상기를 필요로 하는 순간도 분명 있습니다. 타이베이 연구 결과는 하나의 방향을 시사합니다. 사용자 개인의 의지력보다는 시스템 수준의 제약이 효과적이라는 것입니다. 하지만 소비자 제품에서는 그런 시도가 거의 보이지 않고, 상업적 압력은 대부분 정반대 방향으로 작용합니다.
문제의 상당 부분은 결국 우리 자신에게 달려 있습니다. 솔직히 말하면, 저는 많은 부분에서 인지적 항복을 기꺼이 받아들입니다. 전화번호는 더 이상 외우지 않습니다. 스마트폰이 대신해주니까요. 아이들이 필기체를 배우지 않아도 되는 세상이 반갑습니다. 계산기가 일상적인 수학을 처리하고, 컴퓨터가 수업 일정을 알아서 짜주는 것도 편합니다. 한때는 유용한 기술이었지만, 내려놓는 게 맞는 것들도 있습니다.
AI는 다릅니다. 이 기술은 워낙 범용적이라 거의 모든 인지적 작업을 어느 정도 AI에 넘길 수 있습니다. 글쓰기를 지나치게 신성시하고 싶지는 않습니다. 세련된 이메일 초안이 반드시 인간의 머릿속에서 나와야 한다는 원칙은 없으니까요. 덧셈 계산을 꼭 손으로 해야 한다는 법이 없는 것처럼요. 그러나 모든 것을 포기하고 싶지는 않고, 어떤 작업에서 무엇이 중요하고 무엇이 그렇지 않은지 우리는 아직 대부분 모릅니다. 그것을 판단하는 일 자체가 진짜 도전입니다.
요점은 AI를 피하는 게 아니라, 의도를 갖고 사용하는 것입니다. 반사적 의존도, 반사적 거부도 아닌, AI 사용에 대한 의식적인 선택 말입니다. 더 넓게 보면, 지금 우리는 어떤 일을 AI에 맡길지에 대한 기본값이 설정되는 시점에 와 있습니다. 마찰 없는 사용을 위해 설계하는 AI 기업들, '잘 활용하는 것'의 기준을 정하는 고용주들, 끊임없이 변하는 'AI 리터러시' 개념을 가르치는 교육자들이 그 기본값을 만들어가고 있습니다. 아이러니하게도 이 모든 일이 제대로 된 계획이나 고민 없이 이루어지고 있습니다. 한 세대의 직장인과 학생들이 이 기본값을 중심으로 습관을 굳히고 나면, 되돌리기가 몹시 어려워질 것이라고 저는 생각합니다. 우리가 지금 할 수 있는 가장 중요한 일은 무엇을 AI에 넘기고 무엇을 우리 손에 쥐고 있을지 계속 질문하는 것입니다. 그리고 그 답을 AI를 포함한 그 누구에게도 대신 내려달라고 기대하지 않는 것입니다.

이는 특히 소설 창작에서 두드러집니다. AI는 강한 것처럼 보이지만 사실 소설에서는 악명 높을 만큼 취약합니다. ChatGPT는 특히 의미 없는 직유와 은유를 즐겨 씁니다("그 거리는 이가 빠진 미소 같았다", "그는 나무들이 부러워할 자세로 앉아 있었다"). 처음에는 심오하게 느껴질 수 있지만, 그건 우리가 어려운 글은 의도적인 것이라고 전제하고 거기에 의미를 애써 부여하기 때문입니다. 인간은 의미 없는 것에도 의지만 있으면 얼마든지 의미를 만들어낼 수 있습니다.