에이전트 시대에서 앞서가는 법
이 질문에 대한 답이 있긴 한데, 조금 복잡합니다. 세 가지 요소를 생각해봐야 합니다. 첫째, AI 능력의 들쭉날쭉한 경계(Jagged Frontier) 때문에, 복잡한 작업에서 AI가 잘할지 못할지를 사전에 확실히 알 수 없습니다. 둘째, 잘하든 못하든 AI는 확실히 빠릅니다. 사람이 몇 시간 걸릴 작업을 몇 분 만에 해냅니다. 셋째, (전문직 인건비에 비하면) 저렴하고, 여러 버전을 만들어 대부분 버려도 전혀 개의치 않습니다.
이 세 가지 요소를 종합하면, AI에게 위임할지 여부는 세 가지 변수에 달려 있습니다:
사람 기준 소요 시간(Human Baseline Time): 해당 작업을 직접 수행했을 때 걸리는 시간
성공 확률(Probability of Success): AI가 한 번의 시도에서 기대 수준을 충족하는 결과물을 내놓을 확률
AI 처리 시간(AI Process Time): AI에게 요청하고, 결과를 기다리고, 평가하는 데 걸리는 총 시간

유용한 사고 모델은 이렇습니다. "작업 전체를 직접 하는 것"(사람 기준 소요 시간)과 "AI 활용에 따른 오버헤드"(AI 처리 시간)를 저울질하는 것인데, 만족스러운 결과가 나올 때까지 이 오버헤드를 여러 번 지불해야 할 수도 있습니다. 성공 확률이 높을수록 AI 처리 시간을 지불하는 횟수가 줄어들고, AI에게 맡기는 것이 더 유리해집니다. 예를 들어, 직접 하면 1시간 걸리는 작업을 AI가 몇 분 만에 해내지만, 결과를 검토하는 데 30분이 걸린다고 합시다. 이 경우 성공 확률이 매우 높지 않으면, 초안을 생성하고 검토하는 데 들이는 시간이 직접 하는 것보다 오히려 더 많아집니다. 반면 사람 기준 소요 시간이 10시간이라면, AI가 어느 정도 수준의 결과물을 낼 수 있다는 전제하에, AI와 몇 시간을 씨름하더라도 충분히 가치가 있습니다.

이 방정식이 실제로 작동한다는 것을 뒷받침하는 근거가 있습니다. 지난여름 OpenAI가 AI와 실제 업무에 관한 매우 중요한 논문인 GDPval을 발표했습니다. 이전에 다룬 적이 있지만, 핵심은 금융부터 의료, 행정까지 다양한 분야의 숙련된 전문가와 최신 AI를 맞붙이고, 별도의 전문가 집단이 심판 역할을 했다는 것입니다. 전문가들이 작업을 완료하는 데 평균 7시간이 걸렸으므로, 이 경우 사람 기준 소요 시간은 7시간입니다. AI 처리 시간은 흥미로운 부분인데, AI 자체의 작업 시간은 불과 몇 분이었지만, 전문가가 결과를 실제로 검토하는 데 1시간이 걸렸고, 프롬프트 작성에도 시간이 필요했습니다. 성공 확률의 경우, GDPval이 처음 공개되었을 때는 심판들이 대부분 사람의 손을 들어줬지만, GPT-5.2가 출시되면서 판도가 바뀌었습니다. GPT-5.2 Thinking 및 Pro 모델은 평균 72%의 비율로 전문가와 동등하거나 더 나은 평가를 받았습니다.

이제 7시간짜리 작업에서 성공 확률 72%, 평가 시간 1시간이라는 조건을 대입해 절약되는 시간을 계산해볼 수 있습니다. 모든 작업에 대해 AI에게 프롬프트를 작성하고, 1시간 동안 결과를 평가한 뒤, AI가 실패하면 직접 수행하는 방식을 적용하면, 평균 3시간을 절약할 수 있습니다. AI가 실패한 작업은 오히려 시간이 더 걸리지만(프롬프트 작성과 검토에 시간을 허비했으니까요), AI가 성공한 작업에서는 훨씬 빠릅니다. 그런데 매니지먼트 기법을 활용하면 이 방정식을 더욱 유리하게 바꿀 수 있습니다!
AI 위임의 효과를 높이기 위해 할 수 있는 세 가지가 있습니다. 성공 확률을 높이고 AI 처리 시간을 줄이는 것이 핵심입니다. 첫째, 더 명확한 지시를 내려 AI가 높은 성공률로 실행할 수 있는 목표를 설정할 수 있습니다. 둘째, 평가와 피드백 역량을 향상시켜 원하는 결과를 얻기까지 필요한 시도 횟수를 줄일 수 있습니다. 셋째, AI의 작업 품질을 판단하는 과정 자체를 더 효율적으로 만들어 평가에 드는 시간을 단축할 수 있습니다. 이 세 가지 모두 해당 분야의 전문 지식이 있을수록 유리합니다. 전문가는 어떤 지시를 내려야 하는지 알고, 무언가 잘못됐을 때 더 빨리 알아차리며, 수정 방향도 정확하게 잡을 수 있기 때문입니다.

구체적인 요구사항이 없다면, 최신 AI 모델은 스스로 문제 해결 방법을 알아내는 능력이 놀라울 정도로 뛰어납니다. 예를 들어, Claude Code에 "완전히 오리지널한 올드스쿨 Sierra 스타일 어드벤처 게임을 EGA풍 그래픽으로 만들어라. 이미지 에이전트로 이미지를 생성하고 파서도 달아라. 모든 퍼즐은 흥미롭고 풀 수 있게. 게임을 완성하고(플레이 시간 10~15분), 질문하지 말 것. 놀랍고 즐거운 게임으로 만들어라"라는 프롬프트 하나만 줬더니, 아트워크를 포함해 모든 것을 AI가 만들어냈습니다. 이후 프롬프트 두 번으로 게임을 테스트하고 배포까지 완료했습니다. 직접 플레이해볼 수 있습니다: enchanted-lighthouse-game.netlify.app

정말 놀라운 결과지만, 이 놀라움이 더 극대화된 이유는 구체적인 요구사항이 없었기 때문입니다. AI가 자유롭게 즉흥적으로 만든 어드벤처 게임이니까요. 하지만 실제 업무, 실제 위임에서는 머릿속에 구체적인 결과물이 있고, 바로 여기서 어려움이 시작됩니다. 내가 원하는 것을 AI가 실행하도록 의도를 어떻게 전달해야 할까요? AI가 스스로 "판단"하며 문제를 풀되, 내가 원하는 결과물은 정확히 내놓도록 하려면 어떻게 해야 할까요?
이 문제는 AI 등장 훨씬 전부터 존재했고, 너무나 보편적이어서 모든 분야가 이를 해결하기 위한 고유의 문서 체계를 만들어왔습니다. 소프트웨어 개발자는 제품 요구사항 문서(Product Requirements Document)를 작성합니다. 영화 감독은 샷 리스트를 넘기고, 건축가는 디자인 의도 문서를 만듭니다. 미 해병대는 5단락 명령서(상황, 임무, 실행, 행정, 지휘)를 사용합니다. 컨설턴트는 세부 산출물 스펙이 담긴 프로젝트 범위 문서를 작성합니다. 이 모든 문서가 에이전트 시대의 AI 프롬프트로 놀라울 만큼 잘 작동합니다(AI는 수 페이지에 달하는 지시사항도 한 번에 처리할 수 있습니다). 이렇게 다양한 형식이 AI 지시에 통하는 이유는, 본질적으로 이것들이 전부 같은 목적을 가지고 있기 때문입니다. 한 사람의 머릿속에 있는 것을 다른 사람의 행동으로 옮기려는 시도인 것이죠.
좋은 위임 문서에 실제로 어떤 내용이 들어가는지 살펴보면, 놀라울 정도로 일관됩니다. 무엇을, 왜 달성하려는가? 위임된 권한의 범위는 어디까지인가? "완료"란 어떤 상태인가? 구체적으로 어떤 산출물이 필요한가? 진행 상황을 추적하기 위한 중간 산출물은 무엇인가? 완료를 보고하기 전에 무엇을 점검해야 하는가? 이것들이 명확하게 정의되어 있으면, AI도 사람과 마찬가지로 훨씬 더 좋은 결과물을 냅니다.
그리고 AI에게 이런 지시를 내리는 방법을 고민하다 보면, 결국 매니지먼트를 재발명하고 있다는 사실을 깨닫게 됩니다.
주요 AI 연구소의 저명한 소프트웨어 개발자들이 자신의 업무가 코딩 위주에서 AI 에이전트 관리 위주로 바뀌고 있다고 이야기하는 것은 매우 흥미로운 현상입니다. 코딩은 원래부터 체계적인 구조를 갖추고 있고, 결과물의 검증이 명확합니다(코드가 작동하거나, 작동하지 않거나). 그래서 AI 도구가 가장 먼저 성숙한 분야이자, 이 변화를 가장 먼저 체감한 직업군이 된 것입니다. 하지만 마지막은 아닐 것입니다.

경영대학원 교수로서, 많은 사람들이 AI 에이전트와 협업하는 데 필요한 역량을 이미 갖추고 있거나 충분히 배울 수 있다고 생각합니다. 매니지먼트의 기본 역량이니까요. 필요한 것을 설명하고, 효과적인 피드백을 주고, 업무 결과를 평가하는 체계를 설계할 수 있다면, 에이전트와 함께 일할 수 있습니다. 여러 면에서, 적어도 자신의 전문 분야에서는, 교묘한 프롬프트를 짜내는 것보다 훨씬 쉬운 일입니다. 사람과 함께 일하는 것에 더 가깝기 때문이죠. 한편, 매니지먼트는 항상 희소성을 전제로 해왔습니다. 혼자서 모든 것을 할 수 없고, 인재는 한정되어 있으며 비용이 높기 때문에 위임하는 것이었죠. AI가 이 방정식을 바꿉니다. 이제 "인재"는 풍부하고 저렴합니다. 희소한 것은 무엇을 요청해야 하는지 아는 능력입니다.
제 학생들이 뛰어난 성과를 보인 이유가 바로 여기에 있습니다. 이들은 AI 전문가가 아니었습니다. 하지만 수년간 자기 전문 분야에서 문제의 범위를 설정하고, 산출물을 정의하고, 재무 모델이나 의료 보고서의 오류를 감지하는 훈련을 받아왔습니다. 수업과 실무에서 체득한 프레임워크가 있었고, 그 프레임워크가 곧 프롬프트가 되었습니다. 흔히 "소프트 스킬"이라고 가볍게 여겨지던 역량이 실은 가장 핵심적인 역량이었던 셈입니다.
모든 사람이 지칠 줄 모르는 에이전트 군단을 거느린 매니저가 되는 세상에서 업무가 정확히 어떤 모습일지는 아직 모릅니다. 하지만 앞으로 잘 해나갈 사람은 좋은 결과물이 어떤 것인지 알고, AI조차 그것을 구현할 수 있을 만큼 명확하게 설명할 수 있는 사람일 것입니다. 제 학생들은 4일 만에 이것을 터득했습니다. AI 네이티브여서가 아니라, 이미 매니징하는 법을 알고 있었기 때문입니다. 그동안의 모든 훈련이, 알고 보니 바로 이 순간을 위한 준비였던 셈입니다.
