구독하기

조직 AX의 다음 단계: AI Agent 팀 구성 실험에서 배운 것

조직 AX의 다음 단계: AI Agent 팀 구성 실험에서 배운 것

2025년 한 해 동안 기업의 AX 파트너로서 600건 이상의 AI 유즈케이스를 분석한 결과, 흥미로운 패턴을 발견했습니다. 전체 유즈케이스의 90.4%가 개인 과제에 집중되어 있었고, 조직 과제는 9.6%에 불과했습니다. 대부분의 AI 활용이 '내 업무를 효율화하는 것'에 머물러 있었던 것입니다.

물론 개인 업무 자동화는 중요한 출발점입니다. 하지만 여기서 멈춘다면, 조직 전체의 생산성 혁신으로 이어지기 어렵습니다. 개별 직원이 ChatGPT로 이메일을 빠르게 작성하는 것과, 팀 전체의 워크플로우가 AI와 함께 돌아가는 것은 본질적으로 다른 차원의 변화이기 때문입니다.

그렇다면 다음 단계는 무엇일까요? 최근 코멘토 CTO가 흥미로운 실험을 시작했습니다. AI Agent들로 팀을 구성해서, 실제 업무를 수행하게 하는 것입니다. 전략을 세우는 Agent, 데이터를 분석하는 Agent, 콘텐츠를 작성하는 Agent, 품질을 검수하는 Agent가 서로 협업하며 일하는 구조입니다. 아직 실험 단계이지만, 이 시도가 보여주는 가능성과 현실적인 교훈은 HRD 담당자들이 주목할 만합니다.

이 글에서는 AI Agent가 무엇인지, 어떻게 팀처럼 협업할 수 있는지, 그리고 이 실험이 조직 AX의 다음 단계에 어떤 시사점을 주는지 살펴보겠습니다.

AI Agent, 무엇이 다른가?

AI Agent라는 용어를 들어보셨을 겁니다. 하지만 이 개념은 사람마다 다르게 이해되고 있고, ChatGPT와 무엇이 다른지 명확하지 않은 경우가 많습니다. 본론에 들어가기 전에, 이 글에서 말하는 AI Agent가 무엇인지 먼저 정리하겠습니다.

ChatGPT와 같은 생성형 AI는 기본적으로 '도구'입니다. 사용자가 질문하면 답변하고, 요청하면 텍스트를 생성합니다. 주도권은 항상 사람에게 있습니다. 반면 AI Agent는 '자율적으로 실행하는 주체'에 가깝습니다. 목표를 부여받으면 스스로 판단하고, 필요한 도구를 활용하며, 여러 단계의 작업을 순차적으로 수행합니다.

예를 들어 "다음 주 마케팅 보고서를 준비해줘"라고 요청했을 때, ChatGPT는 보고서 초안을 작성해줄 수 있습니다. 하지만 AI Agent는 먼저 필요한 데이터를 수집하고, 분석하고, 보고서를 작성한 뒤, 검토까지 진행할 수 있습니다. 단순히 응답하는 것이 아니라, 목표 달성을 위해 여러 행동을 연결하는 것입니다.

여기서 한 걸음 더 나아간 개념이 '멀티 에이전트'입니다. 하나의 Agent가 모든 일을 하는 것이 아니라, 여러 Agent가 각자의 역할을 맡아 협업하는 구조입니다. 마치 팀원들이 역할을 나눠 프로젝트를 진행하는 것처럼, 분석 담당 Agent, 기획 담당 Agent, 실행 담당 Agent가 서로 소통하며 업무를 처리합니다. 코멘토 CTO의 실험은 바로 이 멀티 에이전트 구조를 실제 업무에 적용해본 사례입니다.

어떤 업무에 AI Agent 팀을 적용했나?

코멘토 CTO가 AI Agent 팀을 적용한 업무는 '콘텐츠 마케팅'이었습니다. 구체적으로는 포텐스닷 라운지의 활성화를 위한 콘텐츠 전략 수립과 제작입니다. 포텐스닷 라운지는 포텐스닷AI를 사용하는 사용자들의 커뮤니티로, AI 활용에 관련된 다양한 정보와 이야기를 공유하는 공간입니다.

이 업무의 기존 프로세스는 다음과 같았습니다. 먼저 Google Search Console 데이터를 분석해서 어떤 키워드에 기회가 있는지 파악합니다. 그 다음 분석 결과를 바탕으로 콘텐츠 주제를 선정하고, 글을 작성하고, 검수를 거쳐 발행합니다. 전형적인 콘텐츠 마케팅 워크플로우입니다.

문제는 이 모든 과정을 사람이 순차적으로 처리해야 한다는 점이었습니다. 데이터 분석에 시간이 들고, 주제 선정에 판단이 필요하고, 글 작성과 검수에 또 리소스가 들어갑니다. 각 단계마다 담당자의 시간과 에너지가 투입되어야 하니, 콘텐츠를 지속적으로 생산하는 것 자체가 부담이 됩니다.

CTO는 이 워크플로우 전체를 AI Agent 팀에게 맡겨보기로 했습니다. 분석, 전략, 작성, 검수 각 단계를 담당하는 Agent를 구성하고, 이들이 협업해서 콘텐츠를 만들어내는 구조입니다.

왜 이 업무였을까요? 콘텐츠 마케팅은 AI Agent 팀을 실험하기에 적합한 조건을 갖추고 있었습니다. 첫째, 반복적이면서도 판단이 필요한 지식 업무입니다. 단순 반복 작업이라면 기존 자동화 도구로도 충분하지만, 이 업무는 데이터 해석, 전략적 판단, 창의적 글쓰기가 모두 필요합니다. 둘째, 명확한 산출물이 있습니다. 콘텐츠라는 결과물이 나오기 때문에 성과를 측정하고 개선점을 찾기가 수월합니다.

AI Agent 팀의 일 하는 방식

CTO가 구성한 AI Agent 팀은 크게 두 개의 팀으로 나뉩니다. 실제 콘텐츠 업무를 수행하는 'TF팀'과, 이 팀의 성과를 분석하고 최적화하는 '플랫폼팀'입니다.

TF팀의 구성

TF팀에는 네 명의 Agent가 있습니다. 팀을 이끄는 전략가(Team Lead), 데이터를 분석하는 분석가(SEO Analyst), 글을 작성하는 작성자(Writer), 품질을 검수하는 검수자(Editor)입니다. 각 Agent는 자신의 역할에 맞는 전문성을 가지고 있고, 서로 대화하며 업무를 진행합니다.

일하는 방식: Daily Scrum부터 Weekly Review까지

이 팀의 하루는 Daily Scrum으로 시작합니다. 매일 전략가와 분석가가 모여 Google Search Console 데이터를 검토하고, 콘텐츠 전략을 수립하고, 주제를 선정합니다. 분석가는 키워드별 클릭수, 노출수, CTR, 순위 등을 분석하고, 어떤 주제가 기회가 있는지 평가합니다.

분석가(SEO Analyst)가 키워드 성과를 분석하고 콘텐츠 기회를 발굴
분석 결과를 바탕으로 선정된 콘텐츠 주제와 타겟 키워드 도출

회의가 끝나면 전략가는 사람에게 Google Chat으로 보고합니다. "이런 주제로 콘텐츠를 작성하려고 합니다. 승인해주시겠습니까?" 여기서 중요한 점은 사람이 승인자로서 의사결정에 참여한다는 것입니다. AI Agent가 모든 것을 알아서 처리하는 것이 아니라, 핵심적인 판단은 사람이 내립니다. 이를 'Human-in-the-loop'라고 합니다.

AI Agent가 사람에게 승인을 요청하는 보고서. 시급도, 신뢰도, 승인 근거 등이 포함되어 있다

승인이 떨어지면 작성자가 글을 씁니다. 글이 완성되면 검수자가 리뷰를 하고, 품질이 기준에 미치지 못하면 피드백을 줍니다. 작성자와 검수자는 최대 3번까지 이 과정을 반복하며 글의 완성도를 높입니다.

금요일 오후에는 팀 전체가 모여 Weekly Review를 진행합니다. 한 주간의 성과를 돌아보고, KPT(Keep-Problem-Try) 회고를 통해 무엇을 유지하고, 무엇이 문제였고, 무엇을 시도해볼지 정리합니다. 흥미로운 점은 이 회고 과정에서 전략가가 프롬프트 개선안까지 제안한다는 것입니다. Agent가 스스로 자신의 작동 방식을 개선하려는 시도를 하는 셈입니다.

Weekly Review에서 Agent들이 서로 토론하며 문제를 분석하고 개선안을 논의하는 모습_1
Weekly Review에서 Agent들이 서로 토론하며 문제를 분석하고 개선안을 논의하는 모습_2

플랫폼팀: 프롬프트를 지속적으로 개선하는 역할

플랫폼팀은 한 명의 Agent로 구성되어 있습니다. 이 Agent의 역할은 TF팀이 어떻게 일했는지 분석하고, 시스템 전체를 최적화하는 것입니다.

여기서 핵심적인 포인트가 있습니다. AI Agent는 한번 세팅된 프롬프트로 계속 움직이는 것이 아닙니다. 플랫폼팀은 Agent가 수행한 업무의 결과를 보고, 프롬프트를 지속적으로 개선해 나갑니다.

Weekly Review가 끝나면 플랫폼팀은 TF팀의 실행 데이터를 살펴봅니다. 각 Agent가 몇 번 실행되었는지, 평균 실행 시간은 얼마인지, 토큰은 얼마나 사용했는지, 비용은 얼마가 들었는지, 품질 점수와 성공률은 어떤지 등을 분석합니다. 예를 들어 콘텐츠 작성자(Writer)의 성공률이 86%로 목표(90%)에 미치지 못하면, 플랫폼팀은 이 문제의 원인을 파악하고 프롬프트 개선안을 제안합니다. "출력 형식을 더 명확하게 명시하고, JSON 출력 예시를 추가하면 실패율이 14%에서 2%로 줄어들 것"이라는 식입니다.

플랫폼팀이 분석하는 Agent별 실행 횟수, 평균 실행 시간, 비용, 품질, 성공률 데이터
플랫폼팀이 제안하는 프롬프트 개선안. 현재 프롬프트와 개선된 프롬프트를 비교해서 보여준다

또한 워크플로우 자체를 기술적으로 검토해서 병목 지점을 찾아내기도 합니다. 네트워크 오류나 API 제한으로 인한 실패가 발견되면, 재시도 메커니즘을 구현하는 방안을 제안하는 것처럼요.

쉽게 말해 TF팀이 '일하는 팀'이라면, 플랫폼팀은 '일하는 방식을 개선하는 팀'입니다. 이 구조 덕분에 AI Agent 팀은 단순히 주어진 업무를 수행하는 것을 넘어, 스스로 발전해나갈 수 있는 가능성을 갖게 됩니다. 사람이 매번 프롬프트를 수정하지 않아도, 시스템이 자체적으로 개선점을 찾고 제안하는 구조인 것입니다.

아직 실험 중, 그래서 더 의미 있는 것들

한 가지 분명히 해야 할 점이 있습니다. 이 AI Agent 팀은 아직 실험 단계입니다. 실제 프로덕션 환경에서 운영되기 전, 테스트와 개선을 반복하고 있는 중입니다. 따라서 이 글에서는 성공 사례가 아니라 실험 과정에서 발견한 문제와 그에 대한 대응을 공유합니다.

발견한 과제: 분석과 실행 사이의 괴리

Weekly Review에서 드러난 가장 큰 문제는 '데이터 기반 의사결정과 실행력 간의 단절'이었습니다. AI Agent 팀이 8건의 콘텐츠에 대해 APPROVE(승인 권장) 결정을 내렸지만, 실제로 완료된 콘텐츠는 0건이었습니다. 분석은 했고, 판단도 했고, 승인도 받았는데, 정작 결과물은 나오지 않은 것입니다.

왜 이런 일이 벌어졌을까요? KPT 회고를 통해 몇 가지 원인이 파악되었습니다. 첫째, 의사결정 시 실행 단계별 장애 요소에 대한 사전 검토가 부족했습니다. 승인은 쉽게 났지만, 실제로 콘텐츠를 만들어내는 과정에서 막히는 부분을 예측하지 못한 것입니다. 둘째, 콘텐츠 작성 전 독자 페르소나와 해결할 문제를 명확화하는 과정이 생략되었습니다. 셋째, 작성과 검수 사이에 중간 피드백 시스템이 없었습니다.

Weekly Review에서 진행된 KPT 회고. Keep(유지할 것), Problem(문제점), Try(시도할 것)

실패를 통해 만들어진 개선안

흥미로운 점은 이 문제를 발견한 것도, 해결책을 제안한 것도 AI Agent 팀 자체였다는 것입니다. Weekly Review에서 Agent들은 스스로 문제를 인식하고, 구체적인 개선안에 합의했습니다.

예를 들어 Editor는 '3단계 검수 시스템'을 제안했습니다. 기획 승인 → 초안 중간점검(50% 완성 시점) → 최종 검수로 이어지는 구조입니다. 또한 의사결정 시 '실행 가능성 체크리스트' 5개 항목을 의무적으로 검토하고, 주 1회 중간 진행 상황 점검과 최소 발행 기준(MVP)을 설정하기로 했습니다.

이 과정에서 팀 리더인 전략가 Agent는 이렇게 자기 평가를 남겼습니다. "팀 리더로서 의사결정과 실행 사이의 간격을 전혀 관리하지 못했습니다. 앞으로는 APPROVE 결정 시 실행 단계별 점검과 중간 관리를 철저히 하겠습니다."

완벽한 자동화보다 점진적 개선 구조

이 실험이 보여주는 핵심 교훈은 명확합니다. AI Agent 팀은 처음부터 완벽하게 작동하지 않습니다. 그리고 그것이 당연합니다. 중요한 것은 문제를 발견하고, 원인을 분석하고, 개선안을 만들어 적용하는 구조가 갖춰져 있느냐입니다.

CTO의 실험에서 이 구조는 Weekly Review와 KPT 회고, 그리고 플랫폼팀의 지속적인 최적화를 통해 구현되었습니다. 한번 만들어놓고 알아서 돌아가는 시스템이 아니라, 계속해서 학습하고 발전하는 시스템을 지향하는 것입니다. 실제 프로덕션 환경에서 돌아가는 것은 아직 다음 단계의 일이지만, 이 점진적 개선 구조가 갖춰졌다는 것 자체가 의미 있는 진전입니다.

HRD 담당자가 지금 주목해야 할 것

AI Agent 팀 구성은 아직 초기 단계의 실험입니다. 당장 도입을 검토할 수준은 아닙니다. 그렇다면 HRD 담당자가 이 사례에서 가져갈 수 있는 것은 무엇일까요?

개인 교육에서 조직 워크플로우 설계로

지금까지 대부분의 생성형 AI 교육은 개인 역량 향상에 초점을 맞춰왔습니다. 프롬프트 작성법, ChatGPT 활용법, 업무별 AI 도구 사용법 등이 주된 내용이었습니다. 물론 이것은 필요한 출발점입니다. 하지만 개인이 AI를 잘 쓰는 것과, 조직의 워크플로우에 AI가 통합되는 것은 다른 문제입니다.

CTO의 실험이 시사하는 바는 명확합니다. AI 활용의 다음 단계는 개인이 아니라 조직 단위입니다. 분석, 기획, 실행, 검토라는 워크플로우 전체를 어떻게 AI와 함께 설계할 것인가가 앞으로의 과제가 됩니다. HRD 담당자라면 "직원들이 AI를 잘 쓰게 하려면?"이라는 질문에서 한 발 더 나아가, "우리 조직의 업무 흐름에 AI를 어떻게 녹여낼 수 있을까?"를 고민해볼 필요가 있습니다.

AI Agent 시대에 필요한 조직 역량

AI Agent가 팀처럼 일하는 시대가 온다면, 조직에는 어떤 역량이 필요할까요? 이 실험을 통해 몇 가지 단서를 얻을 수 있습니다.

첫째, 워크플로우를 명확하게 정의하는 역량입니다. AI Agent는 모호한 지시를 스스로 해석하지 못합니다. "콘텐츠 좀 만들어줘"가 아니라, 데이터 분석 → 주제 선정 → 초안 작성 → 검수 → 수정이라는 단계가 명확히 정의되어야 Agent들이 협업할 수 있습니다.

둘째, 품질 기준을 설정하는 역량입니다. 이 실험에서 Writer와 Editor가 최대 3회까지 반복하며 글을 다듬은 이유는, 어떤 수준이 '완성'인지 기준이 있었기 때문입니다. 조직이 AI와 협업하려면, 산출물의 품질 기준을 구체적으로 정의할 수 있어야 합니다.

셋째, Human-in-the-loop를 설계하는 역량입니다. AI Agent가 아무리 발전해도, 핵심적인 의사결정은 사람이 내려야 합니다. 어느 지점에서 사람이 개입하고, 무엇을 승인하고, 어떤 피드백을 줄 것인지를 설계하는 것이 중요합니다. 이 실험에서 CTO가 Google Chat으로 승인 요청을 받고 판단을 내린 것처럼요.

지금은 관찰하고 준비하는 시점

AI Agent 팀 구성을 당장 도입할 필요는 없습니다. 기술도 아직 성숙하지 않았고, 검증된 방법론도 부족합니다. 하지만 이 방향으로 기술이 발전하고 있다는 것은 분명합니다. HRD 담당자로서 지금 할 수 있는 일은 이런 실험들을 관찰하고, 우리 조직에 적용한다면 어떤 업무가 적합할지 미리 생각해보는 것입니다.

CTO가 콘텐츠 마케팅 업무를 선택한 이유를 떠올려보세요. 반복적이면서도 판단이 필요한 지식 업무, 명확한 산출물이 있어 성과 측정이 가능한 업무. 우리 조직에도 이런 특성을 가진 업무가 있을 것입니다. 그것을 찾아두는 것이 준비의 시작입니다.

AI Agent 팀 구성은 아직 실험 단계입니다. 코멘토 CTO의 시도 역시 프로덕션 환경에서 검증된 것이 아니라, 가능성을 탐색하는 과정에 있습니다. 8건의 승인 결정에도 불구하고 실제 완료된 콘텐츠가 0건이었다는 사실은, 이 기술이 얼마나 초기 단계인지를 보여줍니다.

그러나 방향성은 분명해 보입니다. AI 활용은 개인에서 조직으로 확장될 것입니다. 개별 직원이 ChatGPT를 잘 쓰는 것을 넘어, 조직의 워크플로우 자체가 AI와 함께 설계되는 시대가 오고 있습니다. 그 과정에서 AI Agent는 단순한 도구가 아니라, 역할을 맡아 협업하는 주체로 자리 잡을 가능성이 있습니다.

HRD 담당자의 역할도 달라질 것입니다. 직원들에게 AI 도구 사용법을 교육하는 것에서, 조직이 AI와 어떻게 협업할지를 설계하는 것으로 확장됩니다. 워크플로우를 정의하고, 품질 기준을 설정하고, 사람이 개입해야 할 지점을 설계하는 일. 이것이 앞으로 HRD가 준비해야 할 영역입니다.

지금 당장 AI Agent 팀을 도입할 필요는 없습니다. 하지만 이런 실험들이 진행되고 있다는 것, 그리고 그 과정에서 어떤 문제가 발견되고 어떻게 해결되고 있는지를 관찰하는 것은 의미가 있습니다. 기술이 성숙했을 때 빠르게 적용할 수 있는 조직은, 지금부터 준비하는 조직일 것입니다.