차세대 소프트웨어 개발 및 제공의 한 분야인 AI 기반 코딩 코파일럿에 대한 과대광고는 새로운 국면을 맞이했습니다. 지난 몇 년 동안 우리는 기존 업체들이 제공하는 제품들을 보아 왔습니다. DevOps GitHub(GitHub Copilot)와 같은 벤더, Cursor와 같은 신생 기업, 그리고 OpenAI(Codex), Anthropic(Claude Code) 등과 같은 기반 모델 기업들까지, 이러한 도구들은 모두 더 빠른 코드 생성, 반복적인 작업 제거, 그리고 기존의 인간 기반 페어 프로그래밍 방식에 비해 경제적으로 건전한 접근 방식을 약속합니다. 동시에, 이러한 도구들은 대규모 개발 조직의 리더들에게 소프트웨어 개발 경제성을 개선하고, 혁신 속도를 촉진하며, 궁극적으로 소프트웨어 개발 및 제공의 비즈니스 프로세스를 개선하는 수단으로 자리매김하고 있습니다.
하지만 기업이 직면한 초기 불편한 진실은 이렇습니다. 코딩 조종사는 가장 큰 병목 현상을 거의 해결하지 못하고 약속한 대로 사업 성과를 개선하지 못합니다.
코딩 부조종사(Copilot)가 앞으로도 계속 존재할 것이라는 데는 의심의 여지가 없습니다. 그들은 로컬 개발자의 생산성을 향상시킬 수 있으며, 실제로 그렇게 하고 있습니다. 하지만 소프트웨어 개발 및 배포 프로세스(특히 대규모 기업의 경우)는 계획, 코딩, 테스트, 보안 및 애플리케이션 프로덕션 릴리스를 아우르는 복잡하고 상호 연결된 시스템이며, 적절한 거버넌스와 규정 준수를 유지하는 데에도 영향을 미칩니다. 부조종사만으로는 코딩 효율성을 높일 뿐, 더 큰 기회, 즉 전체 소프트웨어 수명 주기에 걸쳐 흐름, 보안 및 품질을 개선하는 기회를 놓치게 됩니다.
기업에서 코딩 부조종사의 충격적인 한계
코딩 코파일럿은 개발 조직 내에서 다른 어떤 AI 솔루션보다 빠르게 도입되었습니다. 최근 추정에 따르면 지난 2년 동안 기업 R&D 조직의 90% 이상이 부조종사를 완전히 채택했거나 조종했습니다.그러나 변화 관리와 툴링 비용의 영향은 엇갈렸습니다. 최근 몇 달 동안 발표된 두 가지 구체적인 보고서는 업계 전반에 실망감을 안겨주었는데, 그중에는 부조종사 도입을 보여준 METR 보고서도 포함되었습니다. 실제로 개발자를 더 느리게 만들었습니다. 그리고 기업의 모든 AI 프로젝트의 95%가 "실패했다".
가장 큰 의문은 코딩 부조종사들이 기업에 기대했던 효과를 내지 못하는 이유입니다. 이러한 실패는 여러 가지 단순한 현실에 기인합니다.
- 코드 생성은 더 큰 프로세스의 한 단계일 뿐입니다. – 코딩 부조종사들은 IDE(통합 개발자 환경) 내에서 시각화되고 참여합니다. 이들은 코드 조각, 디자인 패턴, 보일러플레이트 코드를 제안하는 데 있어 세계적인 수준이지만, 특히 더 크고 복잡한 환경에서는 더 넓은 맥락을 파악하지 못하는 경우가 많습니다. 이들은 비즈니스 우선순위, 아키텍처 표준, 보안 요구 사항, 규정 준수 규칙에 대한 지식이 부족합니다.
- 코딩 조종사는 상류에서 나쁜 계획 관행을 확대합니다. – 대부분의 기업에서 계획 프로세스는 코딩보다 훨씬 더 힘들고 시간이 많이 소요됩니다. 우선순위 지정, 업무 분할, 그리고 작업 할당은 며칠이나 몇 주가 아닌 몇 달 단위로 측정되는 경우가 많습니다. 실제로 우리가 매일 거래하는 많은 고객들이 코딩보다 계획 수립에 5~10배 더 많은 시간을 소비합니다. 더욱 어려운 점은, 상류 계획에 결함이 있을 경우(불분명한 요구 사항, 어긋난 우선순위, 연결되지 않은 로드맵), 부조종사들은 개발자들이 잘못된 것을 더 빨리 개발하도록 돕는다는 것입니다. 잘못된 방향으로 가는 속도를 높이고 자동화하는 것은 가치를 창출하는 것이 아니라 낭비를 심화시킬 뿐입니다.
- 하류의 통합 및 전달 병목 현상 – 사람이 작성했든 기계가 작성했든 코드는 테스트, 보안, 스캔, 그리고 배포되어야 합니다. 다운스트림 프로세스가 느리거나, 수동적이거나, 불안정하거나, 단편화되어 있다면, 코딩 시간을 단축하더라도 더 빠르고 효과적인 배포로 이어지기 어렵습니다. 기업의 코딩 부조종사들은 다운스트림에서 발생하는 진정한 병목 현상을 해결하지 못하는 경우가 많아, 그 영향이 미미합니다.
- 기업 규모 및 복잡성 – 소프트웨어 개발에는 "코드는 작성된 코드보다 10배 더 많이 읽힌다"라는 옛말이 있습니다. 기업에서는 더욱 그렇습니다. 스타트업과 달리 대기업은 레거시 시스템, 복잡한 아키텍처, 방대한 코드 베이스, 전 세계에 분산된 팀, 그리고 엄격한 규제 현실과 씨름합니다. 코딩 부조종사들은 이러한 과제를 이해하지 못하기 때문에 해결하지 못합니다.
- 수학은 수학이 아니다 – 이름에서 알 수 있듯이, 코딩 코파일럿은 개발자를 대상으로 합니다. 실제로 기업 개발 조직 구성원 중 실제 개발자는 평균 50%에 불과합니다. 디자이너, 아키텍트, QA 전문가 등이 여기에 포함됩니다. 더욱 어려운 점은, 이 50%의 사람들이 평균적으로 코드 작성에 25%의 시간만 사용한다는 것입니다. 이들은 종종 회의에 참석하거나, 연구를 하거나, 새로운 아이디어를 화이트보드에 적는 데 시간을 보냅니다. 코파일럿에 대한 초기 긍정적인 평가는 개발자 생산성이 10~30% 향상되었다는 것을 보여주지만, 현재 최대 효과는 50% x 25% x 20%로, 전체 프로세스에서 최대 2.5%의 개선 효과를 가져옵니다.
코딩의 상류와 하류에 있는 더 큰 잠금 해제
이것이 우리가 존재하는 이유의 핵심입니다. 설계상, Digital.ai 소프트웨어 구축 및 제공의 비즈니스 프로세스를 개선하고 최적화하기 위해 존재합니다. 따라서 코딩 부조종사 역할을 중요하게 생각하지만, 데이터와 고객들은 코딩 전후에 자동화와 연결 조직을 개선할 때 진정한 흐름이 열린다는 것을 보여줍니다.
상류: 에이전트 계획
대기업은 전체 R&D 시간의 최대 50%를 계획 수립에 사용합니다. AI를 활용하여 계획 수립에 더욱 능동적인 접근 방식을 도입하면 아이디어 도출부터 개발까지의 시간을 단축할 수 있을 뿐만 아니라, 막판 변경이나 예상치 못한 갈등을 방지하기 위한 의사 결정 능력도 향상됩니다. 계획 수립이 더욱 지능적이고 적응적으로 진행될 때, 코딩 코파일럿의 영향력은 혁신을 촉진하고 비즈니스 목표와의 연계성을 향상시킵니다.
다운스트림: 에이전트 테스트, 에이전트 보안 및 에이전트 전달
코딩 단계부터 Agentic Planning을 도입하는 것은 큰 잠재력을 지니고 있지만, 가장 큰 기회는 바로 다운스트림에 있습니다. Agentic Testing의 발전은 끊임없이 확장되는 다양한 기기와 환경에서 소프트웨어 품질을 보장하는 데 도움이 되고 있습니다. Agentic Security는 배포 속도를 높이는 동시에 방어력을 강화하여 개발 초기 단계에서 앱을 강화하고 운영 단계에서 지능적으로 보호할 수 있도록 지원합니다. 또한 Agentic, 자동화, 그리고 사람의 작업을 혼합한 더욱 스마트한 배포 파이프라인은 제어, 규정 준수 또는 거버넌스를 희생하지 않고도 가치 제공 속도를 높여줍니다. 이러한 다운스트림 혁신은 원시 코드를 비즈니스 가치로 더욱 빠르게 전환합니다. safer, 마찰이 적습니다.
코딩보다 더 스마트한 전달
AI는 소프트웨어 개발 및 제공 분야의 르네상스를 이끌고 있습니다. 모든 조직은 이 4차 산업혁명 시대에 발맞춰 사고방식을 바꿔야 합니다. 진정한 생산성 향상은 코딩처럼 개별적인 작업을 개선하고 최적화하는 데서 오는 것이 아니라, 업무 흐름 전반의 마찰을 제거하는 데서 옵니다. 코딩 부조종사(copilot)도 이러한 흐름의 일부이지만, 이것이 궁극적인 목표는 아닙니다.
기업이 상류(에이전트 계획)와 하류(에이전트 테스트, 보안 및 제공)에 투자하고 혁신을 이루면 소프트웨어 개발의 4차 물결에서 약속한 진정한 기하급수적 이익을 얻을 수 있습니다. 즉, 더 높은 비즈니스 가치, 출시 시간 단축, 위험 감소, 보안 강화 및 예측 가능한 결과 등을 얻을 수 있습니다.
다음 블로그에서는 4차 산업혁명의 이점을 활용할 준비가 된 기업을 위한 구체적인 "방법" 로드맵을 중점적으로 다룰 예정입니다.
당신은 또한 좋아할 거라
소프트웨어 개발의 네 번째 물결을 타고 가다: 에이전트 AI가 소프트웨어의 계획, 구축 및 제공 방식을 어떻게 재정의하고 있는가
"변화만이 유일한 불변이다." - 헤라클레이토스 30년이 지났습니다…