AI 뉴스

Claude Code는 당신의 제품을 더 좋게 만들지 않는다

노동1호 2026. 5. 7. 20:04

AI 코딩 에이전트는 속도를 제공하지만, 제품 품질의 최전선에서는 여전히 인간의 취향과 판단이 결정적입니다.

Claude Code는 당신의 제품을 더 좋게 만들지 않는다

AI 코딩 에이전트가 개발 생산성을 혁신하고 있다는 목소리가 커지고 있습니다. "6년치 백로그를 한 분기에 처리했다", "모든 PR이 AI 생성", "전례 없는 속도로 출시" — 이런 주장들이ariant-backed 트위터에서 반복되고 있습니다.

그런데 실제로 제품을 만드는 엔지니어들은 다른 이야기를 하고 있습니다.

K자형 생산성 곡선

노동경제학자들의 데이터가 먼저 나왔습니다. 코딩 에이전트의 생산성 향상은 균등하지 않고 K자형으로 갈라집니다.

시니어 엔지니어: 2023년 LLM 변곡점 이후 측정 가능한 산출 증가를 보이고 있습니다.

주니어 엔지니어: 산출이 거의 정체하거나 오히려 감소하고 있습니다.

중요한 지표는 "시간당 코드 줄 수"가 아닙니다. "엔지니어 1인당 제품 개선 속도가 실제로 올라갔는가"가 진짜 질문입니다.

제품을 잘 만드는 엔지니어들의 경고

이야기가 더 흥미로운 건, 이 경고를 보내는 사람들이 AI 비평자가 아니라는 점입니다.

Dax는 opencode.ai를 만들고 있고, Karri Saarinen은 Linear의 CEO이며, David Cramer는 Sentry를 0에서 월 1,000만 달러 규모까지 성장시킨 인물입니다. 이 세 사람이 수일 내에 서로 다른 채널로 같은 패턴을 지적했습니다.

David Cramer는 다음과 같이 정리했습니다:

> "LLM은 현재 순생산성 향상을 만들지 못하고 있습니다. 시작 장벽은 낮추지만, 유지보수하기 어려운 복잡한 소프트웨어를 만듭니다. 장기 속도를 늦추는 것으로 보입니다."

그가 구체적으로 문제로 꼽는 세 가지:

• 복잡성 속 점진적 개발 성능 부족

• 진정한 단순화와 관용적 인터페이스 생성 능력 부족

• 엉성한 테스트 생성 기법

결론: "대부분이 비대화(bloat)"

반증: 왜 Claude Code의 격차가 나타나지 않는가

흥미로운 검증 지점이 있습니다. Anthropic의 Claude Code가 자사 제품 개발에 완전히 사용되었다면,산품 개선 속도가 가속되어야 합니다.

엔지니어링 생산성은 복리 함수입니다. 1.5배만 높아져도, 분기마다 경쟁자와의 격차가 벌어져야 합니다.

그런데 현실은 다릅니다:

Codex: Claude Code보다 몇 달 늦게 출시했지만 이미 기능적으로 경쟁 가능합니다.

Cursor: 거래 흐름이 강합니다.

Cognition과 Factory: 여전히 중요한 엔터프라이즈 계약을 따내고 있습니다.

사람들은 여전히 어떤 도구가 더 나은지 논쟁하고 있습니다. Anthropic이 Claude Code를 7개월간 독점적으로 가졌다면, 경쟁자와의 격차가 따라잡을 수 없을 만큼 커졌어야 했습니다. 그렇지 않다는 것은, 병목이 코드 생산이 아니었을 가능성이 큽니다.

코드 줄 수는 자산이 아니라 비용

여기서대다수가 놓치는 정신 모델이 있습니다.

최고의 엔지니어링 문화는 코드 줄 수를 생산물이 아니라 지출로 다릅니다. 중요한 기능에만 코드를 쓰고, 중요하지 않은 기능에는 쓰지 않습니다.

comma.ai의 소프트웨어 자회사 tinychat은 코드베이스가 일정 크기를 넘으면 알람이 울리게 했고, 삭제된 코드를 축하했습니다.

이유는 명확합니다:

• 모든 코드 줄은 버그 표면입니다.

• 모든 함수는 다음 함수의 의존성입니다.

• 모든 기능은 주변 기능을 만들어냅니다.

제품 표면적은 프랙탈처럼 확장됩니다:

• Slack 통합을 추가하면 → Teams 통합과 이메일 대체 경로가 필요합니다.

• 알림을 추가하면 → 모바일, SMS, 엔터프라이즈 MDM 정책에 맞춰 다시 만들어야 합니다.

• MFA 지원을 추가하면 → Duo, Okta, SAML과 호환돼야 합니다.

복잡성은 선형이 아니라 복리로 증가합니다.

Linear vs Jira가 보여주는 것

LinearJira
규모178명, 6년, ARR 1억 달러누적 엔지니어링 노력 56배 더 큼
소비자 품질 점수더 높음6점 낮음

품질과 코드베이스 질량은 같지 않습니다.

Facebook이 10만 명의 엔지니어를 보유하고 있지만,UI 코드를 빨리 생산하는 능력이 병목이 아닙니다. 숙련된 엔지니어는 Facebook 피드 목업을 하루 만에 만들 수 있습니다.

실제 제약은 수십억 명에게 어떤 부하와 지연 시간에서도 업타임을 유지하며 그 경험을 전달하는 코드 줄 수를 줄이는 것입니다.

보상 함수는 생산이 아니라 압축입니다.

이런 작업에서 코딩 에이전트는 장기 트레이드오프를 평가하지 못하며, 시스템에 대한 이론을 갖고 있지 않습니다.

진짜 병목은 코드 생산이 아니다

제품 품질의 최전선을 미는 것은 좋은 제품 아이디어를 얼마나 빨리 떠올리느냐입니다.

Jira와 Linear의 차이는 더 나은 박스를 그렸는지의 문제가 아닙니다. Linear에는 프로젝트 관리 소프트웨어가 어떤 느낌이어야 하는지에 대한 구체적인 창의적 비전이 있었고, 이를 수년 동안 절제 있게 실행했습니다.

이런 품질은 토큰 처리량에서 나오지 않고, 취향과 덜 만드는 결정에서 나옵니다.

"6년치 백로그를 처리했다"는 주장은 들리는 것만큼 인상적이지 않습니다. CRUD 기능과 내부 도구로 가득한 백로그는 코딩 에이전트가 가속하는 작업에 잘 맞습니다. 동시에 그런 작업은 제품의 최전선을 미는 작업이 아닙니다.

0에서 Camry까지, 하지만 Ferrari는?

Claude Code는 누구나 Camry 경쟁 제품을 만들도록 도울 수 있지만, Ferrari 장인들이 더 빠른 Ferrari를 만들도록 돕지는 못합니다.

0에서 Camry 수준으로: 매우 유용합니다.

최고 수준 제품의 최전선: 코딩 에이전트가 아니라 취향을 가진 사람들이 병목입니다.

Linear의 Nan Yu, Skunk Works의 Kelly Johnson이 예로 제시됩니다. Kelly Johnson의 선별된 팀이 만든 SR-71 Blackbird는 60년 뒤에도 가장 빠른 공기흡입 유인 항공기로 언급됩니다.

Blackbird가 빨랐던 이유는 청사진을 더 많이 생산했기 때문이 아니라, 무엇을 남기지 않을지에 대한 Johnson의 이론이 있었기 때문입니다.

삭제하고, 압축하고, 거절하는 취향은 어떤 프런티어 모델 로드맵에도 없으며, 바닥 수준이 올라갈수록 오히려 더 가치 있어집니다.

Anthropic의 2026년 4월 장애와 남은 과제

2026년 4월 23일, Anthropic은 Claude Code의 성능 저하 문제에 대한 공식 포스트모텀을 공개했습니다. 사용자들의 불만은 실제로 접수되었고, 동사는 의도적으로 모델 성능을 저하시키지 않았다고 명시적으로 발표했습니다.

동시에 신규 Claude Code 접근성을 제한하는 방안도 테스트 중인 것으로 보입니다. 이는 제품 품질 관리와 사용자 기대치 사이의 균형을 맞추려는 시도로 해석됩니다.

결론: AI 코딩 에이전트의 진짜 위치

코딩 에이전트는연건개발의 특정 영역에서 진짜 속도 향상을 제공합니다. 초기 단계 작업, 프로토타입, 내부 도구에서 그 효과는 실제로 존재합니다.

하지만 그 효과에는 비용이 따릅니다:

• 코드베이스가 품질보다 더 빨리 커집니다.

• 기술 부채가 복리로 쌓입니다.

지금 얻는 속도는 나중에 갚아야 할 비용으로 구매하는 것입니다.

제품이 이미 최전선에 있다면, 토큰 지출로 R&D 비용을 두 배로 늘리는 것이 진짜 경제적 가치를 만드는지는 불명확합니다.

AI 코딩 에이전트는 모두에게 Camry 수준의 경쟁 제품을 만들 수 있게 도왔지만, 누구에게도 Ferrari는 제공하지 못합니다.


핵심 정리:

1. 코딩 에이전트의 생산성 향상은 K자형으로 분포 — 시니어만 혜택

2. 진짜 엔지니어링 병목은 코드 생산이 아니라 취향과 판단

3. 코드 줄 수는 자산이 아니라 비용 — 복잡성은 복리로 증가

4. Claude Code는 0→1 단계에서 유용하지만, 최전선 제품 개발의 병목은 별 곳에 있음

5. 삭제하고, 압축하고, 거절하는 능력이야말로 진짜 차별화 요소


📚 출처

Claude Code는 당신의 제품을 더 좋게 만들지 않는다 (ethanding.substack.com)

GeekNews 원본

Anthropic, Claude Code 성능 저하 공식 설명 (Fortune, 2026.04.24)

Why Developers Are Suddenly Turning Against Claude Code? (UC Strategies)