AI 뉴스

Claude 4월 대업데이트 총정리 — Opus 4.7, Mythos, Claude Design까지

노동1호 2026. 4. 20. 00:02

2026년 4월, Anthropic은 Claude 생태계에 가장 큰 변화를 몰고 왔다. Claude Opus 4.7 정식 출시, Claude Mythos라는 새로운 프론티어 모델 티어 발표, Claude Design이라는 시각적 작업 도구 런칭, 그리고 Windows에서의 컴퓨터 사용(Computer Use) 기능 확장까지. 단 한 달 안에 AI 업계의 지형을 바꾸는 연속 발표가 이어졌다.

이 글에서는 4월 Claude 업데이트의 핵심 내용을 정리하고, 각 변경 사항이 개발자와 일반 사용자에게 어떤 의미를 갖는지 분석한다.

Claude Opus 4.7 — 코딩 성능의 새로운 기준

4월 16일에 정식 출시된 Claude Opus 4.7은 Anthropic의 최강 공개 모델이다. 모델 ID는 claude-opus-4-7이며, 전작 Opus 4.6(2월 5일 출시)의 직계 후속 모델이다. 100만 토큰 컨텍스트 윈도우와 최대 128k 토큰 출력, 그리고 작업 복잡도에 따라 추론 깊이를 자동 조절하는 적응형 사고(Adaptive Thinking)를 지원한다.

벤치마크 성능 비교

Opus 4.7의 가장 인상적인 성능 지표는 SWE-bench Pro다. 이 벤치마크는 실제 GitHub 이슈 해결 능력을 측정하는데, Opus 4.6의 53.4%에서 64.3%로 단일 버전에서 10.9%p나 상승했다. 경쟁사를 압도하는 수치다 — GPT-5.4는 57.7%, Gemini 3.1 Pro는 54.2%에 그쳤다.

SWE-bench Verified(500개의 사람 검증 GitHub 이슈)에서도 80.8%에서 87.6%로 크게 향상되었다. Cursor IDE에서의 코딩 성능을 측정하는 CursorBench에서는 58%에서 70%로 12%p 상승했다. 지식 작업 벤치마크인 GDPVal-AA에서는 1,753점으로 GPT-5.4(1,674점)와 Gemini 3.1 Pro(1,314점)를 큰 폭으로 앞섰다.

새로운 기능들

xhigh 노력 수준(Effort Level): 기존 high와 max 사이에 새로운 xhigh가 추가되어, 까다로운 문제에 대한 추론 깊이-지연 시간 트레이드오프를 더 세밀하게 제어할 수 있다. Claude Code는 모든 구독 플랜에서 xhigh를 기본값으로 사용한다.

태스크 버짓(Task Budgets, Beta): 에이전트 루프에 하드 토큰 한도를 설정할 수 있다. 모델이 남은 예산을 실시간으로 인식하고 작업 우선순위를 조정하므로, 과도한 비용 청구를 방지할 수 있다. API 호출 시 output_config.task_budget를 추가하고 task-budgets-2026-03-13 베타 헤더를 활성화하면 된다. 장시간 자율 코딩 에이전트를 운영하는 팀에게 실용적인 비용 통제 기능이다.

가격은 전작과 동일한 $5/$25(토큰 100만개당)로 유지되어, 성능 대비 가성비가 크게 개선되었다.

주의할 점: BrowseComp 성능 저하

유일하게 성능이 하락한 영역이 있다. 웹 검색 및 다중 페이지 종합 능력을 측정하는 BrowseComp에서 Opus 4.6의 83.7%에서 79.3%로 떨어졌다. GPT-5.4 Pro(89.3%)와 Gemini 3.1 Pro(85.9%)와 비교하면 10%p 이상의 격차가 있다. 웹 검색 의존도가 높은 에이전트 워크로드는 다른 모델로 라우팅하는 것이 좋다.

Claude Mythos — 공개하지 않은 초지능 모델

Opus 4.7보다 더 충격적인 발표가 있었다. 4월 초, Anthropic은 Claude Mythos라는 완전히 새로운 모델 티어를 발표했다. Mythos는 Opus 모델보다 "더 크고 더 지능적"한 모델로, Anthropic이 지금까지 만든 가장 강력한 AI 모델이다.

경이로운 벤치마크 점프

Mythos의 벤치마크 성능은 Opus 4.6 대비 다음과 같은 압도적 상승을 기록했다:

  • SWE-bench Verified: 80.8% → 93.9% (+13p)
  • SWE-bench Pro: 53.4% → 77.8% (+24p)
  • USAMO(미국 수학 올림피아드): 42.3% → 97.6% (+55p)
  • Humanity's Last Exam: +17p (도구 없이)

특히 USAMO에서 97.6%라는 점수는 거의 인간 최고 수준에 도달했음을 보여준다.

공개하지 않은 이유: 사이버보안의 문제

Anthropic은 Mythos를 일반에 공개하지 않기로 결정했다. 이유는 명확하다 — Mythos는 Linux, Windows, FreeBSD, OpenBSD 등 모든 주요 운영체제와 웹 브라우저에서 제로데이 취약점을 자율적으로 발견하고 악용할 수 있는 능력을 갖췄다. Anthropic은 이를 "사이버보안에 대한 소환(cybersecurity reckoning)"이라고 표현했다.

대신, Anthropic은 Project Glasswing이라는 폐쇄형 컨소시엄을 출범했다. Amazon, Apple, Microsoft, Google, Nvidia, CrowdStrike, JPMorgan, Cisco, Linux Foundation 등 약 40개 이상의 조직이 참여하며, Mythos를 방어적 목적으로만 사용하여 중요 인프라의 취약점을 스캔하고 패치할 수 있다. Anthropic은 1억 달러의 사용 크레딧과 400만 달러의 오픈소스 보안 프로젝트 기부를 약속했다.

Mythos Preview로 이미 수천 개의 제로데이 취약점이 식별되었으며, 그중 상당수가 치명적인 수준이다. 이 발표는 AI 안전 논의에 새로운 국면을 열었다 — 가장 강력한 모델을 공개하는 것이 반드시 최선은 아닐 수 있다는 현실을 보여준다.

Claude Design — 자연어로 시각적 작업을

Anthropic Labs에서 Claude Design을 출시했다. 이 도구를 사용하면 Claude와 협업하여 디자인, 프로토타입, 슬라이드, 원페이지 등 세련된 시각적 작업물을 자연어로 만들 수 있다. 코드를 몰라도 랜딩 페이지나 프레젠테이션을 생성할 수 있어, 디자이너뿐 아니라 마케터와 기획자에게도 유용하다.

Computer Use 확장 — Windows 지원

3월 23일 macOS에서 처음 출시된 Computer Use 기능이 4월에 Windows로 확장되었다. Claude Cowork와 Claude Code Desktop에서 Pro 및 Max 구독자가 Claude에게 앱 열기, Chrome 탐색, 스프레드시트 작성, 개발 도구 실행 등 다단계 데스크톱 작업을 자율적으로 수행하도록 지시할 수 있다. 설정 → 일반 → 데스크톱 앱 → 브라우저 사용 → 컴퓨터 사용 순서로 활성화하면 된다.

정책 변화: 서드파티 구독 종료

4월 4일부터 Claude Pro 및 Max 구독이 서드파티 도구(OpenClaw, OpenCode 등)에서 더 이상 사용할 수 없게 되었다. Claude Code 총괄 Boris Cherny가 발표한 이 변경은 구독 OAuth 토큰을 외부 도구에 라우팅하는 관행을 공식적으로 종료한다. 사용자는 페이어즈유고(Pay-as-you-go) 사용 번들 또는 표준 API 키로 전환해야 한다.

개발자를 위한 실전 팁

  • Opus 4.7으로 업그레이드: 동일 가격에 코딩 성능이 10%p 이상 향상되었다. 즉시 전환을 추천한다.
  • xhigh 노력 수준 활용: Claude Code에서 기본 적용되므로 별도 설정이 필요 없다. 복잡한 작업에서 max보다 토큰 효율이 좋다.
  • Task Budgets 설정: 자율 에이전트를 운영 중이라면 output_config.task_budget으로 비용을 통제하라. 예산이 부족하면 모델이 작업을 덜 완전하게 수행하거나 거부할 수 있으니 충분한 여유를 두라.
  • BrowseComp 의존도가 높다면 라우팅 고려: 웹 검색 중심 워크로드는 GPT-5.4 Pro나 Gemini 3.1 Pro를 함께 사용하는 하이브리드 접근이 유리하다.
  • Mythos 접근: Glasswing 컨소시엄 참여 조직이라면 Mythos를 방어적 보안 스캐닝에 활용하라. 일반 개발자에게는 현재 접근 권한이 없다.

전망

Anthropic의 4월은 역사적인 한 달이었다. Opus 4.7은 실용적 코딩 성능에서 경쟁사를 앞서고, Mythos는 AI 능력의 새로운 지평을 열었으며 동시에 공개의 한계를 보여주었다. Claude Design과 Computer Use 확장은 Claude를 단순한 챗봇에서 포괄적 작업 파트너로 진화시키고 있다.

앞으로 주목할 점은 세 가지다. 첫째, Mythos 수준의 모델을 어떻게 안전하게 공개할 것인가. 둘째, Claude Design이 시각적 작업 시장에서 어디까지 확장될 것인가. 셋째, 경쟁사들이 Anthropic의 빠른 릴리즈 캐덴스에 어떻게 대응할 것인가. 한 가지 확실한 것은, AI 모델 경쟁이 더욱 치열해지고 있으며, 사용자에게는 더 나은 도구가 더 빠르게 제공되고 있다는 점이다.

요약

  • Claude Opus 4.7: SWE-bench Pro 64.3%로 코딩 벤치마크 1위, 동일 가격, xhigh 노력 수준과 Task Budgets 신규 기능
  • Claude Mythos: 공개 불가 수준의 초지능 모델, Project Glasswing을 통한 제한적 방어적 사용만 허용
  • Claude Design: 자연어로 디자인, 프로토타입, 슬라이드 생성 가능
  • Computer Use: macOS에 이어 Windows 지원 확장
  • 서드파티 구독 종료: 4월 4일부터 OpenClaw, OpenCode 등에서 Claude 구독 사용 불가