
Cursor Composer 2.5, Cursor 내 가장 많이 선택받는 모델로 등극 — 10x 사용량 보너스
Cursor CEO Michael Truell가 X에 "Composer 2.5가 Cursor에서 가장 많이 선택되는 모델이 됐다. 하루 동안 모든 사용자에게 10배 사용량을 제공한다"고 발표했습니다. 출시 직후 채택률이 빠르게 올라간 이 신호는 Anthropic이나 OpenAI 모델을 두고 Cursor 자체 모델이 디폴트로 선택받는 흐름을 보여줍니다.
Composer 2.5 핵심 요약
5월 18일 공식 출시된 Cursor의 3세대 자체 agentic coding 모델입니다. Composer 2와 동일한 Moonshot AI의 오픈소스 Kimi K2.5를 베이스로 사용하며, 이번에는 발표 첫 문단에서 명시적으로 밝힌 점이 눈에 띕니다. 3월에 Kimi 베이스를 명확히 공개하지 않아 비판받았던 점을 의식한 조치로 보입니다.
전체 컴퓨트의 85%가 Cursor 자체 강화학습 파이프라인과 post-training에 투입됩니다. Composer 2 대비 25배 많은 synthetic coding tasks를 사용하며, long-horizon 작업에서 신뢰성을 높이기 위해 "텍스트 피드백 기반 targeted RL"을 도입했습니다. 긴 rollout 끝에 단일 reward만 주는 대신, 잘못된 tool call이 발생한 구체 지점에 직접 힌트를 주입해 credit assignment를 정밀화한 것이 핵심입니다.
벤치마크 성적 — 프론티어 모델을 넘었다
Composer 2.5의 성능을 다른 모델들과 비교하면 다음과 같습니다.
| 벤치마크 | Composer 2.5 | Opus 4.7 | GPT-5.5 | Composer 2 |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% | 61.7% |
| SWE-Bench Multilingual | 79.8% | 80.5% | 77.8% | 73.7% |
| CursorBench v3.1 (default) | 63.2% | 61.6% | 59.2% | - |
Terminal-Bench 2.0에서 Opus 4.7과 사실상 동률을 기록했습니다. GPT-5.5에는 약 13점 차로 뒤처지지만, SWE-Bench Multilingual에서는 Opus 4.7에 0.7점 차로 거의 동급입니다. 무엇보다 중요한 것은 CursorBench v3.1의 기본 설정입니다. 실제 개발자가 쓰는 디폴트 설정에서는 Composer 2.5가 프론티어 모델 둘 다를 넘어섭니다.
가격 — 가장 강력한 무기
가격 구조는 다음과 같습니다.
• Standard 티어: 입력 0.50달러/M, 출력 2.50달러/M
• Fast 티어 (인터랙티브 디폴트): 입력 3달러/M, 출력 15달러/M
SWE-Bench Multilingual에서 Opus 4.7과 동급 성능을 내면서도 Anthropic 가격의 약 1/10에 불과합니다. CursorBench 기준 63% 정확도를 달성하면서 평균 task 비용이 1달러 미만입니다. 동급 성능의 Opus나 GPT는 task당 몇 달러 더 비쌉니다.
함께 공개된 큰 그림
Cursor는 Composer 2.5와 별개로 xAI 인프라(SpaceXAI)와 함께 Colossus 2의 약 100만 H100급 GPU를 활용해 10배 더 큰 모델을 처음부터 학습 중이라고 발표했습니다. 출시일은미정입니다.
CEO Michael Truell에 따르면, 현재 Cursor 내부에서 머지되는 PR의 35%가 autonomous agent로 생성된다고 합니다. Claude Code가 ARR 25억 달러, 비즈니스 고객 30만 곳을 돌파하며 Cursor를 압박해 온 상황에서 자체 모델로 반격하는 모양새입니다.
활용 제약과 코멘트
Composer 2.5는 Cursor IDE, Cursor CLI, Cursor 웹에서만 사용 가능합니다. 외부 API나 HuggingFace 미러, 서드파티 게이트웨이는 없습니다. Kimi K2.5 기반이라는 점은 규제 산업이나 federal 관련 업무에서는 여전히 고려 요소입니다.
"IDE wrapper"로 시작한 Cursor가 본격적인 model lab으로 전환 중임을 보여주는 릴리스입니다. 같은 베이스에서 post-training만으로 6pt 이상 끌어올린 사례로, "vertical RL이 raw scale을 어디까지 이길 수 있는가"의 좋은 데이터포인트입니다.
정리
Composer 2.5는 세 대째 자사 모델을 내며 IDE시를 빠르게 확대하고 있습니다. 벤치마크에서 프론티어 모델을 넘었고, 가격에서는 확실한 우위를 점했습니다. 특히 실제 개발 환경의 기본 설정에서 높은 성능을 보이는 점이 눈에 띕니다. 10배 사용량 보너스와 결합해 Cursor 생태계의 성장세가 가속화될 것으로 보입니다.
📚 출처
'AI 뉴스' 카테고리의 다른 글
| 4개 AI에게 라디오 방송국을 반년간 운영시킨 결과, 놀라운 성격 차이가 나타났다 (0) | 2026.05.21 |
|---|---|
| Andrej Karpathy, Anthropic 합류 — Claude Pre-training 팀으로 (0) | 2026.05.21 |
| Mirage - AI 에이전트를 위한 통합 가상 파일시스템 완벽 가이드 (0) | 2026.05.21 |
| What's new in Chrome from Google I/O 2026 — 개발자가 알아야 할 핵심 정리 (0) | 2026.05.21 |
| Google, 검색창을 변경하다 — 25년 만에 찾아온 검색의 패러다임 전환 (1) | 2026.05.20 |