AI 뉴스

Context Mode - AI 코딩 에이전트의 컨텍스트 윈도우를 98% 절약하는 MCP 서버 완벽 가이드

노동1호 2026. 5. 3. 23:04

Context Mode - AI 코딩 에이전트의 컨텍스트 윈도우를 98% 절약하는 MCP 서버 완벽 가이드

Context Mode - AI 코딩 에이전트의 컨텍스트 윈도우를 98% 절약하는 MCP 서버 완벽 가이드

AI 코딩 에이전트가 30분만 작업해도 컨텍스트의 40%가 사라진다. Playwright 스냅샷 하나에 56KB, GitHub 이슈 20개에 59KB, 접근 로그 하나에 45KB가 쏠린다. 이 문제를근부에서 해결하는 MCP 서버가 있다. Context Mode다.

문제: 왜 AI 코딩 에이전트의 컨텍스트는 금방 차는가

Claude Code, Codex CLI, Gemini CLI 같은 AI 코딩 에이전트는 MCP(Model Context Protocol) 도구를 호출할 때마다 원시 데이터를 그대로 컨텍스트 윈도우에 쏟아붓는다. 문제는 단순하다.

작업데이터 크기30분 후 누적
Playwright 스냅샷 1회56 KB224 KB
GitHub 이슈 20개 읽기59 KB236 KB
접근 로그 분석45 KB180 KB
총합640 KB+

더 큰 문제는 에이전트가 컨텍스트를 압축(compaction)할 때다. 이전에 편집하던 파일, 진행 중이던 태스크, 마지막으로 요청한 내용이 전부 사라진다. 세션이 깨끗해지는 대신 기억도 함께 사라지는 것이다.

이 문제의 두 번째 면은 출력 토큰 낭비다. 에이전트는 결과값뿐만 아니라 "자연스러운 설명", "부드러운 말투", "여러 가지 생각"까지 출력한다. 양쪽에서 동시에 컨텍스트를 태우는 구조다.

Context Mode: 네 가지 방식으로 문제를 동시에 해결한다

Context Mode는 단일 MCP 서버로 네 가지 핵심 기능을 제공한다. 12.2K GitHub 스타를 받은 이 도구는 Microsoft, Google, Meta, Amazon, NVIDIA, Stripe, Datadog 등 주요 기업 팀에서 실제로 사용 중이며, Elastic License 2.0으로 소스 제공한다.

1. 컨텍스트 절약: 315KB → 5.4KB (98% 감소)

MCP 도구 호출의 원시 출력을 샌드박스(isolated subprocess)로 격리한다. stdout으로 반환되는 것은 실행 결과만이다. 실제 데이터는 별도 저장소(샌드박스)에 격리되어 컨텍스트 윈도우를 지나가지 않는다.

// Before: 47 × Read() = 700 KB가 컨텍스트에 추가// After: 1 × ctx_execute() = 3.6 KB만 컨텍스트에 추가ctx_execute("javascript", const files = fs.readdirSync('src').filter(f => f.endsWith('.ts'));files.forEach(f => console.log(f + ': ' + fs.readFileSync('src/'+f,'utf8').split('\\n').length + ' lines')););

기존 47회의 Read() 호출로 700KB가 소비되던 작업이, ctx_execute() 한 번의 호출로 3.6KB만 소비한다. 100배 이상의 차이다.

2. 세션 연속성: SQLite + FTS5 + BM25

파일 편집, git 작업, 태스크, 에러, 사용자 결정 등 모든 이벤트를 SQLite 데이터베이스에 저장하고 FTS5(Full-Text Search 5)로 인덱싱한다. BM25 알고리즘으로 관련 이벤트를 검색하여 컨텍스트 압축 후에도 에이전트가 이전 세션에서 중단한 지점에서 정확히 재개할 수 있다.

--continue 옵션을 사용하지 않으면 이전 세션 데이터는 즉시 삭제된다. 깨끗한 슬레이트로 시작하고 싶을 때 별도 조치가 필요 없다.

3. 코드로 생각하기(Think in Code): 분석은 코드가 한다

50개 파일을 읽어서 함수 개수를 세는 대신, 에이전트가 분석을 수행하는 스크립트를 작성하고 결과값만 받아온다. LLM을 데이터 처리기로 쓰지 않고 코드 생성기로 쓰는 패러다임이다.

// 함수를 세는 대신 — 코드를 실행하고 결과만 받는다ctx_execute("bash", find src -name "*.ts" | xargs grep -c "^function ")

이것은 14개 플랫폼 모두에서 강제 패러다임으로 적용된다.

4. 출력 압축: 65-75% 토큰 감소

에이전트의 출력을 압축한다. 관사, 여족어(just/really/basically), 친절한 말투, hedging 표현을 제거한다. 기술적 정확도는 완전히 유지한다.

압축 전:

> "Now I need to analyze this file carefully to understand what it does. Let me read through the entire contents and count the number of functions. As you can see, there are quite a few different functions defined here. Let me count them systematically..."

압축 후:

> "Analyze file. Count functions. Output count."

보안 경고, 되돌릴 수 없는 작업, 사용자 혼동 가능성이 있는 경우에는 자동으로 확장한다.

11개 MCP 도구 목록

Context Mode는 6개의 샌드박스 도구5개의 메타 도구를 제공한다.

Context Mode - AI 코딩 에이전트의 컨텍스트 윈도우를 98% 절약하는 MCP 서버 완벽 가이드

도구유형설명
ctx_execute샌드박스11개 언어 런타임으로 코드 실행
ctx_batch_execute샌드박스다중 명령 + 검색 일괄 실행
ctx_execute_file샌드박스파일 샌드박스 처리
ctx_index샌드박스FTS5 + BM25 기반 지식 베이스 인덱싱
ctx_search샌드박스BM25 기반 세션 이벤트 검색
ctx_fetch_and_index샌드박스URL 페치, 인덱싱, 24시간 TTL 캐시
ctx_stats메타컨텍스트 절약량 — 도구별·토큰별·절약 비율
ctx_doctor메타런타임, 훅, FTS5, 플러그인 등록, 버전 진단
ctx_upgrade메타최신 버전 풀, 빌드 재생성, 캐시 마이그레이션, 훅 수정
ctx_purge메타지식 베이스에서 모든 인덱스 콘텐츠 영구 삭제
ctx_insight메타개인 분석 대시보드 — 90개 지표, 37개 인사이트 패턴

14개 플랫폼 지원

Claude Code, Gemini CLI, Codex CLI, Cursor, OpenCode, OpenClaw, Antigravity 등 14개 플랫폼을 지원한다. 플랫폼별 훅(PreToolUse, PostToolUse, SessionStart, PreCompact) 수준에 따라 세션 연속성 등급이 차등 적용된다.

Claude Code 설치 (가장 간단)

Claude Code v1.0.33 이상에서 플러그인 마켓플레이스를 통해 완전히 자동으로 설치된다.

/plugin marketplace add mksglu/context-mode/plugin install context-mode@context-mode

설치 후 /context-mode:ctx-doctor로 모든 검사가 통과하는지 확인한다. 도구는 런타임, 훅, FTS5, 플러그인 등록, 버전을 검증한다.

Gemini CLI 설치

npm install -g context-mode

~/.gemini/settings.json에 MCP 서버와 4개 훅을 등록하면 완전 자동 라우팅이 적용된다.

기타 플랫폼

OpenCode, Codex CLI, Cursor 등 기타 플랫폼은 원클릭 설치 스크립트를 제공한다. 자세한 설치 가이드는 GitHub 저장소에서 확인할 수 있다.

보안: 기존 권한 체계를 그대로 적용

Context Mode는 Claude Code의 permissions 설정(deny/allow 패턴)을 MCP 샌드박스에도 동일하게 적용한다. 체이닝된 명령도 개별적으로 분리 검사한다. 샌드박스 외부로 데이터가 유출되지 않도록 설계되어 있다.

완전 로컬 실행: 텔레메트리 없음

Context Mode는 텔레메트리, 클라우드 동기화, 사용량 추적 중어일개도 없다. 모든 데이터는 로컬 SQLite 데이터베이스에 저장되며, 데이터베이스는 홈 디렉토리에 저장된다. 외부 네트워크 통신이 발생하지 않는다.

실제 효과: 세션 시간 ~30분 → ~3시간

컨텍스트 절약과 세션 연속성을 결합하면 AI 코딩 에이전트의 실제 활용 가능한 세션 시간이 약 30분에서 약 3시간으로 늘어난다.동일 세션에서 더 많은 작업을 완료할 수 있고, 컨텍스트 압축 후에도 작업 연속성이 유지된다.

설치 전 체크리스트

확인 항목명령어
Claude Code 버전claude --version (v1.0.33+ 필요)
Node.js (Gemini CLI)node --version (v18+ 필요)
ctx-doctor 통과/context-mode:ctx-doctor
11개 도구 등록/mcp list (플랫폼에 따라 다름)

마무리

AI 코딩 에이전트의 컨텍스트 문제는 단순한 메모리 관리를 넘어, 에이전트의 실질적 활용 가능 시간을 결정한다. Context Mode는 이 문제를 샌드박스 기반 컨텍스트 격리, FTS5/BM25 세션 연속성, 코드 기반 분석, 출력 압축이라는 네 가지 축으로 동시에 해결한다.

특히 "코드로 생각하기" 패러다임은 AI 에이전트를 데이터 처리기에서 코드 생성기로 재정의하는 관점의 변화라는 점에서 의미가 크다. 12.2K GitHub 스타와 Microsoft, Google 등 주요 기업에서의 실제채용이 이 접근법의 실용성을 입증한다.

AI 코딩 에이전트를 매일 사용하는 개발자라면 Context Mode는 반드시 설치해야 할 도구다.


태그: Context Mode, MCP, Claude Code, AI 코딩 에이전트, 컨텍스트 윈도우, 토큰 절약, SQLite FTS5, BM25, Codex CLI, Gemini CLI, Cursor, OpenCode, Anthropic, AI 개발도구

📚 출처

• Context Mode 공식 사이트: https://context-mode.pages.dev/

• GitHub 저장소: https://github.com/mksglu/context-mode

• GeekNews 원문: https://news.hada.io/topic?id=29106