AI 뉴스

dirac-run/dirac — 토큰 효율성으로 코딩 에이전트 판을 바꾸는 오픈소스

노동1호 2026. 4. 29. 02:03

dirac-run/dirac — 토큰 효율성으로 코딩 에이전트 판을 바꾸는 오픈소스

AI 코딩 에이전트가 화제다. Claude Code, Codex, Gemini CLI 등이 개발 현장에 도입되면서 "AI가 코드를 짜준다"는 시대가 빠르게 현실이 되고 있다. 그런데 여전히 많은 개발자들이 AI 에이전트의 비용效率和精度에 불만을 표현한다. 긴 컨텍스트에서 추론 능력이 저하되고, 파일 하나 수정하는데도 많은 토큰을 소모하며, 결과물의 정확도도 기대에 미치지 못하는 경우가 적지 않다.

dirac-run/dirac는 바로 이 문제에 초점을 맞춘 오픈소스 코딩 에이전트다. 단순히 "코딩을 도와주는 도구"를 넘어, 긴 컨텍스트에서 추론 성능이 흔들리는 근본적 문제를 컨텍스트 큐레이션으로 해결한다는 점에서 기존 에이전트와 명확히 차별화된다.

Terminal-Bench 2.0 리더보드 1위, 65.2% 달성

Dirac은 가장 검증된 코딩 에이전트 벤치마크 중 하나인 Terminal-Bench-2에서 65.2% 정확도를 기록하며 1위에 올랐다. Google's 공식 베이스라인(47.6%)은 물론, Google's의关闭窗口 소스 에이전트 Junie CLI(64.3%)까지 뛰어넘었다.

이 성과는 Cline, Kilo, Ohmypi, Opencode, Pimono, Roo 등 주요 오픈소스 에이전트와 정면 비교를 통해 달성했다. 모든 태스크에 동일한 모델(gemini-3-flash-preview, thinking=high)을 사용했고, 베이스라인 정보나 AGENTS.md 파일을 별도로 삽입하지 않은 상태에서 나온 결과다.

무엇보다 주목할 점은 비용이다. Dirac의 태스크당 평균 비용은 $0.18으로, 다른 에이전트의 평균($0.53) 대비 64.8% 저렴하다. 2.8배 낮은 비용으로 더 높은 정확도를 달성했다는 것은 코딩 에이전트의 효율성 면에서 꽤 의미 있는突破다.

Hash-Anchored Edit: "미스 투 렌더링" 문제를 근본부터 해결

전통적인 AI 코드 편집은 줄 번호 기반(diff 기반) 접근을 사용한다. 특정 줄을 수정하려는데, 다른 에이전트가 먼저 같은 파일을 건드리면 줄 번호가 밀려서 편집이 잘못된 위치에 적용되는 일이 자주 발생한다. 이른바 "lost in translation" 문제다.

Dirac은 Hash-Anchored Edits라는 혁신적 접근을 도입했다. 각 줄의 내용을 해시로 고정시켜, 파일이 어떻게 변경되든 관계없이 정확한 편집 위치를 보장한다. 예를 들어, 다음과 같이 라인 번호 대신 해시 앵커를 사용한다:


Apple§ def process_data(items):
- Brave§     total = 0
- Cider§     for item in items:
+ Bison§     return sum(item.price for item in items if item.price > 0)
Fox§     return total

이 방식은 단순해 보이지만, 여러 에이전트가 동시에 작업하거나 대규모 리팩토링에서 결정적인 정확도 차이를 만들어낸다.

AST-네이티브 정밀도: 함수 추출, 클래스 리팩토링 100% 정확

Hash-Anchored Edits가 텍스트 수준의 정밀함을 제공한다면, AST(Astract Syntax Tree)-Native Precision은 구조적 수준에서의 완전한 정확성을 확보한다.

Dirac은 TypeScript, Python, C++ 등 주요 언어의 구문 구조를 내장 이해하고 있다. 이를 통해 함수 추출이나 클래스 리팩토링 같은 복잡한 구조 변경을 수행할 때 단순한 텍스트 치환이 아닌, AST 레벨에서 올바른 구조를 보장한다. 결과적으로 구문 오류나 런타임 에러를 유발하는 잘못된 변환이 발생할 가능성이 극히 낮다.

멀티파일 배칭: 하나의 LLM 호출로 여러 파일 편집

기존 코딩 에이전트의 또 다른 병목은 단일 파일 단위 작업이다. 10개 파일을 수정해야 한다면 10번의 LLM 호출이 필요하고, 그마다 컨텍스트를 재전송해야 하므로 비용과 지연이 누적된다.

Dirac의 Multi-File Batching은 이 문제를 근본적으로 해결한다. 여러 파일을 하나의 LLM 라운트립에서 처리하고 편집할 수 있어, latency와 API 비용을 동시에 크게 줄인다. 벤치마크 결과를 보면, 25개 파일을 수정해야 하는 Task 6(transformers)에서 Dirac은 $0.34의 비용으로 성공했지만, 비교 대상 에이전트들은 $0.52~$1.44의 비용이 들었다.

High-Bandwidth Context: 필요한 것만, 정확하게

AI 모델의 추론 능력은 컨텍스트 길이가 길어질수록 저하된다는 것은 잘 알려진 문제다. Dirac은 Optimized Context Curation을 통해 이 문제를 완화한다.

  • Smart File Skeleton Extraction: 파일 전체를 읽지 않고 핵심 구조만 추출
  • Recursive Symbol Dependency Tracking: 실제로 참조되는 기호만 추적
  • Token-Efficient Diff Generation: 불필요한 토큰 소모를 최소화

이 최적화를 통해 Dirac은 LLM이 "가장 필요한 정보만" 빠르게 전달받을 수 있게 하며, 이것이 100% 정확도와 64.8% 비용 절감의 기반이 된다.

설치 및 사용법

VS Code 익스텐션 (가장 쉬운 방법)

VS Code 마켓플레이스에서 "Dirac"을 검색해 설치하면 된다. 설치 후 Dirac 사이드바에서 선호하는 AI 프로바이더(Anthropic, OpenAI, OpenRouter 등)를 설정하고 작업을 시작하면 된다.

CLI (터미널 선호자向け)


npm install -g dirac-cli

설치 후 기본 명령어:


# 인증
dirac auth

# 인터랙티브 태스크 실행
dirac "Analyze the architecture of this project"

# 플랜 모드 (실행 전 전략 확인)
dirac -p "Refactor the authentication module"

# Yolo 모드 (모든 액션 자동 승인, 간단한 수정에 적합)
dirac -y "Fix the typo in README.md"

# git diff 결과 리뷰
git diff | dirac "Review these changes"

# 히스토리 확인 및 재개
dirac history

환경 변수 설정 (CI/CD용)


export ANTHROPIC_API_KEY=sk-...
export GEMINI_API_KEY=...
dirac "Run tests"

에이전트 Skills & AGENTS.md 지원

Dirac은 Claude의 .claude, .agents 디렉토리나 AGENTS.md 파일을 자동으로 인식한다. 프로젝트 특화 지시사항을 에이전트에 전달하고 싶은 경우, 별도의 복잡한 설정 없이 기존에 쓰던 AGENTS.md를 그대로 활용할 수 있다.

Native Tool Calling만 지원 (MCP 미지원)

주목할 점은 Dirac이 MCP(Model Context Protocol)를 지원하지 않는다는 것이다. 대신 Native Tool Calling만 사용한다. 이는 의외로 의도적인 설계 결정이다.

MCP는 편리하지만, 구현이 복잡하고 종종 신뢰성 문제가 발생한다. Dirac은 "도구를 단순화하여 최소한의 프롬프팅으로 최대의 효과를 내자"는 목표를 가지고 있어, 복잡한 MCP 계층 대신 네이티브 도구 호출에 집중했다.

베스트 프랙티스: Dirac을 효과적으로 사용하는 방법

  1. 작업 범위를 명확히 정의: Dirac은 긴 컨텍스트에서 오히려 강점을 발휘하므로, "전체 프로젝트 아키텍처 분석"처럼 넓은 범위도 효과적으로 처리한다.
  1. 플랜 모드로 먼저 확인: dirac -p로 실행 전략을 먼저 확인하면 예상 못한 파일 변경을 방지할 수 있다.
  1. AGENTS.md로 프로젝트 맥락 주입: 팀 내 코딩 규칙이나 아키텍처 제약사항을 AGENTS.md에 정리해두면, 매번 설명할 필요 없이 자동으로 적용된다.
  1. 복잡한 리팩토링에 활용: 10개 이상 파일을 동시에 수정해야 하는 대규모 리팩토링에서 비용 효율이 극대화된다.

마무리

Dirac은 "AI 에이전트 = 많이 호출할수록 좋다"는 기존 관념을 깨뜨리는 도구다. Hash-Anchored Edits, AST-네이티브 정밀도, 멀티파일 배칭이라는 세 가지 핵심技术创新이 결합되어, 더 적은 토큰으로 더 정확한 결과를 만들어낸다.

특히 Terminal-Bench-2에서 입증된 64.8% 비용 절감과 100% 정확도는, 코딩 에이전트를 실제로 프로덕션 환경에 도입하려는 개발자들에게 실질적인 매리트가 될 것이다.

오픈소스(Apache 2.0)이므로 자유롭게 사용하고 기여할 수 있다. VS Code 익스텐션 또는 CLI 중 선호하는 방식으로 직접 경험해볼 것을 권한다.

  • Links:*
  • GitHub: https://github.com/dirac-run/dirac
  • 공식 사이트: https://dirac.run/
  • CLI 설치: npm install -g dirac-cli

tags: AI,coding-agent,open-source,dirac,developer-tools,productivity,refactoring,terminal-bench