RTX 5090과 M4 MacBook Air: 게임이 가능할까?

Apple Silicon Mac에서 고성능 게이밍을 즐기는 것은 오랜 난제였다.macOS는 NVIDIA GPU 드라이버를 지원하지 않고,Thunderbolt 환경에서의 외부 GPU 연결은 기술적 제약이 많았다.하지만 개발자 scottjg가 새로운 실험을 통해 이 문제를 창의적으로 해결했다. M4 MacBook Air에 RTX 5090 eGPU를 연결해 Linux VM 환경에서 게임을 실행하는 데 성공했다.
Thunderbolt eGPU, 왜 어려운가
RTX 5090 같은 데스크톱 GPU를 M4 MacBook Air에 연결하려면Thunderbolt dock을 통해 PCIe를 터널링해야 한다.Thunderbolt 4는 최대 40Gbps의 4개 PCIe 레인을 제공하지만,이 과정에서 성능 손실이 발생한다.
Apple Silicon에서 eGPU가 특히 어려운 이유는 세 가지다.
첫째, macOS가 NVIDIA 드라이버를 제공하지 않는다. Apple은 장기적으로 AMD GPU만 지원해왔고,NVIDIA Tesla/GeForce 드라이버는 존재하지 않는다.이는 곧 macOS 환경에서는 GPU를 직접 활용할 수 없음을 의미한다.
둘째, Linux 커널이 Apple Silicon의 Thunderbolt를 지원하지 않는다. Linux VM을 실행해도 커널이 내부 장치와 USB3만 인식하기 때문에Thunderbolt로 연결된 GPU를 사용할 수 없다.
셋째, DMA와 DART 제약을 우회해야 한다. Apple Silicon에는 IOMMU와 유사한 DART 하드웨어가 있으며, device가 임의의 host memory에 접근하지 못하게 차단한다.약 1.5GB 매핑 제한과 64k 매핑 카운트 제한으로 인해,8~16GB VRAM을 필요로 하는 현대 게임에서는치명적인 제약이었다.
기술적 해결책: apple-dma-pci
개발자는 이 제약을 해결하기 위해 apple-dma-pci라는 가상 PCI 장치를 QEMU에 추가했다.guest 커널 드라이버가 NVIDIA driver의 DMA mapping 호출을 가로채고,요청마다 on-demand 매핑을 생성한다. buffer가 해제되면 매핑도 해제하는 구조로,1.5GB 제한 내에서 live DMA buffer working set만 관리하면 된다.
추가로 세 가지 핵심 패치가 적용됐다.
kprobes 기반 NVIDIA 드라이버 패치 — CUDA 워크로드 실행 중 alignment 오류가 발생했으나,kprobes를 사용해 pageSize를 강제함으로써 문제를 해결했다.
Mapping coalescing — 4kB 버퍼가 많으면 64k 매핑 카운트 제한에 도달했다.256kB 단위로 클러스터 매핑을 적용해 live 매핑수오 4배 감소시켰다.
vCPU 스케줄링 최적화 — QEMU vCPU 스레드에 높은 우선순위를 부여해벤치마크 결과의 무작위적 떨림을 해소했다.
게임 성능: 어디까지 가능할까
테스트 결과는 놀랍다. Cyberpunk 2077을 기준으로 보면 다음과 같다.
| 해상도 | 화질 | 기본 M4 Air | M4 Air + eGPU | 게이밍 PC |
|---|---|---|---|---|
| 720p Low | 61fps | 49fps | - | |
| 1080p RT Ultra | 7fps | 119fps* | - | |
| 4K RT Ultra | - | 27fps | 111fps* | 282fps |
*DLSS 프레임 생성 사용
핵심적으로, 4K 해상도에서 DLSS 프레임 생성 사용 시 111fps를 기록해플레이 가능한 수준에 도달했다. 그러나 게이밍 PC에 직접 연결한 경우보다 2~4배 느리며,FEX 에뮬레이션과 Thunderbolt 오버헤드가 크게 작용한다.

Shadow of the Tomb Raider에서는 1080p와 4K 성능이 거의 동일했다.이는 병목이 GPU가 아니라 FEX 에뮬레이션의 CPU에 있음을 보여준다.
Doom (2016)은 49fps로 항상 30fps 이상을 유지해 플레이 가능했으며,Crysis Remastered는 게이밍 PC보다 4배 느지만소레데모 M4 Air에서 플레이 가능한 프레임레이트를 기록했다.
반면 Horizon Zero Dawn Remastered는 1.5GB DMA 메모리 매핑 요구사항을 충족하지 못해벤치마크 자체를 시작할 수 없었다.
AI 추론에서의 파급력
게임보다 더 인상적인 것은 AI 추론 성능이다. Qwen 3.6 35B MoE 모델을 4비트 양자화로 테스트한 결과:
| 구성 | Prefill 속도 | 생성 속도 |
|---|---|---|
| M4 Air 만 | 17초 | 22 tok/s |
| M4 Air + RTX 5090 eGPU | 150ms | 155 tok/s |
| RTX 5090 네이티브 대비 | - | 6.5배 |
Prefill이 약 120배 빨라졌다. 이는 4K 토큰 프롬프트를 파싱하는 데M4 Air만으로는 17초가 걸리지만, eGPU를 연결하면 150ms 만에 완료됨을 의미한다.
동시 요청 4개로 확장하면 RTX 5090 구성의 총 처리량이 약 3배 증가했으며,Apple Silicon Mac보다 확장성이 높았다.
현재 상태와 향후 전망
현재 이 솔루션은 프로덕션 준비 상태가 아니다. 몇 가지 제약이 있다.
Apple의 특수 entitlement가 필요하며,요청했으나 아직 승인되지 않았다. entitlement가 없는 상태에서는드라이버를 직접 빌드해야 하고, 서명 인증서 계정에 해당 Mac이 등록되어야 한다.
안정성 측면에서도 문제가 있다. FEX에서 Steam이 루프 형태로 자주 크래시하며,특정 게임을 시작하는 데 몇 분이 걸릴 수 있다. DMA 매핑이 시간이 지나며 조각화될 수 있어,이 경우 GPU를 분리 후 재연결해야 한다.
코드는 qemu-vfio-apple 저장소에서 받을 수 있으며,내장된 런처가 apple_dma 드라이버가 설치된 사전 빌드 Ubuntu 이미지를자동으로 다운로드한다.reduced security mode나 SIP 비활성화는 필요하지 않다.
결론: 실험적 성과의 가능성
M4 MacBook Air로 게이밍이 가능하다고 단언하기는 어렵다.4K DLSS 환경에서 111fps라는 숫자가 가능성을 보여주지만,2~4배의 성능 손실과 불안정한 에뮬레이션 환경은 여전히 현실적제약다.
그러나 AI 추론에서의 Prefill 120배 개선은 주목할 만하다.Apple Silicon의 효율적인 NPU 대안으로 eGPU를 활용하는 길이 열렸다는 점에서,향후 entitlement 승인 후 더 안정적인 솔루션이 나온다면 활용도가 높아질 수 있다.
지금은 아쿠마데 실험 단계이지만,Apple Silicon과 NVIDIA GPU의 조합이 보여주는 잠재력은확실히 기대 이상이다.
📚 출처
'AI 뉴스' 카테고리의 다른 글
| DeerFlow 2.0 — ByteDance의 장기 실행 SuperAgent 하네스 완벽 가이드 (0) | 2026.05.16 |
|---|---|
| 소프트웨어의 Emacs화 — AI 에이전트가 만드는 초개인화 소프트웨어 시대 (1) | 2026.05.16 |
| Claude Design 구독 해지 후 프로젝트 접근 권한을 잃은 이야기 — 개발자가 반드시 알아야 할 사실 (0) | 2026.05.15 |
| Bun의 Rust 재작성 PR이 메인에 머지됨 — 100만 줄의 언어 전환 (0) | 2026.05.15 |
| 브라우저는 대형 사이트를 다르게 취급한다 (0) | 2026.05.15 |