
WhisperSubTranslate v2.0 — 오프라인으로 영상 자막을 만들면 얼마나 편할까
외국어 영상을 볼 때 자막이 없으면을 완전히 이해하기 어렵습니다. 유투브 자막이 없는 영상은 물론이고, 강의 영상이나 컨퍼런스 녹화본은 자막 자체가 없는 경우가 대부분이죠.
WhisperSubTranslate v2.0은 영상 파일을 던져넣으면 자막을 추출하고 원하는 언어로 번역까지 도와주는 데스크톱 앱입니다. 최대 100% 로컬에서 동작한다는 점입니다. 클라우드에 영상을 업로드하지도, 계정도 필요 없으며, 사용량 제한도 없습니다.
WhisperSubTranslate란
WhisperSubTranslate는 오픈소스(GPL-3.0)로 공개된 데스크톱 애플리케이션입니다. whisper.cpp로 영상에서 음성을 추출하고, 번역 엔진을 통해 선택한 언어로 SRT 자막 파일을 생성합니다.
v2.0에서 추가된 핵심 기능:
• 로컬 LLM 번역 경로 — HY-MT GGUF 모델을 사용하면 인터넷 연결 없이도 번역 가능
• 컨텍스트 인식 번역 (Context-aware translation)
• 더 안전한 API 키 저장소
설치와 시작
Windows (포터블)
가장 쉬운 방법은 포터블 빌드를 사용하는 것입니다.
1. Releases 페이지에서 최신 파일 다운로드
- WhisperSubTranslate-v2.0.0-win-x64.zip
2. 압축 해제 후 WhisperSubTranslate.exe 실행
3. 완료
별도의 Python이나 환경 설정이 필요 없습니다. 처음으로 실행하면 필요한 whisper.cpp 모델이 자동으로 다운로드됩니다.
Linux / macOS (소스 빌드)
# Ubuntu/Debiansudo apt install cmake build-essential git ffmpeggit clone https://github.com/Blue-B/WhisperSubTranslate.gitcd WhisperSubTranslatenpm installnpm start
번역 엔진 선택 — 무료부터 완전 오프라인까지
WhisperSubTranslate는 다양한 번역 엔진을 지원합니다. 용도에 따라 선택할 수 있습니다.
| 엔진 | 비용 | 특징 |
|---|---|---|
| MyMemory | 무료 | 일 IP당 약 5만 자/일. 설치 직후 즉시 사용 가능 |
| DeepL | 무료 50만 자/월 | 안정적인 결정적 번역. API 키 필요 |
| OpenAI GPT | 유료 | 컨텍스트 인식 고품질 번역. API 키 필요 |
| Gemini | 무료/유료 | 고품질. API 키 필요 |
| 로컬 HY-MT (GGUF) | 무료 | 완전 오프라인. GPU 2GB 이상 또는 RAM 4GB 이상 |
특히 로컬 LLM 번역(HY-MT 1.8B/7B GGUF)은 인터넷 연결이 전혀 없는 환경에서도 번역을 완료할 수 있어, 보안이 엄격한 기업 환경이나 항공기 안에서 작업할 때 유용합니다.
실전 활용 시나리오
1. 기술 컨퍼런스 강의 정리
1시간짜리 영어 기술 컨퍼런스 영상이 있다고 가정해 봅니다. 팟플레이어에서 자막 생성 기능을 사용한 적이 있다면 알겠지만, 외부 서비스에 의존해야 하고 자막을 곧바로 편집하기도 어렵습니다.
WhisperSubTranslate를 사용하면:
1. 영상 파일을 드래그 — 자막 추출 시작
2. 번역 엔진으로 한국어 선택
3. SRT 파일로 내보내기
이후 VLC나 팟플레이어에서 SRT 파일을 불러와 바로 학습에 활용할 수 있습니다.
2. 여러 개 영상 일괄 처리
배치 큐 기능을 사용하면 여러 영상을 순서대로 처리할 수 있습니다. 1~2시간짜리 강의 여러 개를 큐에 넣고 돌아다니면 됩니다.
3. 언어 학습 자료 만들기
자막이 있는 영상의 원본과 번역본을 나란히 비교하며 리스닝 연습을 할 수 있습니다. 14개 타겟 언어를 지원하므로 영어뿐 아니라 프랑스어, 독일어, 일본어 등 다양한 언어 학습에 활용할 수 있습니다.
대안 도구들과 비교
| 도구 | 자막 추출 | 번역 | 설치 필요 | 완전 오프라인 |
|---|---|---|---|---|
| WhisperSubTranslate | ✅ whisper.cpp | ✅ 다중 엔진 | 선택 (포터블) | ✅ |
| yt-whisper | ✅ Whisper | ❌ | 필요 | ❌ |
| Subs AI | ✅ Whisper | ✅ | 필요 | ❌ |
| Gemini SRT Translator | ❌ | ✅ | 필요 | ❌ |
WhisperSubTranslate의 가장 큰 차별점은 자막 추출과 번역이 하나의 앱에서되고, 완전 오프라인으로 동작한다는 점입니다.
기술 스택
WhisperSubTranslate는 Electron + Node.js 기반으로 만들어졌습니다.
• 런타임: Electron, Node.js, JavaScript
• 자막 추출: whisper.cpp (GGML 모델)
• 번역: 로컬 HY-MT, MyMemory, DeepL, OpenAI, Gemini
• 빌드: electron-builder
FFmpeg도 자동으로 포함되므로 별도 설치가 필요 없습니다.
이런 분에게 추천
• 프라이버시가 중요한 분 — 영상이 서버로 업로드되지 않으므로 민감한도 안심하고 처리
• 오프라인 환경에서 작업하는 분 — 로컬 LLM(HY-MT)을 사용하면 네트워크 연결 불필요
• 여러 영상을 동시에 처리해야 하는 분 — 배치 큐 기능으로 효율적으로 작업
• 클라우드 서비스 비용이 부담되는 분 — MyMemory 또는 로컬 LLM로 무료 번역 가능
요약
WhisperSubTranslate v2.0은 영상 자막 추출과 번역을 하나의 앱에서하는 도구입니다. whisper.cpp 기반의 음성 인식으로 정확한 SRT 파일을 생성하고, 다양한 번역 엔진 또는 완전 오프라인 로컬 LLM로 번역할 수 있습니다.
클라우드 업로드 없이 100% 로컬에서 동작하므로 privacy가 보장되고, 배치 처리 기능으로 긴 영상도 효율적으로 처리할 수 있습니다. 외국어 영상으로 학습하거나 업무 자료를 정리해야 하는 분이라면해볼 만한 도구입니다.
GitHub: https://github.com/Blue-B/WhisperSubTranslate
📚 출처
'자동화&툴 리뷰' 카테고리의 다른 글
| 10년 Ubuntu 서버를 FreeBSD로 마이그레이션한 이야기 — 비용 절반, 성능 11배 향상 (0) | 2026.05.25 |
|---|---|
| Show GN: 조금씩 생기는 운영 CS 클로드로 자동화하기 완벽 가이드 (0) | 2026.05.25 |
| LLM이라면, 이것을 읽어 주세요 — Anna's Archive와 웹 표준의 탄생 (0) | 2026.05.24 |
| SSH에서 REST로: Slack EMR 데이터 파이프라인 현대화 완전 가이드 (0) | 2026.05.24 |
| Phosphene - Apple의 비디오 배경화면을 macOS Tahoe에서原生復刻 (0) | 2026.05.24 |