deepseek 5

antirez/ds4 — Metal용 DeepSeek V4 Flash 로컬 추론 엔진 완벽 가이드

DeepSeek V4 Flash를 위한 네이티브 Metal 추론 엔진 — ds4antirez/ds4 — Metal용 DeepSeek V4 Flash 로컬 추론 엔진 완벽 가이드 Salvatore Sanfilippo(antirez) — Redis의 창립자로 잘 알려진 개발자가 2026년 5월 6일, 자신만의 로컬 AI 추론 엔진을공개발표했다. 프로젝트 이름은 ds4(DeepSeek 4 Flash)이며, Apple Silicon을 위한 Metal 기반의 네이티브 추론 엔진이다.공개발표 후 단 이틀 만에 GitHub 스타 577개를 돌파했고, Hacker News 메인 페이지에 올라와 279포인트, 84개의 댓글을 받았다. 로컬 AI 추론 분야에서 llama.cpp와 GGML이 장악하고 있는 지금, 왜 특정 ..

AI 뉴스 2026.05.10

DeepSeek V4 – 프런티어에 거의 근접했고 가격은 훨씬 저렴

DeepSeek V4 — 프런티어에 근접한 성능, 훨씬 저렴한 가격DeepSeek V4 – 프런티어에 거의 근접했고 가격은 훨씬 저렴DeepSeek가 2026년 4월, 기다려온 V4 시리즈의 첫 모델 DeepSeek-V4-Pro와 DeepSeek-V4-Flash 프리뷰 버전을 공개했다. 100만 토큰 컨텍스트를 지원하는 Mixture of Experts( MoE ) 모델이며, MIT 라이선스로 제공된다.DeepSeek V4, 어떤 모델인가DeepSeek-V4-Pro는 총 1.6T 파라미터와 활성 49B 파라미터를 갖춘 모델이다. Hugging Face 기준 크기는 약 865GB에 달한다. 기존 DeepSeek V3.2(685B 파라미터), Kimi K2.6(1.1T), GLM-5.1(754B)보다 크기 ..

AI 뉴스 2026.05.03

DeepSeek-V4 논문 읽기 요약: 100만 토큰 文脈을 열린 가치가 열다

DeepSeek-V4 논문 읽기 요약: 100만 토큰 文脈을 열린 가치가 열다2026년 4월 24일, DeepSeek는 드디어 DeepSeek-V4를 공식 공개했다. 1.6조 파라미터의 MoE 모델이 100만 토큰 컨텍스트를 기존 대비 10% 수준의 KV 캐시로 처리한다는 사실은 AI 업계에 새로운 기준점을 세웠다. 이번 글에서는 DeepSeek-V4 기술 보고서의 핵심을 읽고, 개발자 관점에서 반드시 알아야 할 아키텍처 혁신 4가지를 정리한다.DeepSeek-V4, 왜 지금 중요한가AI 업계는越来越大 파라미터 수와越来越 긴 컨텍스트 윈도우를 동시에 추구해왔다. 그러나 quadratic attention의 계산 비용 때문에, 100만 토큰급 긴 문맥 처리는 사실상 폐쇄형 최첨단 모델만의 영역이었다. De..

AI 뉴스 2026.04.30

DeepSeek-V4 논문 읽기: 백만 토큰 컨텍스트를 저렴하게

DeepSeek-V4 논문 읽기: 백만 토큰 컨텍스트를 저렴하게2026년 4월 23일, DeepSeek은 待了很久의 새 프론티어 모델 DeepSeek-V4를 공개했다. 이번 논문은 단순히 "긴 문맥을 지원한다"는 선언가에 그치지 않는다. 백만 토큰 문맥을 실제 서비스에서 운용 가능한 비용 구조로 구현한 구조적 혁신에 초점을 맞춘다.DeepSeek-V4, 두 가지 버전DeepSeek-V4는 두 가지 구성으로 출시된다.DeepSeek-V4-Pro: 전체 1.6T 파라미터, 토큰당 49B 활성화DeepSeek-V4-Flash: 전체 284B 파라미터, 토큰당 13B 활성화둘 다 1M 토큰 컨텍스트를 지원하지만, 핵심 차이는 비용 효율성이다. 논문이 주장하는 핵심 수치:1M 토큰 환경에서 V4-Pro는 V3.2..

AI 뉴스 2026.04.29

NVIDIA API 키 하나로 134개 AI 모델 무료: Qwen, GLM, DeepSeek, GPT-OSS까지

들어가며앞선 글에서 NVIDIA NIM API가 기한 없이 무료라는 점을 다뤘습니다. 그런데 더 놀라운 사실이 있었습니다. NVIDIA API 키 하나로 Qwen, GLM, DeepSeek, Llama, Mistral 등 총 134개 모델을 전부 무료로 사용할 수 있다는 것입니다.이번 글에서는 NVIDIA API에서 제공하는 전체 모델 목록을 정리하고, 특히 현재 ZAI 프로바이더에서 사용 중인 GLM-5를 NVIDIA 경유로 사용하면 어떤 이점이 있는지, 그리고 Hermes Agent에 어떻게 연동하는지 다룹니다.1. 전체 모델 목록 (134개)NVIDIA API의 /v1/models 엔드포인트를 호출하면 전체 모델 목록을 확인할 수 있습니다. 카테고리별로 정리해보겠습니다.🟢 NVIDIA 자체 모델 ..