'lpu' 태그의 글 목록

Groq LPU 아키텍처 완벽 해부 — 초저지연 AI 추론의 비밀

ChatGPT가 대중화한 이후, LLM(대형 언어 모델)의 가장 큰 병목은 단연 추론 속도였습니다. 수십억 개의 파라미터를 가진 모델이 응답을 생성하려면 수 초에서 수십 초가 걸렸죠. 하지만 Groq이라는 스타트업이 이 문제를 근본적으로 해결했습니다. Google의 TPU 설계자였던 Jonathan Ross가 설립한 Groq은 LPU(Language Processing Unit)라는 전혀 새로운 칩 아키텍처를 통해 토큰 생성 속도를 기존 GPU 대비 수십 배 이상 끌어올렸습니다.LPU란 무엇인가?LPU(Language Processing Unit)은 오직 순차적 언어 모델 추론(sequential language model inference)에만 특화된 반도체입니다. NVIDIA GPU가 다목적 연산(그..

AI 뉴스 2026.04.14

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ICBM의 Dev 블로그

lpu 1

티스토리툴바