'NPU' 태그의 글 목록

Google LiteRT-LM — 스마트폰에서 LLM을 구동하는 엣지 AI 추론 프레임워크

스마트폰, 웨어러블, 심지어 라즈베리 파이 같은 소형 기기에서도 대규모 언어 모델(LLM)을 직접 구동할 수 있는 시대가 왔다. Google이 오픈소스로 공개한 LiteRT-LM은 엣지 디바이스에서 LLM을 고성능으로 실행하기 위한 프로덕션 레디 추론 프레임워크다. TensorFlow Lite의 정통을 이어받아 완전히 새로운 아키텍처로 진화한 이 프레임워크는 이미 Chrome, Pixel Watch 등 Google 제품에 실제 탑재되어 검증된 기술이다. 엣지 디바이스에서 직접 구동되는 온디바이스 AILiteRT-LM이란 무엇인가?LiteRT-LM은 Google AI Edge 팀이 개발한 오픈소스 LLM 추론 프레임워크로, 엣지 디바이스에서 생성형 AI를 실행하기 위해 특화된 오케스트레이션 계층이다...

AI 뉴스 2026.04.23

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

ICBM의 Dev 블로그

NPU 1

티스토리툴바