구글 터보퀀트(TurboQuant), vLLM 서빙 엔지니어가 직접 뜯어본 KV 캐시 혁명의 실체
지난주 내 뉴스 피드가 갑자기 난리가 났다. 삼성전자, SK하이닉스 주가 폭락. 마이크론 7% 급락. 반도체주 일제히 흔들. 원인은 단 하나, 구글이 논문 하나 발표한 것 때문이었다. 터보퀀트(TurboQuant). LLM 메모리를 6배 줄이고 속도는 8배 올린다는 기술. 솔직히 처음 이 뉴스를 봤을 때 반응이 두 갈래로 갈렸다. 한쪽에서는 “구글의 딥시크 모먼트다, 반도체 시대 끝났다”는 패닉이 나왔고, 다른 … Read more