'메모리 압축' 터보퀀트, AI 판 흔드나

개발 참여 한인수 교수 기자간담회
"기존 AI 모델에 바로 적용 가능"

투데이e코노믹 = 우혜정 기자 | 구글이 공개한 인공지능(AI) 최적화 기술 ‘터보퀀트(TurboQuant)’가 상용화 기대를 키우며 AI 업계와 반도체 시장에 동시에 파장을 일으키고 있다. 기존 AI 모델에 즉시 적용 가능하다는 점이 강조되면서, 메모리 반도체 수요 변화 가능성까지 거론되는 상황이다.

터보퀀트 개발에 참여한 한인수 한국과학기술원 전기및전자공학부 교수는 30일 온라인 기자간담회에서 “별도의 추가 학습이나 미세조정 없이, 이미 학습된 AI 모델에 바로 적용할 수 있다”며 “빠른 시일 내 다양한 AI에 확산될 것”이라고 밝혔다.

터보퀀트는 AI 추론 과정에서 사용하는 ‘키값(KV) 캐시’를 효율적으로 압축해 메모리 사용량을 최대 6분의 1 수준으로 줄이는 알고리즘이다. AI 모델이 긴 대화 맥락을 유지하기 위해 데이터를 계속 저장해야 하는 과정에서 발생하는 ‘메모리 병목’을 해소하는 기술로 평가된다.

한 교수는 “복잡한 소수점 데이터를 정수 형태로 단순화해 핵심 정보는 유지하면서 저장 용량과 연산 부담을 줄이는 방식”이라며 “압축과 복원을 통해 효율성을 높인다”고 설명했다.

하드웨어에서 소프트웨어 중심으로

AI 인프라 경쟁구도 바뀔 수도

또한 해당 기술은 별도의 파인튜닝 없이 다양한 모델에 적용 가능한 ‘범용성’을 갖춘 것이 특징이다. 검색, 추천, 검색증강생성(RAG) 등 다양한 AI 서비스에 활용될 수 있다는 점에서 산업 전반에 빠르게 확산될 가능성이 제기된다.

터보퀀트는 단순한 저장 효율 개선을 넘어 연산 성능 향상 효과도 기대된다. 실제 구현 방식에 따라 AI 모델의 처리 속도까지 개선될 수 있는 것으로 알려졌다.

이에 따라 업계에서는 AI 인프라 경쟁의 중심이 단순한 하드웨어 성능에서 소프트웨어 기반 효율화 경쟁으로 이동할 가능성에 주목하고 있다.

기술 공개 직후 글로벌 반도체 시장은 즉각 반응했다. 메모리 사용량 감소가 현실화될 경우 고대역폭메모리(HBM) 등 핵심 제품 수요가 줄어들 수 있다는 전망이 확산되면서, 삼성전자, SK하이닉스, 마이크론 등 주요 기업 주가가 일제히 하락했다.

시장에서는 향후 메모리 산업이 ‘고용량 중심’에서 ‘고효율 중심’으로 재편될 가능성도 거론된다.

BIZ

AI platform