[2026 하드웨어 시장 심층 분석] Part 3. 그래픽카드 가격 고공행진: TSMC 이중 병목과 로컬 AI, KV 캐시
1. 웨이퍼도 부족한데 후공정은 더 절망적이다: TSMC의 이중 병목 그래픽카드 가격 상승 원인을 분석할 때 흔히 반도체 칩 생산 캐파는 충분한데 패키징만 문제다라고 오판하는 경우가 많다. 현실은 둘 다 극심한 부족에 시달리고 있으며, 패키징이 더 치명적인 목줄을 쥐고 있을 뿐이다. 현재 TSMC의 선단 공정 웨이퍼 라인은 애플, 퀄컴의 모바일 칩셋과 엔비디아, AMD의 AI 가속기 물량으로 인해 이미 100% 풀가동 상태다. 일반 소비자용 GPU 다이를 찍어낼 물리적인 생산 능력 자체가 절대적으로 부족하다. 더 절망적인 것은 칩을 조립하는 TSMC 후공정인 CoWoS 라인이다. 웨이퍼보다 이 후공정 라인의 병목이 훨씬 더 짜친다. 10월 빅테크 발표 직후 AI 기업들이 CoWoS 예약 풀을 2026년 말까지 모조리 싹쓸이해 버렸다. 기적적으로 소비자용 GPU 다이를 찍어낸다 하더라도, 마지막 포장 단계에서 마진율이 수십 배 높은 AI 칩에 밀려 엄청난 웃돈을 줘야만 공정을 돌릴 수 있는 이중 병목 현상이 발생한 것이다. 2. 로컬 AI 인퍼런스와 KV 캐시가 폭등시킨 GDDR 단가 HBM 그늘에 가려진 진짜 숨은 주범은 GDDR 메모리 수요의 기하급수적 팽창이다. 최근 개인 PC에서 대규모 언어 모델을 직접 구동하는 로컬 AI 수요가 폭발했다. 모델이 원활한 추론을 하기 위해서는 이전 문맥을 기억하는 KV 캐시 공간이 필수적인데 컨텍스트가 길어질수록 16GB, 24GB 이상의 막대한 VRAM이 강제된다. 수요 폭발은 GPU 기판에 탑재되는 일반 GDDR 메모리 도매단가를 급격히 끌어올렸다. VRAM 원가 자체가 폭등하면서 메인스트림 그래픽카드 출고가를 억지로 낮출 유인이 완전히 상실되었다. [알아두면 쓸데있는 IT 용어 사전] KV 캐시(KV Cache)란 무엇인가? - 정의: 대규모 언어 모델(LLM)이 텍스트를 생성할 때, 이전에 처리한 단어(토큰)들의 연산 결괏값인 Key 행렬과 Value 행렬을 그래픽카드 메모리(VRAM)에 임시로 저장해 두는 기술....