CoWoS와 HBM — HBM4 시대, 왜 같이 다닐 수밖에 없는가

Q: SK하이닉스와 삼성, HBM4에서 누가 유리한가요?

SK하이닉스는 HBM 시장 점유율 50% 이상과 NVIDIA와의 긴밀한 관계가 강점입니다. 삼성은 파운드리+HBM+패키징 수직통합으로 TSMC 의존 없이 원스톱 공급이 가능한 유일한 업체입니다. 현재는 SK하이닉스 우위이나, TSMC 캐파 병목이 심화되면 삼성의 수직통합 전략이 부각될 수 있습니다.

    한 줄 요약: HBM은 물리적으로 CoWoS 없이 작동할 수 없습니다 — I/O 밀도, 배선 거리, 전력 효율 세 가지가 이유입니다. HBM4는 인터포저 설계를 완전히 바꾸며, 현시점에서 AI 가속기급 HBM 통합은 CoWoS가 유일한 검증된 선택지입니다.
  

1. HBM은 왜 CoWoS 위에 올라가야 하는가
2. 이유 1 — 초고밀도 I/O
3. 이유 2 — 짧은 배선 거리
4. 이유 3 — 전력 효율
5. HBM3E → HBM4 — CoWoS가 어떻게 바뀌는가
6. HBM4가 만드는 4가지 변화
7. SK하이닉스 vs 삼성 — HBM4 전략이 갈린다
8. CoWoS 없이 HBM을 쓸 수 있는 대안은?
9. 정리
10. 자주 묻는 질문 (FAQ)
11. 시리즈 안내

1. HBM은 왜 CoWoS 위에 올라가야 하는가

1편에서 CoWoS의 구조와 필요성, 2편에서 3가지 변종(S/R/L)을 정리했습니다.

이번 편은 CoWoS 위에 올라가는 HBM(High Bandwidth Memory) 이야기입니다. HBM은 DRAM을 수직으로 쌓아 대역폭을 극대화한 메모리입니다. 1편에서 잠깐 다뤘지만, 여기서 더 깊이 들어갑니다.

HBM의 성능을 100% 쓰려면 세 가지 물리적 조건이 필요합니다.

2. 이유 1 — 초고밀도 I/O

HBM3E의 인터페이스 폭은 1024-bit입니다. 하나의 HBM 스택에서 프로세서로 동시에 데이터를 보내는 통로가 1024개라는 뜻입니다.

이걸 물리적으로 연결하려면 수천 개의 micro-bump가 필요합니다. 일반 PCB 배선 폭은 수십 μm인데, 이 밀도의 연결은 물리적으로 불가능합니다.

실리콘 인터포저의 배선 폭은 1μm 이하. 같은 면적에 수십 배 더 많은 배선을 넣을 수 있습니다. HBM의 수천 개 I/O를 소화할 수 있는 건 실리콘 인터포저뿐입니다.

연결 방식	배선 폭	HBM3E 1024-bit 연결
일반 PCB	수십 μm	물리적으로 불가능
유기 인터포저 (RDL)	수 μm	제한적 (밀도 부족)
실리콘 인터포저	1μm 이하 (sub-micron)	가능 — 유일한 선택지

3. 이유 2 — 짧은 배선 거리

HBM의 대역폭 이점은 프로세서와의 거리가 짧을 때만 유효합니다.

CoWoS 인터포저 위: Logic die ↔ HBM 간 거리 = 수 mm
일반 패키지: 수 cm → 신호 감쇠 + 전력 손실 + 지연 증가

수 mm와 수 cm의 차이가 별것 아닌 것 같지만, TB/s급 대역폭에서는 결정적입니다. 배선이 길어지면 신호 무결성이 깨지고, 고속 동작 자체가 안 됩니다.

4. 이유 3 — 전력 효율

짧은 배선 = 낮은 구동 전력.

AI 가속기에서 메모리 I/O 전력은 총 소비전력의 30~40%를 차지합니다. NVIDIA B200 한 장의 TDP가 1,000W에 달하는데, 여기서 메모리 I/O 전력을 줄이는 건 시스템 전체 효율에 직결됩니다.

CoWoS는 프로세서와 HBM을 수 mm 이내에 배치해서 I/O 전력을 최소화합니다.

제품	패키징	메모리 대역폭	HBM 구성
NVIDIA H100	CoWoS-S	3.35 TB/s	HBM3 × 6스택
NVIDIA B200	CoWoS-L	8 TB/s	HBM3E × 8스택
일반 DDR5 PC	—	~0.05 TB/s	—

H100에서 B200으로 가면서 대역폭이 2.4배 늘었습니다. 이걸 가능하게 한 건 CoWoS-S에서 CoWoS-L로의 전환과, 수 mm 배선 거리에서 오는 전력 효율입니다. 일반 DDR5 대비로는 160배 차이.

    비유: HBM은 초고속 고속도로 IC이고, CoWoS 인터포저는 그 IC에 접근하는 연결 도로입니다.

    연결 도로 없이는 고속도로가 있어도 쓸 수 없습니다.

5. HBM3E → HBM4 — CoWoS가 어떻게 바뀌는가

HBM4는 2026년 후반 양산 예정입니다. 단순 업그레이드가 아니라, 패키징 설계를 근본적으로 바꿉니다.

항목	HBM3E (현재)	HBM4 (2026 후반~)
인터페이스 폭	1024-bit	2048-bit
대역폭	~1.2 TB/s / 스택	~2+ TB/s / 스택
DRAM 적층	8~12층	12~16층
Base die	패시브 (단순 I/O)	액티브 로직 다이
Base die 공정	단순	TSMC 12nm → 5nm/3nm
동작 전압	1.1V	0.8V

이 표에서 주목할 변화가 네 가지 있습니다.

6. HBM4가 만드는 4가지 변화

① 인터포저 재설계 필수

인터페이스 폭이 1024-bit에서 2048-bit로 두 배가 됩니다. 인터포저 위의 배선 밀도도 두 배가 필요합니다.

이건 기존 인터포저에 선만 더 깔면 되는 게 아닙니다. HBM4는 HBM3E 인터포저와 호환 불가. 인터포저를 처음부터 다시 설계해야 합니다.

② Base die의 파운드리화

이전 HBM의 base die는 단순 I/O 역할만 했습니다. 데이터를 위아래로 전달하는 통로.

HBM4의 base die는 연산이 가능한 로직 다이로 변합니다.

SK하이닉스: TSMC 12nm → 5nm 공정으로 base die 위탁 생산
삼성: 자체 파운드리에서 base die 제조

메모리와 로직의 경계가 흐려집니다. base die 자체가 하나의 프로세서급 칩이 되면, 패키징 복잡도는 한 단계 더 올라갑니다.

    산업 구조 변화: 메모리 회사(SK하이닉스)가 파운드리(TSMC)에 로직 다이를 위탁 생산하는 구조. HBM4부터 메모리와 로직의 경계가 산업 레벨에서 무너지기 시작합니다.
  

③ 열 관리 난이도 상승

base die에 로직이 들어가면 발열이 증가합니다. 거기에 DRAM 적층이 12~16층까지 올라가면 열이 빠져나갈 통로가 더 좁아집니다.

CoWoS 설계에서 열 관리(thermal solution)의 중요도가 급격히 올라갑니다.

④ 더 큰 인터포저 필요

HBM4를 12스택 이상 탑재하려면 인터포저 면적이 커져야 합니다. CoWoS-S의 3.3x reticle로는 부족합니다.

CoWoS-L의 5.5x reticle 이상이 사실상 유일한 선택지. 2편에서 "CoWoS-L이 메인스트림이 된다"고 한 이유가 여기에 있습니다.

그 다음은? TSMC는 원형 웨이퍼 대신 사각 패널(310mm × 310mm)을 쓰는 CoPoS(Chip on Panel on Substrate)를 준비하고 있습니다. 면적 활용률이 57% → 87%로 올라가면서, HBM4 시대의 대면적 인터포저 비용 문제를 근본적으로 해결할 수 있는 방향입니다. 2028~2029년 양산 목표. (2편 CoPoS 섹션 참고)

7. SK하이닉스 vs 삼성 — HBM4 전략이 갈린다

HBM4의 base die가 액티브 로직으로 변하면서, 두 HBM 공급사의 전략이 완전히 갈립니다. 이 차이가 CoWoS 생태계의 미래를 결정합니다.

SK하이닉스 — TSMC와 분업

Base die: TSMC에 위탁 생산 (12nm → 5nm 전환 중)
HBM 스태킹: 청주 P&T7 공장 (₩19조 투자, 세계 최대 HBM 조립 시설)
최종 패키징: TSMC CoWoS-L에 의존
시장 점유율: HBM 시장 50% 이상 (HBM3E 기준), NVIDIA의 1차 공급사

장점은 TSMC의 검증된 CoWoS 수율과 성능을 그대로 활용할 수 있다는 것. 단점은 TSMC 캐파에 종속된다는 것입니다. CoWoS 생산능력이 수요의 60~70% 수준인 현재, 이건 실질적 병목입니다.

삼성전자 — 수직통합 원스톱

Base die: 자체 파운드리에서 제조 (GAA 공정, TSMC 의존 없음)
HBM 스태킹: 자체 시설
패키징: 자체 I-Cube 시리즈 (I-Cube S, I-Cube E, SAINT)
일본 패키징 허브: $1.7억 투자, 공급망 다변화

삼성은 파운드리 + HBM + 패키징을 원스톱으로 제공할 수 있는 유일한 업체입니다. TSMC CoWoS 캐파가 부족할 때, 고객이 삼성으로 넘어갈 수 있는 구조적 이유입니다.

하지만 현실은 — I-Cube의 양산 규모와 수율이 TSMC CoWoS에 비해 열세. NVIDIA·AMD·Google 모두 아직 TSMC를 쓰고 있습니다.

비교표

항목	SK하이닉스	삼성전자
Base die 제조	TSMC 위탁 (5nm)	자체 파운드리 (GAA)
패키징	TSMC CoWoS-L 의존	자체 I-Cube
공급 체인	분업 (SK + TSMC)	수직통합 (원스톱)
TSMC 의존도	높음	없음
HBM 시장 점유율	50%+ (1위)	~40% (2위)
장점	검증된 성능, NVIDIA 관계	공급 독립, 가격 경쟁력
리스크	TSMC 캐파 병목	수율·규모 격차

이것이 CoWoS 생태계에 의미하는 것

    핵심: HBM4부터 메모리 회사의 선택이 패키징 생태계를 결정합니다.

    • SK하이닉스가 TSMC에 의존하는 한, CoWoS 수요는 계속 증가합니다

    • 삼성이 I-Cube 수율을 올려서 고객을 뺏어오면, CoWoS 독점이 깨질 수 있습니다

    • 하지만 현실적으로 2~3년 내에는 TSMC CoWoS가 압도적 우위를 유지할 전망

    결국 HBM4 시대의 패키징 경쟁은 "TSMC+SK하이닉스 동맹 vs 삼성 수직통합" 구도입니다. 이 경쟁의 결과가 AI 반도체 공급망 전체를 좌우합니다.

8. CoWoS 없이 HBM을 쓸 수 있는 대안은?

존재합니다. 하지만 각각 한계가 있습니다.

기술	개발사	방식	현황
EMIB	Intel	유기 기판에 소형 실리콘 브릿지 매립	Ponte Vecchio, Falcon Shores에 적용. 양산 실적 있음
I-Cube	Samsung	CoWoS-S와 유사한 실리콘 인터포저	양산 규모·수율에서 TSMC 대비 열세
FOCoS-Bridge	ASE	Fan-out 기판에 실리콘 브릿지 삽입	2025년 양산 시작. 검증 초기
MFIT	Deca	Fan-out 인터포저 + 임베디드 브릿지	IBM이 채용 예정. 초기 단계
MCM (PCB 레벨)	—	기존 PCB에 HBM 연결	대역폭·밀도 한계. AI 가속기에는 부적합

Intel EMIB은 실제 양산 실적이 있어서 가장 현실적인 대안입니다. 하지만 현시점에서 AI 가속기 시장의 CoWoS 점유율은 ~80%.

NVIDIA, AMD, Google, Broadcom이 전부 TSMC CoWoS를 쓰고 있고, 이 생태계를 바꾸려면 성능·비용·수율을 동시에 넘어야 합니다. 현실적으로 2~3년 내 CoWoS를 대체할 기술은 보이지 않습니다.

9. 정리 — CoWoS와 HBM의 관계

항목	내용
왜 같이 가나	HBM의 I/O 밀도·배선 거리·전력 효율 요구를 충족하는 유일한 패키징
HBM4가 바꾸는 것	인터포저 재설계 + base die 파운드리화 + 열 관리 + 면적 확대
SK vs 삼성	TSMC+SK 분업 동맹 vs 삼성 수직통합 — 패키징 생태계의 미래를 결정
대안	EMIB, I-Cube 등 존재하나 CoWoS 생태계 대체는 단기 불가
결론	AI 가속기가 존재하는 한, CoWoS와 HBM은 분리 불가능

    AI 칩의 성능은 결국 "프로세서와 메모리를 얼마나 가깝게, 얼마나 빠르게 연결하느냐"에 달려 있습니다.

    그 연결을 가능하게 하는 기술이 CoWoS이고, 그 위에 올라가는 메모리가 HBM입니다.

    둘은 떼려야 뗄 수 없는 관계입니다.

10. 자주 묻는 질문 (FAQ)

HBM은 왜 CoWoS 없이 사용할 수 없나요?

HBM은 1024-bit(HBM3E) 이상의 초고밀도 I/O를 가지고 있어 수천 개의 micro-bump 연결이 필요합니다. 이 밀도는 일반 PCB 배선으로 물리적으로 불가능하며, 실리콘 인터포저(sub-micron 배선)가 필수입니다. 또한 프로세서와 수 mm 이내 근접 배치가 필요하고, 짧은 배선으로 전력 효율을 확보해야 합니다.

HBM4는 HBM3E와 어떻게 다른가요?

HBM4는 인터페이스 폭이 1024-bit에서 2048-bit으로 두 배 늘어나고, base die가 단순 I/O에서 TSMC 5nm/3nm 공정의 액티브 로직 다이로 변합니다. DRAM 적층도 12~16층으로 증가하며, 대역폭은 스택당 2+ TB/s에 달합니다. 이로 인해 인터포저 재설계가 필수이며 HBM3E 인터포저와 호환되지 않습니다.

CoWoS 대신 쓸 수 있는 대안 기술은 없나요?

Intel EMIB, Samsung I-Cube, ASE FOCoS-Bridge 등 대안이 존재합니다. 특히 Intel EMIB은 Ponte Vecchio와 Falcon Shores에 적용된 양산 실적이 있습니다. 하지만 현재 AI 가속기 시장에서 CoWoS 점유율이 ~80%이며, NVIDIA·AMD·Google·Broadcom이 모두 TSMC CoWoS를 사용하고 있어 2~3년 내 대체는 어려울 전망입니다.

HBM4가 나오면 CoWoS-S로는 안 되나요?

HBM4는 12스택 이상 탑재가 예상되며, 이를 수용하려면 5.5x reticle 이상의 인터포저 면적이 필요합니다. CoWoS-S의 최대 면적은 3.3x reticle(~2,700mm²)이므로 물리적으로 부족합니다. CoWoS-L이 사실상 유일한 선택지입니다.

HBM4의 base die가 액티브 로직이 되면 뭐가 달라지나요?

base die가 단순 I/O 패스스루에서 연산 가능한 로직 다이로 변하면, 메모리와 프로세서의 경계가 흐려집니다. SK하이닉스는 TSMC에 base die 위탁 생산을 의뢰하고 있으며, 이는 패키징 복잡도 증가와 함께 발열 관리 난이도도 높입니다. 메모리 회사가 파운드리 서비스를 이용하는 새로운 산업 구조가 만들어지고 있습니다.

HBM4 양산은 언제 시작되나요?

SK하이닉스와 삼성 모두 2026년 후반 양산을 목표로 하고 있습니다. NVIDIA 젠슨 황은 SK하이닉스에 12-layer HBM4의 6개월 조기 납품을 요청한 바 있어, 실제 양산 시점은 더 앞당겨질 가능성도 있습니다. 다만 2048-bit 인터페이스에 맞춘 인터포저 재설계가 필수이므로, 패키징 준비 기간도 함께 고려해야 합니다.

SK하이닉스와 삼성, HBM4에서 누가 유리한가요?

SK하이닉스는 HBM 시장 점유율 50% 이상, NVIDIA와의 긴밀한 관계, TSMC CoWoS의 검증된 성능이 강점입니다. 삼성은 파운드리+HBM+패키징 수직통합으로 TSMC 의존 없이 원스톱 공급이 가능한 유일한 업체입니다. 현재는 SK하이닉스 우위이나, TSMC 캐파 병목이 심화되면 삼성의 수직통합 전략이 부각될 수 있습니다.

CoWoS 시리즈 — 첨단 패키징 완전 가이드

1편: CoWoS란? — AI 시대 반도체 패키징의 핵심
2편: CoWoS-S vs CoWoS-R vs CoWoS-L — 뭐가 다른가
3편: CoWoS와 HBM — 왜 같이 다닐 수밖에 없는가 (지금 읽는 글)
4편: CoWoS 공급 전쟁 — TSMC vs 삼성 vs Intel (근간)
5편: 한국 반도체와 첨단 패키징 — 기회와 딜레마 (근간)

반도체 기술 트렌드, 놓치지 마세요

학회 일정, 기술 분석, 업계 동향을 정리해 보내드립니다.

SemiHub 블로그 전체 보기

목차