목차
- 1. HBM은 왜 CoWoS 위에 올라가야 하는가
- 2. 이유 1 — 초고밀도 I/O
- 3. 이유 2 — 짧은 배선 거리
- 4. 이유 3 — 전력 효율
- 5. HBM3E → HBM4 — CoWoS가 어떻게 바뀌는가
- 6. HBM4가 만드는 4가지 변화
- 7. SK하이닉스 vs 삼성 — HBM4 전략이 갈린다
- 8. CoWoS 없이 HBM을 쓸 수 있는 대안은?
- 9. 정리
- 10. 자주 묻는 질문 (FAQ)
- 11. 시리즈 안내
1. HBM은 왜 CoWoS 위에 올라가야 하는가
1편에서 CoWoS의 구조와 필요성, 2편에서 3가지 변종(S/R/L)을 정리했습니다.
이번 편은 CoWoS 위에 올라가는 HBM(High Bandwidth Memory) 이야기입니다. HBM은 DRAM을 수직으로 쌓아 대역폭을 극대화한 메모리입니다. 1편에서 잠깐 다뤘지만, 여기서 더 깊이 들어갑니다.
HBM의 성능을 100% 쓰려면 세 가지 물리적 조건이 필요합니다.
2. 이유 1 — 초고밀도 I/O
HBM3E의 인터페이스 폭은 1024-bit입니다. 하나의 HBM 스택에서 프로세서로 동시에 데이터를 보내는 통로가 1024개라는 뜻입니다.
이걸 물리적으로 연결하려면 수천 개의 micro-bump가 필요합니다. 일반 PCB 배선 폭은 수십 μm인데, 이 밀도의 연결은 물리적으로 불가능합니다.
실리콘 인터포저의 배선 폭은 1μm 이하. 같은 면적에 수십 배 더 많은 배선을 넣을 수 있습니다. HBM의 수천 개 I/O를 소화할 수 있는 건 실리콘 인터포저뿐입니다.
| 연결 방식 | 배선 폭 | HBM3E 1024-bit 연결 |
|---|---|---|
| 일반 PCB | 수십 μm | 물리적으로 불가능 |
| 유기 인터포저 (RDL) | 수 μm | 제한적 (밀도 부족) |
| 실리콘 인터포저 | 1μm 이하 (sub-micron) | 가능 — 유일한 선택지 |
3. 이유 2 — 짧은 배선 거리
HBM의 대역폭 이점은 프로세서와의 거리가 짧을 때만 유효합니다.
- CoWoS 인터포저 위: Logic die ↔ HBM 간 거리 = 수 mm
- 일반 패키지: 수 cm → 신호 감쇠 + 전력 손실 + 지연 증가
수 mm와 수 cm의 차이가 별것 아닌 것 같지만, TB/s급 대역폭에서는 결정적입니다. 배선이 길어지면 신호 무결성이 깨지고, 고속 동작 자체가 안 됩니다.
4. 이유 3 — 전력 효율
짧은 배선 = 낮은 구동 전력.
AI 가속기에서 메모리 I/O 전력은 총 소비전력의 30~40%를 차지합니다. NVIDIA B200 한 장의 TDP가 1,000W에 달하는데, 여기서 메모리 I/O 전력을 줄이는 건 시스템 전체 효율에 직결됩니다.
CoWoS는 프로세서와 HBM을 수 mm 이내에 배치해서 I/O 전력을 최소화합니다.
| 제품 | 패키징 | 메모리 대역폭 | HBM 구성 |
|---|---|---|---|
| NVIDIA H100 | CoWoS-S | 3.35 TB/s | HBM3 × 6스택 |
| NVIDIA B200 | CoWoS-L | 8 TB/s | HBM3E × 8스택 |
| 일반 DDR5 PC | — | ~0.05 TB/s | — |
H100에서 B200으로 가면서 대역폭이 2.4배 늘었습니다. 이걸 가능하게 한 건 CoWoS-S에서 CoWoS-L로의 전환과, 수 mm 배선 거리에서 오는 전력 효율입니다. 일반 DDR5 대비로는 160배 차이.
연결 도로 없이는 고속도로가 있어도 쓸 수 없습니다.
5. HBM3E → HBM4 — CoWoS가 어떻게 바뀌는가
HBM4는 2026년 후반 양산 예정입니다. 단순 업그레이드가 아니라, 패키징 설계를 근본적으로 바꿉니다.
| 항목 | HBM3E (현재) | HBM4 (2026 후반~) |
|---|---|---|
| 인터페이스 폭 | 1024-bit | 2048-bit |
| 대역폭 | ~1.2 TB/s / 스택 | ~2+ TB/s / 스택 |
| DRAM 적층 | 8~12층 | 12~16층 |
| Base die | 패시브 (단순 I/O) | 액티브 로직 다이 |
| Base die 공정 | 단순 | TSMC 12nm → 5nm/3nm |
| 동작 전압 | 1.1V | 0.8V |
이 표에서 주목할 변화가 네 가지 있습니다.
6. HBM4가 만드는 4가지 변화
① 인터포저 재설계 필수
인터페이스 폭이 1024-bit에서 2048-bit로 두 배가 됩니다. 인터포저 위의 배선 밀도도 두 배가 필요합니다.
이건 기존 인터포저에 선만 더 깔면 되는 게 아닙니다. HBM4는 HBM3E 인터포저와 호환 불가. 인터포저를 처음부터 다시 설계해야 합니다.
② Base die의 파운드리화
이전 HBM의 base die는 단순 I/O 역할만 했습니다. 데이터를 위아래로 전달하는 통로.
HBM4의 base die는 연산이 가능한 로직 다이로 변합니다.
- SK하이닉스: TSMC 12nm → 5nm 공정으로 base die 위탁 생산
- 삼성: 자체 파운드리에서 base die 제조
메모리와 로직의 경계가 흐려집니다. base die 자체가 하나의 프로세서급 칩이 되면, 패키징 복잡도는 한 단계 더 올라갑니다.
③ 열 관리 난이도 상승
base die에 로직이 들어가면 발열이 증가합니다. 거기에 DRAM 적층이 12~16층까지 올라가면 열이 빠져나갈 통로가 더 좁아집니다.
CoWoS 설계에서 열 관리(thermal solution)의 중요도가 급격히 올라갑니다.
④ 더 큰 인터포저 필요
HBM4를 12스택 이상 탑재하려면 인터포저 면적이 커져야 합니다. CoWoS-S의 3.3x reticle로는 부족합니다.
CoWoS-L의 5.5x reticle 이상이 사실상 유일한 선택지. 2편에서 "CoWoS-L이 메인스트림이 된다"고 한 이유가 여기에 있습니다.
7. SK하이닉스 vs 삼성 — HBM4 전략이 갈린다
HBM4의 base die가 액티브 로직으로 변하면서, 두 HBM 공급사의 전략이 완전히 갈립니다. 이 차이가 CoWoS 생태계의 미래를 결정합니다.
SK하이닉스 — TSMC와 분업
- Base die: TSMC에 위탁 생산 (12nm → 5nm 전환 중)
- HBM 스태킹: 청주 P&T7 공장 (₩19조 투자, 세계 최대 HBM 조립 시설)
- 최종 패키징: TSMC CoWoS-L에 의존
- 시장 점유율: HBM 시장 50% 이상 (HBM3E 기준), NVIDIA의 1차 공급사
장점은 TSMC의 검증된 CoWoS 수율과 성능을 그대로 활용할 수 있다는 것. 단점은 TSMC 캐파에 종속된다는 것입니다. CoWoS 생산능력이 수요의 60~70% 수준인 현재, 이건 실질적 병목입니다.
삼성전자 — 수직통합 원스톱
- Base die: 자체 파운드리에서 제조 (GAA 공정, TSMC 의존 없음)
- HBM 스태킹: 자체 시설
- 패키징: 자체 I-Cube 시리즈 (I-Cube S, I-Cube E, SAINT)
- 일본 패키징 허브: $1.7억 투자, 공급망 다변화
삼성은 파운드리 + HBM + 패키징을 원스톱으로 제공할 수 있는 유일한 업체입니다. TSMC CoWoS 캐파가 부족할 때, 고객이 삼성으로 넘어갈 수 있는 구조적 이유입니다.
하지만 현실은 — I-Cube의 양산 규모와 수율이 TSMC CoWoS에 비해 열세. NVIDIA·AMD·Google 모두 아직 TSMC를 쓰고 있습니다.
비교표
| 항목 | SK하이닉스 | 삼성전자 |
|---|---|---|
| Base die 제조 | TSMC 위탁 (5nm) | 자체 파운드리 (GAA) |
| 패키징 | TSMC CoWoS-L 의존 | 자체 I-Cube |
| 공급 체인 | 분업 (SK + TSMC) | 수직통합 (원스톱) |
| TSMC 의존도 | 높음 | 없음 |
| HBM 시장 점유율 | 50%+ (1위) | ~40% (2위) |
| 장점 | 검증된 성능, NVIDIA 관계 | 공급 독립, 가격 경쟁력 |
| 리스크 | TSMC 캐파 병목 | 수율·규모 격차 |
이것이 CoWoS 생태계에 의미하는 것
• SK하이닉스가 TSMC에 의존하는 한, CoWoS 수요는 계속 증가합니다
• 삼성이 I-Cube 수율을 올려서 고객을 뺏어오면, CoWoS 독점이 깨질 수 있습니다
• 하지만 현실적으로 2~3년 내에는 TSMC CoWoS가 압도적 우위를 유지할 전망
결국 HBM4 시대의 패키징 경쟁은 "TSMC+SK하이닉스 동맹 vs 삼성 수직통합" 구도입니다. 이 경쟁의 결과가 AI 반도체 공급망 전체를 좌우합니다.
8. CoWoS 없이 HBM을 쓸 수 있는 대안은?
존재합니다. 하지만 각각 한계가 있습니다.
| 기술 | 개발사 | 방식 | 현황 |
|---|---|---|---|
| EMIB | Intel | 유기 기판에 소형 실리콘 브릿지 매립 | Ponte Vecchio, Falcon Shores에 적용. 양산 실적 있음 |
| I-Cube | Samsung | CoWoS-S와 유사한 실리콘 인터포저 | 양산 규모·수율에서 TSMC 대비 열세 |
| FOCoS-Bridge | ASE | Fan-out 기판에 실리콘 브릿지 삽입 | 2025년 양산 시작. 검증 초기 |
| MFIT | Deca | Fan-out 인터포저 + 임베디드 브릿지 | IBM이 채용 예정. 초기 단계 |
| MCM (PCB 레벨) | — | 기존 PCB에 HBM 연결 | 대역폭·밀도 한계. AI 가속기에는 부적합 |
Intel EMIB은 실제 양산 실적이 있어서 가장 현실적인 대안입니다. 하지만 현시점에서 AI 가속기 시장의 CoWoS 점유율은 ~80%.
NVIDIA, AMD, Google, Broadcom이 전부 TSMC CoWoS를 쓰고 있고, 이 생태계를 바꾸려면 성능·비용·수율을 동시에 넘어야 합니다. 현실적으로 2~3년 내 CoWoS를 대체할 기술은 보이지 않습니다.
9. 정리 — CoWoS와 HBM의 관계
| 항목 | 내용 |
|---|---|
| 왜 같이 가나 | HBM의 I/O 밀도·배선 거리·전력 효율 요구를 충족하는 유일한 패키징 |
| HBM4가 바꾸는 것 | 인터포저 재설계 + base die 파운드리화 + 열 관리 + 면적 확대 |
| SK vs 삼성 | TSMC+SK 분업 동맹 vs 삼성 수직통합 — 패키징 생태계의 미래를 결정 |
| 대안 | EMIB, I-Cube 등 존재하나 CoWoS 생태계 대체는 단기 불가 |
| 결론 | AI 가속기가 존재하는 한, CoWoS와 HBM은 분리 불가능 |
그 연결을 가능하게 하는 기술이 CoWoS이고, 그 위에 올라가는 메모리가 HBM입니다.
둘은 떼려야 뗄 수 없는 관계입니다.
10. 자주 묻는 질문 (FAQ)
CoWoS 시리즈 — 첨단 패키징 완전 가이드
- 1편: CoWoS란? — AI 시대 반도체 패키징의 핵심
- 2편: CoWoS-S vs CoWoS-R vs CoWoS-L — 뭐가 다른가
- 3편: CoWoS와 HBM — 왜 같이 다닐 수밖에 없는가 (지금 읽는 글)
- 4편: CoWoS 공급 전쟁 — TSMC vs 삼성 vs Intel (근간)
- 5편: 한국 반도체와 첨단 패키징 — 기회와 딜레마 (근간)