경제적 자유/피치 주식

서버는 ‘랙’으로 산다: GB200 랙 솔루션과 ODM 밸류체인

피치망고랑 2025. 10. 13. 20:24
서버는 ‘랙’으로 산다: GB200 랙 솔루션과 ODM 밸류체인 — 핵심 요약 & 대표 기업 지도

요약 · 업데이트: 2025-10-13

서버는 ‘랙’으로 산다: GB200 랙 솔루션과 ODM 밸류체인 — 핵심 요약 & 대표 기업 지도

핵심요약 AI 서버의 성능 병목이 GPU 개수보다 NVLink·전력·액체 냉각·배선에 좌우되면서, 조달 단위가 노드 → 랙(NVL72 등) → 팟으로 이동했습니다. 이 과정에서 ODM이 설계·제조·통합을 묶는 역할로 부상했고, 하이퍼스케일러는 내부 사양 통제와 외부 생산 민첩성을 결합해 배치 속도를 높이고 있습니다.

목차

  1. 1) 변화의 본질 요약
  2. 2) 밸류체인별 대표 기업 표
  3. 3) 실행 인사이트 & 전망
  4. 4) 자주 묻는 질문(FAQ)

1) 변화의 본질 요약

  • 대표 사례 — NVIDIA GB200 NVL72: 72× GPU + 36× CPU를 NVLink로 묶어 ‘거대 단일 가속기’처럼 동작하는 랙 통합 시스템. 액체 냉각·전력 분배·케이블링·스위치가 사전 통합됩니다.
  • ODM 부상: Quanta(QCT), Wiwynn, Inventec 등은 설계(IP)·조립·현장 통합을 빠르게 수행하며 하이퍼스케일 수요에 최적화되어 있습니다.
  • OEM vs ODM: OEM(Dell, HPE 등)은 범용 플랫폼·글로벌 서포트가 강점, 초고밀도 AI 랙은 ODM의 민첩성이 두드러집니다.
  • 하이퍼스케일러 협력: 내부 사양 통제 + 외부 ODM 대량 제조. 데이터센터는 수랭·전력·NVLink 패브릭을 전제로 팟(Pod) 중심 레이아웃으로 진화합니다.

2) 밸류체인별 대표 기업 표

밸류체인 구분 주요 역할 대표 기업 (공개 기준) 메모
GPU / Compute SoC AI 가속기, CPU 통합 설계 NVIDIA, AMD, Intel GB200(Grace+Blackwell) 계열의 핵심 레퍼런스
서버 ODM (설계·조립·통합) 랙·샤시·전력·냉각 통합 제조 Quanta(QCT), Wiwynn, Inventec, Foxconn, Supermicro 하이퍼스케일 맞춤형 AI 랙·팟 주력
OEM (범용 서버) 표준 플랫폼, 수명주기·글로벌 서포트 Dell, HPE, Lenovo, Cisco 범용 워크로드/엔터프라이즈 시장 강점
냉각·전력 인프라 수랭/CDU, PDU, 버스바 Delta Electronics, Vertiv, Eaton, CoolIT, Asetek NVL72급 고밀도 액체 냉각 대응
네트워킹 / 인터커넥트 NVLink 스위치, IB/Ethernet NVIDIA (Mellanox), Broadcom, Marvell, Arista 랙 내부 NVLink 패브릭 + 랙 간 확장
케이블·커넥터 고속 링크, 전력·수랭 인터페이스 Amphenol, TE Connectivity, Luxshare 신호 무결성·열·기계 규격 동시 최적화
Hyperscaler (수요자) 사양 기획·대량 발주·현장 최적화 Google, AWS, Meta, Microsoft(Azure) 내부 사양 주도 + 외부 ODM 분업

※ 기업 예시는 공개적으로 알려진 역할 범위를 기준으로 한 일반적 분류이며, 특정 기업의 비공개 수치·계약 조건은 포함하지 않았습니다.

3) 실행 인사이트 & 전망

  • 조달 단위의 이동: GPU 장수 중심 → NVLink 랙/팟 중심 CapEx. 전력·냉각 설비가 동시에 발주되는 구조로 예산 배분이 재편됩니다.
  • 설계 기본값의 변화: 수랭(CDU/콜드플레이트), 고밀도 전력(버스바/PDU), 저지연 패브릭(NVLink+IB/Ethernet)이 초기 설계의 기본값이 됩니다.
  • ODM의 IP 축적: 기계·전력·신호·현장 배치 노하우가 설계 자산으로 축적되며, 마진 구조 개선 여지가 커집니다.
  • 2차 수혜: 냉각·전력·케이블·커넥터 등 주변 부품 밸류체인으로 수혜가 확산됩니다.
  • 전망: 2025~2027년은 “한 랙=한 NVLink 도메인” 표준의 대량 도입기. 멀티 랙·멀티 팟 운영 표준(관제·모니터링·복구)이 함께 성숙할 가능성이 높습니다.

4) 자주 묻는 질문(FAQ)

Q1. 왜 굳이 랙 단위로 사야 하나요?

대규모 모델의 병목은 GPU 자체보다 통신·전력·냉각·배선의 통합 효율에 있습니다. 제조 단계에서 이를 패키지화한 랙을 도입하면, 구축 속도·신뢰성·성능 예측 가능성이 모두 올라갑니다.

Q2. ODM과 OEM은 어떻게 선택하면 좋을까요?

초고밀도 AI 전용 존(학습/대규모 추론)은 ODM의 맞춤형 랙이 빠르고 유연합니다. 반면, 범용 워크로드·글로벌 유지보수는 OEM 표준 플랫폼의 강점이 여전합니다. 많은 사업자가 이원화 전략을 택합니다.

Q3. GB200 NVL72 이후의 트렌드는요?

멀티 랙·멀티 팟 확장과 운영 표준화가 핵심입니다. 냉각·전력·패브릭이 데이터센터 설계의 초기 전제로 녹아들며, 관련 밸류체인 전반의 동반 성장이 기대됩니다.

본 글은 공개 정보와 일반적인 산업 해석을 기반으로 작성되었으며, 특정 기업의 비공개 수치·계약 조건·내부 자료는 포함하지 않습니다.