미 상무부는 4월 9일 Nvidia에 H20 수출 제한을 예고하고,
4월 14일부로 이 조치를 무기한(indefinitely) 적용한다고 공식화했습니다
1. Nvidia H20 칩에 대하여
H20은 Nvidia가 중국 시장 전용으로 만든 고급 AI 칩으로, 훈련(training) 성능은 낮추되
추론(inference) 성능은 강화된 제품입니다
미국 수출 규제 기준을 피하도록 고안됐지만, 중국 내 수요가 폭발하면서 다시 미국의
감시망에 포착이 되었습니다.
미국 상무부는 H20의 고속 메모리 연결 능력과 병렬 처리 구조가 중국의 슈퍼컴퓨터
구축에 악용될 수 있다고 판단했고, 2025년 4월 14일 자로 H20 수출을 금지한다고
발표했습니다.
이로 인해 Nvidia는 55억 달러에 달하는 손실을 반영해야 했고, 주가는
시간 외 거래에서 6% 급락했습니다.
H20은 비록 연산 성능은 제한되었으나, 메모리 용량과 연결 대역폭 등 시스템 통합 능력이
뛰어나 슈퍼컴퓨터나 대규모 AI 인프라에 쓰일 수 있다는 것입니다
실제로 H20은 메모리 96GB와 초고속 인터커넥트를 갖춰,
추론(inference) 작업에서는 H100보다도 효율적이라는 평가를 받았습니다.
추론 단계는 방대한 모델을 사용자 질의에 응답하는 용도로 활용하는 과정으로, 연산보다는
메모리 대역폭에 크게 의존하기 때문에 H20의 메모리 강화 설계가 빛을 발했다고 합니다.
미국의 시각에서 보면, 이러한 H20 칩은 수출 통제의 허점을 파고든 제품이었습니다
Nvidia 주요 AI 칩 성능 비교 (훈련 vs 추론 중심)
칩명 | FP32 기준 훈련 성능 (TFLOPS) | 추론 성능 (INT8/FP16 등) | 메모리 용량 | 특징 및 수출 상태 |
A100 | ~19.5 / 312 (Tensor) | 중상 | 40~80GB | 수출 금지 (2022년) |
H100 | ~30 / 700+ (Tensor) | 매우 높음 | 80GB | 수출 금지 (2022년) |
A800 | 조절된 성능 | 중간 | 40GB | 수출 금지 (2023.10) |
H800 | 조절된 성능 | 중상 | 80GB | 수출 금지 (2023.10) |
H20 | 미공개 (약 30~40%) | 높음 | 96GB | 수출 금지 (2025.4.14) |
H200 | 미공개 | 매우 높음 | 141GB | 출시 (2024년 2분기) |
B100 | 20 PFLOPS (FP4 기준) | 최고 수준 | 192GB | 출시 (2025년 1분기) |
B200 | 미공개 | 최고 수준 | 288GB | 출시 (2025년 1분기) |
GB200 | 미공개 | 최고 수준 | 288GB x2 | 출시 (2025년 1분기) |
훈련 성능 TFLOPS란?
TFLOPS(Tera Floating Point Operations Per Second)는
초당 수행 가능한 1조(10 ¹²) 번의 부동소수점 연산을 의미합니다.
AI 모델 학습(training)에 필요한 수치 연산 성능을 나타내는 지표로,
수치가 높을수록 복잡한 모델을 더 빠르게 학습시킬 수 있습니다.
예컨대 A100의 312 TFLOPS는 초당 312조 회의 연산이 가능함을 뜻합니다.
2. 미국의 AI 반도체 수출 규제
미국은 2022년부터 AI 훈련에 쓰이는 고성능 반도체 칩의 대중 수출을 막기 시작했습니다.
이는 단순한 기술 통제가 아닌, 중국의 군사용 AI 및 슈퍼컴퓨터 개발을 차단하기 위한 전략으로 보입니다.
H20 칩은 Nvidia가 중국 시장을 위해 설계한 전용 칩입니다.
2025년 1월 중국 스타트업 DeepSeek가 공개한 초저비용 AI 모델(DeepSeek-R1)이
서방을 놀라게 한 이후,이를 활용하려는 기업들이 폭증하며 H20 주문이 급등했습니다
올 1분기에만 중국 주요 기술기업들이 H20 칩 약 160억 달러어치를 사들여 재고를
쌓았다는 보도까지 있을 정도입니다
AI 모델을 학습시키는 훈련 성능은 낮추었지만, AI 모델의 응답 처리(추론) 성능은
오히려 더 강화해 중국의 AI 서비스 기업들 사이에서 폭발적인 수요를 끌어내었습니다..
그러나 미국 상무부는 해당 칩이 고속 메모리 연결 및 병렬 처리 능력을 갖춘 만큼,
중국의 슈퍼컴퓨터에 활용될 가능성이 있다고 판단했고,
2025년 4월 14일부로 수출을 금지한 상황입니다..
- 2022년: Nvidia A100, H100, AMD MI250 등 수출 금지
- 2023년 10월: 다운그레이드 버전인 A800, H800도 금지
- 2025년 4월: H20까지 포함하며 고성능 AI 칩의 중국 수출 경로 사실상 전면 봉쇄
3. 중국의 대응 전략: 단기 확보 vs 장기 자립
미국의 압박에 대해 중국은 단기와 중장기 두 방향으로 대응하고 있습니다.
단기적으로는 충분한 재고 확보와 대체 조달에 힘써 왔습니다.
중국 빅테크 기업들은 H20 규제가 임박하다는 관측에 선제적으로 막대한 주문을
넣어 올해 초까지 칩 확보에 나섰습니다.
Tencent, Alibaba, ByteDance 같은 기업들은 자체 데이터센터용뿐만 아니라
클라우드 서비스를 통해 다른 기업들도 H20+DeepSeek 조합의 AI 기능을 활용할 수 있도록
하겠다는 계획으로 물량을 쓸어 담았습니다.
그 결과 일부 추산에 따르면 2024년 한 해에만 100만 개 이상의 H20 칩이 생산되었고
대부분 중국으로 향했다고 합니다
장기적으로 중국의 해법은 결국 자체 기술 자립입니다.
미국의 제재가 본격화된 이후 중국 정부와 민간은 반도체 굴기를 향한 투자를 더욱 키우고 있습니다.
중국 내 수십 개 AI 칩 설계 스타트업들이 막대한 자금을 지원받아 Nvidia·AMD에 필적하는
가속기를 개발 중이며, 실제로 일부 성과도 나타나고 있습니다.
예컨대 Biren이라는 신생기업은 2022년에 이미 7nm 공정의 GPU 칩 시제품을 공개하여
업계를 놀라게 했고, **하이궁(海光, Hygon)**이나 롱손(Loongson) 같은 중국 칩 업체들의
주가는 미국 제재 소식에 급등하기도 했습니다.
화웨이도 자체 AI 연산칩 Ascend 시리즈를 선보였고, 알리바바와 바이두는
클라우드 데이터센터용 AI 칩을 개발하여 일부 실용화하였습니다.
텐센트와 바이트댄스 역시 최근 AI 반도체 내부 프로젝트에 착수해, 추천 알고리즘 가속기나
데이터센터용 칩을 연구 중인 것으로 알려져 있습니다.
이처럼 중국의 빅테크 기업들은 해외 의존도를 줄이기 위한 자체 칩 개발에 투자를 아끼지 않고
있는데, 이는 미국의 견제가 심해질수록 더욱 가속화될 전망입니다
1) 단기 대응:
- H20 수출 제한 전 대량 주문 (사재기 수준)
- A100, H800 등 기존 재고를 최대한 효율적으로 운영
- 모델 경량화 및 추론 중심 운영 최적화
2) 중장기 전략:
- 자체 AI 칩 개발: Biren, Hygon, Huawei Ascend, Baidu Kunlun, Alibaba Hanguang 등
- 정부 지원 확대: 반도체 굴기, 국유펀드, 소재·장비 내재화 추진
- 소프트웨어 최적화: 적은 연산 자원으로도 고성능 AI 구현 실험
미국의 H20 수출 제한 조치는 AI 칩 분야에서 미·중 경쟁이 얼마나 첨예한 지를 보여주는 사건입니다.
미국은 작은 허점도 용인하지 않겠다는 태도로 중국의 AI 핵심 부품 입수를 차단하고 있고,
중국은 이에 굴복하기보다 자신만의 길을 개척하는 쪽을 택했습니다.
당분간 중국의 AI 기술 성장은 다소 느려질 수 있지만, 방대한 인재와 데이터,
정부 지원을 바탕으로 새로운 돌파구를 찾으려 할 것입니다.
우리나라 또한 전적으로 엔비디아에 의존하고 있습니다
과학기술정보통신부는 국가 AI 컴퓨팅 센터 구축을 위해 엔비디아 GPU 확보를
최우선 과제로 삼고 있습니다.
공모 신청 기업에는 엔비디아등으로부터 받은 GPU 공급 확약서를 제출하도록
요구하고 있습니다.
정부는 2030년까지 AI 반도체 비중을 50%로 확대할 계획이지만, 아직까지는 안갯속입니다.