AI News 2026-03-26 — 중국 AI 생태계의 자립, 그리고 오픈소스 LLM 경쟁의 새 국면
화웨이 Atlas 350 발표 이후 중국 AI 인프라 자립 가속화, DeepSeek·Qwen·GLM 등 오픈소스 LLM 경쟁 심화, 그리고 글로벌 AI 칩 시장 재편 흐름을 정리합니다.
지난 주 화웨이가 Atlas 350을 공식 발표한 데 이어, 중국 AI 생태계 전반에서 의미 있는 변화들이 이어지고 있습니다. 오늘은 최근 며칠 사이 주목할 만한 흐름들을 정리합니다.
![]()
1. 화웨이 Atlas 350 이후 — 중국 AI 인프라 자립 가속화
지난 3월 20일 화웨이 중국 파트너 컨퍼런스에서 공개된 **Atlas 350(Ascend 950PR 탑재)**은 단순한 신제품 출시 이상의 의미를 갖습니다.
주목할 변화들:
- 자체 HBM(HiBL 1.0) 최초 탑재 — SK하이닉스·삼성 메모리 의존 탈피 시작
- SMIC SAQP DUV 공정으로 EUV 없이 5nm급 밀도 구현
- 바이두, 화웨이 클라우드, 차이나텔레콤 등이 이미 Ascend 라인업 도입 확대 중
SemiAnalysis 최신 보고서에 따르면, 화웨이 CloudMatrix 384 시스템은 클러스터 수준에서 엔비디아 GB200 NVL72와 경쟁 가능한 성능을 보였다고 합니다. Atlas 350이 본격 양산되면 이 격차는 더 좁혀질 전망입니다.
2. 오픈소스 LLM — 중국 모델의 약진 계속
지난달 공개된 주요 모델들의 성능 평가가 속속 나오면서, 중국 모델들의 경쟁력이 재조명되고 있습니다.
GLM-5 — Ascend 칩 10만 장으로 훈련
지푸(智谱)AI의 GLM-5(744B MoE)는 Chatbot Arena 1,454점으로 현재 오픈소스 모델 최상위권에 위치합니다. 가장 눈에 띄는 점은 훈련 인프라: 엔비디아 GPU 없이 화웨이 Ascend 910B 10만 장으로 전 훈련 과정을 완료했습니다. 제재 우회가 아닌, 자체 AI 인프라로 프론티어 모델을 만들어낸 사례입니다.
Qwen 3.5 Small 시리즈 — 온디바이스 경쟁 개막
알리바바가 이번 주 0.8B~9B 크기의 Qwen 3.5 Small 라인업을 공개했습니다. 스마트폰·엣지 디바이스에서의 LLM 실행을 겨냥한 것으로, 같은 크기 대비 멀티태스킹과 함수 호출 성능이 두드러진다는 초기 평가가 나오고 있습니다.
API 가격 — $1/M 토큰 아래로
DeepSeek V3.2 기준 GPT-4급 성능의 API 가격이 백만 토큰당 $1 이하로 진입했습니다. 2023년 $30과 비교하면 30배 이상의 가격 하락입니다. 이 압박에 OpenAI, Anthropic, Google 모두 가격 조정을 이어가고 있습니다.
3. 글로벌 AI 칩 시장 재편 — 새로운 플레이어들
엔비디아의 독주 구도에 균열이 생기고 있습니다. 중국만의 이야기가 아닙니다.
| 지역 | 플레이어 | 동향 |
|---|---|---|
| 미국 | AMD MI400, Intel Gaudi 3 | 데이터센터 AI 칩 점유율 확대 |
| 영국 | Arm 기반 커스텀 칩 | 클라우드 업체들의 자체 칩 설계 가속 |
| 중국 | 화웨이, 캠브리콘, 바이두 | 제재 속 자립 생태계 구축 |
| UAE | TII Falcon 팀 | 오픈소스 LLM + 자체 인프라 투자 |
엔비디아의 시장 지배력은 여전히 압도적이지만, "CUDA 외에는 선택지가 없다"는 인식이 빠르게 변하고 있습니다.
4. 주목할 기술 동향
추론 비용 급감 — 모델 경량화와 MoE의 효과
Qwen 3.5(전체 397B, 활성 17B)나 DeepSeek V3.2(685B, 활성 37B)처럼, 활성 파라미터 비율을 4~5%대로 낮추는 MoE 구조가 주류가 되고 있습니다. 성능을 유지하면서 추론 비용을 60% 이상 절감하는 효과가 입증됐습니다.
소프트웨어 생태계 — CUDA 대안의 현실화
화웨이 CANN과 MindSpore의 PyTorch 호환성이 빠르게 개선되고 있습니다. GLM-5 훈련 사례처럼, 이제 프론티어급 모델도 비(非)CUDA 환경에서 훈련 가능하다는 것이 증명됐습니다. 소프트웨어 생태계가 하드웨어 자립만큼이나 빠르게 따라오고 있습니다.
오늘의 정리
지난 한 주를 돌아보면, 중국 AI 생태계는 "없어서 어쩔 수 없이"에서 "이 정도면 충분히 쓸 만하다"는 단계로 넘어가고 있는 것 같습니다. 칩도, 모델도, 소프트웨어 스택도.
5년 전 "ARM이 x86을 대체할 수 있을까"라는 질문이 실없어 보였지만, 지금 M4 맥북프로로 이 글을 쓰고 있는 것처럼 — AI 인프라도 비슷한 국면 전환이 일어나고 있을 수 있습니다.
이 포스트는 공개된 기술 문서, SemiAnalysis, Tom's Hardware, Hugging Face 등의 자료를 바탕으로 작성되었습니다. (2026년 3월 26일)
새 글을 이메일로 받아보세요 ✉️
새 글이 올라오면 바로 알려드릴게요