본문 바로가기
AI.IT

엔비디아 Vera CPU, AMD·인텔보다 빠르다? AI 랙 전쟁의 진짜 의미

by bamsik 2026. 5. 28.
반응형

엔비디아 Vera CPU 벤치마크가 나온 뒤 반응이 꽤 세다. AMD EPYC와 Intel Xeon을 이겼다는 숫자보다 더 봐야 할 건, 엔비디아가 AI 데이터센터를 CPU·GPU·네트워크·랙 단위로 묶고 있다는 점이다.

핵심 답변: Vera CPU는 왜 중요한가?

답부터 말하면 Vera CPU의 핵심은 “AMD·인텔보다 빠른 CPU”라는 제목에만 있지 않다. 엔비디아가 Rubin GPU 시대의 AI 랙을 통째로 설계하면서, GPU 옆에서 데이터 이동과 메모리 병목을 줄일 CPU까지 자기 플랫폼 안으로 끌어들이고 있다는 게 더 크다.

영상에서 다룬 포인트도 여기다. GPU가 아무리 빨라도 CPU가 데이터를 제때 밀어 넣지 못하면 AI 추론과 에이전트 워크로드는 멈칫한다. 특히 에이전트가 도구를 계속 호출하고, 샌드박스가 여러 개 돌고, 데이터베이스와 코드 실행이 동시에 붙는 환경에서는 CPU의 역할이 다시 커진다.

엔비디아 블로그는 Phoronix 초기 벤치마크를 인용해 Vera가 88개 Olympus 코어, 최대 1.2TB/s 메모리 대역폭, LPDDR5X 기반 메모리 서브시스템을 갖췄다고 설명했다. 또 Grace 대비 기하평균 1.6배, 일부 최신 128코어 x86 프로세서 대비 1.5배 수준의 결과를 냈다고 밝혔다. 숫자는 세다. 근데 이 숫자만 보면 오히려 본질을 놓친다.

AMD·인텔보다 빠르다는 말, 어디까지 믿어야 하나?

먼저 조심할 부분이 있다. 이번 결과는 초기 벤치마크다. 영상에서도 말하듯 사전 생산 하드웨어 기반이고, 양산 제품에서 같은 성능이 반복될지, 실제 고객 워크로드에서 전력 효율까지 같이 이길지는 아직 확인이 필요하다.

서버 CPU는 “빠르다” 하나로 끝나는 제품이 아니다. 컴파일, 압축, 데이터베이스, 파이썬 런타임, 자바, 영상 인코딩, 가상화, 과학 계산처럼 워크로드마다 결과가 다르게 나온다. Phoronix 테스트에서 좋은 결과가 나왔다고 해서 모든 서버 CPU 용도에서 AMD EPYC와 Intel Xeon을 정리했다는 뜻은 아니다.

그래도 의미는 있다. 엔비디아 Vera CPU 공식 페이지는 Vera를 단독 범용 CPU라기보다 AI 학습, 데이터 처리, 에이전트 추론을 위한 데이터센터 CPU로 설명한다. 즉 비교 기준이 “범용 서버 시장 전체”가 아니라 “AI Factory에서 GPU를 얼마나 잘 먹여 살리느냐” 쪽으로 이동한다.

진짜 전장은 CPU가 아니라 AI 랙이다

내가 보기엔 여기서 제일 중요한 단어는 CPU가 아니라 랙이다. 예전 서버 경쟁은 CPU 코어 수, 클럭, 소켓 수 중심으로 봤다. 그런데 AI 데이터센터에서는 GPU, CPU, 메모리, 네트워크, 전력, 냉각이 한 덩어리로 움직인다. 부품 하나가 빠른 것보다 랙 전체가 얼마나 안정적으로 처리량을 내는지가 더 중요해진다.

Vera Rubin 플랫폼 자료를 보면 Vera Rubin NVL72는 72개 Rubin GPU, 36개 Vera CPU, ConnectX-9, BlueField-4, NVLink 구성을 함께 묶는다. 엔비디아가 말하는 AI Factory는 칩 하나가 아니라 랙 스케일 시스템이다.

이 구조가 AMD와 인텔에 부담인 이유도 명확하다. AMD는 EPYC CPU와 Instinct GPU를 갖고 있고, 인텔은 Xeon과 Gaudi, 이더넷 생태계를 갖고 있다. 하지만 엔비디아는 CUDA, GPU, NVLink, 네트워크, DPU, 이제 CPU까지 한 장의 그림으로 판다. 고객 입장에서는 CPU만 고르는 게 아니라 “이 AI 공장을 어느 플랫폼으로 맞출 것인가”를 묻게 된다.

이건 락인 위험도 같이 만든다. 엔비디아 플랫폼을 통째로 쓰면 최적화는 쉬워질 수 있지만, 가격 협상력과 공급 다변화는 약해질 수 있다. 대형 클라우드 사업자가 자체 칩이나 AMD, Broadcom, Marvell 같은 대안을 계속 키우는 이유가 여기에 있다.

앞으로 무엇을 확인해야 하나?

첫째는 전력 효율이다. 엔비디아는 Vera가 LPDDR5X로 기존 CPU 대비 더 높은 메모리 대역폭을 낮은 전력에서 낸다고 주장한다. 하지만 데이터센터에서는 벤치마크 점수보다 같은 전력 예산에서 얼마나 많은 추론과 에이전트 작업을 처리하는지가 더 중요하다.

둘째는 양산과 공급이다. 엔비디아 뉴스룸은 Vera Rubin 플랫폼을 “일곱 개 칩, 다섯 개 랙, 하나의 AI 슈퍼컴퓨터”로 설명했다. 말은 멋있지만, 실제 데이터센터에 들어가려면 보드, 냉각, 전력, 네트워크, 랙 조립, 납기까지 맞아야 한다.

셋째는 고객 채택이다. OpenAI, Anthropic 같은 대형 AI 고객이 엔비디아 인프라를 계속 쓰는 건 맞다. 다만 이들이 장기적으로 엔비디아 의존도를 어디까지 허용할지는 별개의 문제다. 성능이 좋아도 가격과 공급이 막히면 자체 칩이나 다른 공급망을 키울 동기가 생긴다.

그래서 이번 Vera CPU 뉴스는 “엔비디아가 CPU 시장도 먹는다”로 끝내면 아쉽다. 더 정확히는 AI 데이터센터에서 CPU를 따로 고르는 시대가 줄어들고 있다는 신호에 가깝다. GPU 중심으로 데이터센터 전체를 재설계하다 보니 CPU마저 엔비디아 생태계 안으로 들어오는 흐름이다.

자주 묻는 질문

Vera CPU가 AMD EPYC와 Intel Xeon을 완전히 이긴 건가?

아직 그렇게 단정하긴 어렵다. 초기 벤치마크에서 강한 결과가 나온 건 맞지만, 양산 제품, 독립 테스트, 전력당 성능, 실제 고객 워크로드 검증이 더 필요하다.

Vera CPU는 일반 서버용 CPU인가?

범용 서버에도 일부 쓰일 수 있겠지만, 엔비디아가 강조하는 방향은 AI Factory와 에이전트 AI 인프라다. Rubin GPU와 함께 랙 단위 시스템에서 데이터 이동과 메모리 병목을 줄이는 역할이 더 중요하다.

AMD와 인텔은 끝난 건가?

아니다. AMD EPYC와 Intel Xeon은 여전히 서버 시장에서 강하고, 기존 고객 기반과 호환성도 크다. 다만 AI 인프라 경쟁의 기준이 CPU 단품에서 GPU·네트워크·소프트웨어를 묶은 플랫폼으로 이동하고 있다는 점이 부담이다.

참고자료: 안될공학 YouTube 영상, NVIDIA Vera CPU 공식 페이지, NVIDIA Vera Rubin 플랫폼 자료, NVIDIA Blog의 Phoronix 벤치마크 해설, NVIDIA Newsroom 발표 자료.


📌 함께 보면 좋은 글

반응형