NVIDIA Vera Rubin Superchip – Bước nhảy vọt trong kiến trúc AI thế hệ mới
Tại GTC Washington 2025, CEO Jensen Huang đã chính thức giới thiệu Vera Rubin Superchip – nền tảng AI hoàn toàn mới kết hợp CPU Vera và GPU Rubin trên cùng một bảng mạch, đánh dấu bước tiến lớn trong chiến lược điện toán AI của NVIDIA.
Đây là lần đầu tiên NVIDIA công bố hệ thống “Superchip” kế nhiệm dòng Grace Hopper (GH200), hướng đến mục tiêu hiệu năng Exascale cho trung tâm dữ liệu AI và mô hình ngôn ngữ thế hệ tiếp theo.

Vera Rubin Superchip – Kiến trúc hợp nhất CPU + GPU hoàn toàn mới
Nguyên mẫu trình diễn tại sự kiện có kích thước tương đương một bo mạch chủ khổng lồ, tích hợp:
1 CPU Vera với 88 nhân Arm và 176 luồng xử lý
2 GPU Rubin với thiết kế hai chip (reticle-sized die) mỗi GPU
Bộ nhớ LPDDR cho CPU và HBM4 dung lượng cao gắn trực tiếp lên GPU
Theo NVIDIA, mỗi GPU Rubin cung cấp tới:
50 PFLOPS hiệu năng FP4
288 GB bộ nhớ HBM4
Băng thông liên kết NVLINK-C2C đạt 1.8 TB/s giữa CPU và GPU
Hiệu năng vượt trội – 3.6 Exaflops FP4 trong cấu hình NVL144
Cấu hình hoàn chỉnh NVL144 với Vera Rubin Superchip đạt:
3.6 Exaflops FP4 cho suy luận AI (inference)
1.2 Exaflops FP8 cho huấn luyện (training)
Băng thông bộ nhớ HBM4 tổng cộng 13 TB/s
Dung lượng RAM tốc độ cao tới 75 TB
Băng thông NVLINK và CX9 tăng gấp đôi – lần lượt 260 TB/s và 28.8 TB/s
Con số này cao gấp 3.3 lần hiệu năng so với hệ thống GB300 NVL72 hiện tại, chứng minh NVIDIA tiếp tục giữ vững vị thế dẫn đầu trong điện toán tăng tốc AI.

Rubin Ultra NVL576 – Siêu hệ thống 15 Exaflops ra mắt 2027
Ngoài phiên bản NVL144, NVIDIA còn hé lộ Rubin Ultra NVL576, dự kiến phát hành nửa cuối năm 2027.
Hệ thống này mở rộng lên 4 GPU Rubin (mỗi GPU có 1 TB bộ nhớ HBM4e) với:
15 Exaflops FP4
5 Exaflops FP8
365 TB bộ nhớ nhanh tổng cộng
Băng thông mạng NVLINK lên tới 1.5 PB/s
Đây sẽ là hệ thống AI mạnh nhất thế giới, hướng đến các trung tâm dữ liệu huấn luyện mô hình đa phương thức quy mô hàng trăm nghìn tỷ tham số.
Tương lai – Feynmann Architecture và thế hệ kế tiếp
NVIDIA xác nhận Vera Rubin sẽ là nền tảng chủ đạo cho giai đoạn 2026–2027, trước khi nhường chỗ cho kiến trúc Feynmann, dự kiến ra mắt trong giai đoạn 2027–2028.
Hiện chưa có thông tin chính thức về chip Feynmann, nhưng giới phân tích dự đoán đây sẽ là kiến trúc hợp nhất CPU–GPU–NPU đầu tiên của NVIDIA.
Kết luận
Với Vera Rubin Superchip, NVIDIA đang mở ra kỷ nguyên mới của điện toán AI, nơi CPU và GPU hoạt động đồng bộ trên cùng một nền tảng, mang lại hiệu năng Exascale thực sự.
Việc đưa hệ thống này vào sản xuất hàng loạt năm 2026 sẽ đánh dấu bước ngoặt chiến lược cho các trung tâm dữ liệu, siêu máy tính, và mô hình AI quy mô khổng lồ – từ ChatGPT thế hệ mới đến các hệ thống tự động hóa công nghiệp.