NVIDIA Rubin CPX: GPU 128GB GDDR7 dành cho AI, ra mắt cuối 2026
Sau tin đồn RTX 5090 “128GB” gây xôn xao, NVIDIA đã chính thức xác nhận một GPU 128GB thực sự – nhưng không dành cho gaming. Đó chính là Rubin CPX, GPU thế hệ mới được thiết kế cho AI dài hạn, inference ngữ cảnh lớn và các workload agent.

Thông số chính của Rubin CPX
Kiến trúc: Rubin, monolithic die
Hiệu năng: lên đến 30 PFLOPS NVFP4
Bộ nhớ: 128GB GDDR7
Media: 4× NVENC + 4× NVDEC (tối ưu cho video workflows)
Ứng dụng: AI ngữ cảnh dài, phát triển phần mềm, xử lý video dài, nghiên cứu
NVIDIA cho biết Rubin CPX mang lại hiệu suất attention nhanh hơn gấp 3 lần so với GB300 NVL72, giúp xử lý các mô hình AI khổng lồ hiệu quả hơn.

Rubin CPX trong hệ thống Vera Rubin NVL144 CPX
Rubin CPX không hoạt động đơn lẻ, mà được tích hợp trong Vera Rubin NVL144 CPX rack, cấu hình bao gồm:
144 Rubin CPX GPUs + 144 Rubin GPUs + 36 Vera CPUs
Hiệu năng: 8 exaFLOPS NVFP4
Bộ nhớ nhanh: 100TB, băng thông 1.7 PB/s
Kết nối: Quantum-X800 InfiniBand hoặc Spectrum-X Ethernet + ConnectX-9 SuperNICs

Lộ trình tiếp theo của NVIDIA
Rubin Ultra (2027): tăng mật độ gói lên 4 GPU/module, dùng HBM4E.
Feynman (2028): nâng cấp NVLink 8, Spectrum-7 và ConnectX-10.
Thời điểm ra mắt
NVIDIA xác nhận Rubin CPX sẽ được tung ra vào cuối năm 2026, như một phần của nền tảng Vera Rubin NVL144 CPX.