NVIDIA เปิดตัว Rubin CPX: GPU สถาปัตยกรรมใหม่ สำหรับงาน AI Inference กับ Context ขนาดใหญ่ระดับล้าน Token และงานวิดีโอ
ที่งาน AI Infra Summit, NVIDIA ได้สร้างแรงสั่นสะเทือนให้กับวงการอีกครั้ง ด้วยการเปิดตัว NVIDIA Rubin CPX ซึ่งเป็น GPU กลุ่มใหม่ที่ออกแบบมาโดยเฉพาะสำหรับงานประมวลผลบริบทขนาดใหญ่ (massive-context processing) เพื่อตอบโจทย์แอปพลิเคชัน AI ยุคถัดไปที่ต้องการความสามารถในการจัดการข้อมูลมหาศาล เช่น การเขียนโค้ดซอฟต์แวร์ระดับล้าน Token และการสร้างวิดีโอด้วย AI (generative video) ให้มีความเร็วและประสิทธิภาพที่ไม่เคยมีมาก่อน
Jensen Huang ผู้ก่อตั้งและซีอีโอของ NVIDIA กล่าวว่า “เช่นเดียวกับที่ RTX ปฏิวัติวงการกราฟิกและ Physical AI, Rubin CPX คือ CUDA GPU ตัวแรกที่สร้างขึ้นมาเพื่อ Massive-Context AI โดยเฉพาะ ซึ่งโมเดลจะสามารถให้เหตุผลจากองค์ความรู้ระดับล้าน Token ได้ในคราวเดียว”
เจาะลึกแพลตฟอร์ม Vera Rubin และขุมพลังใหม่
Rubin CPX เป็นส่วนหนึ่งของแพลตฟอร์ม NVIDIA Vera Rubin NVL144 CPX ที่ทำงานร่วมกับ NVIDIA Vera CPUs และ Rubin GPUs โดยแพลตฟอร์มแบบรวมศูนย์นี้มาพร้อมกับประสิทธิภาพที่น่าทึ่งใน rack เดียว
- ประสิทธิภาพ AI สูงสุด 8 Exaflops ซึ่งแรงกว่าแพลตฟอร์ม NVIDIA GB300 NVL72 ถึง 7.5 เท่า
- หน่วยความจำความเร็วสูงขนาด 100TB
- แบนด์วิดท์หน่วยความจำ 1.7 Petabytes ต่อวินาที
หัวใจสำคัญของ Rubin CPX GPU คือการออกแบบด้วยสถาปัตยกรรม NVIDIA Rubin บน Die แบบ Monolithic ที่คุ้มค่า มาพร้อมหน่วยประมวลผล NVFP4 ที่ให้ประสิทธิภาพสูงสุด 30 Petaflops และหน่วยความจำ GDDR7 ขนาด 128GB นอกจากนี้ยังมีความสามารถด้าน Attention ที่เร็วกว่า NVIDIA GB300 NVL72 ถึง 3 เท่า ทำให้โมเดล AI สามารถประมวลผลลำดับบริบทที่ยาวขึ้นได้โดยความเร็วไม่ลดลง
NVIDIA ยังระบุถึงโอกาสในการสร้างรายได้ที่น่าทึ่ง โดยแพลตฟอร์ม Vera Rubin NVL144 CPX สามารถสร้างรายได้จาก Token ได้ถึง 5 พันล้านดอลลาร์ ต่อการลงทุนทุก ๆ 100 ล้านดอลลาร์
เสียงตอบรับจากผู้นำในวงการ AI
บริษัทนวัตกรรม AI ชั้นนำต่างกำลังสำรวจศักยภาพของ Rubin CPX เพื่อเร่งความเร็วให้กับแอปพลิเคชันของตนเอง
- Cursor บริษัทผู้พัฒนา Code Editor ที่ขับเคลื่อนด้วย AI มองว่า Rubin CPX จะช่วยเพิ่มประสิทธิภาพของนักพัฒนาได้อย่างมหาศาลผ่านการสร้างโค้ดที่รวดเร็วปานสายฟ้า
- Runway บริษัทด้าน Generative AI จะใช้เทคโนโลยีของ NVIDIA เพื่อให้ครีเอเตอร์สามารถสร้างสรรค์ผลงานระดับภาพยนตร์ได้อย่างมีประสิทธิภาพ โดย Cristóbal Valenzuela ซีอีโอของ Runway กล่าวว่า “เรามองว่า Rubin CPX คือการก้าวกระโดดครั้งสำคัญด้านประสิทธิภาพ ที่จะสนับสนุน Workload ที่ต้องการความสามารถสูงเหล่านี้”
- Magic บริษัทวิจัยและพัฒนา AI Agent สำหรับงานวิศวกรรมซอฟต์แวร์ ชี้ว่าด้วย Context Window ที่กว้างถึง 100 ล้าน Token จะทำให้โมเดลของพวกเขาสามารถเข้าใจ Codebase ทั้งหมดได้โดยไม่ต้อง Fine-tuning เพิ่มเติม ซึ่ง Rubin CPX จะช่วยเร่ง Workload ด้านการประมวลผลได้อย่างมหาศาล
การสนับสนุนด้านซอฟต์แวร์และกำหนดการวางจำหน่าย
NVIDIA Rubin CPX จะได้รับการสนับสนุนอย่างเต็มรูปแบบจาก NVIDIA AI Stack ตั้งแต่แพลตฟอร์ม NVIDIA Dynamo ที่ช่วยเพิ่มประสิทธิภาพการทำ Inference ไปจนถึงโมเดลตระกูล NVIDIA Nemotron™ และแพลตฟอร์มซอฟต์แวร์สำหรับองค์กรอย่าง NVIDIA AI Enterprise ทั้งหมดนี้ยังคงอยู่บนรากฐานที่แข็งแกร่งของระบบนิเวศ NVIDIA CUDA ที่มีนักพัฒนากว่า 6 ล้านคน และ NVIDIA Rubin CPX คาดว่าจะพร้อมใช้งานในช่วงปลายปี 2026
ข้อมูล: NVIDIA
