NVIDIA เปิดตัว DGX GH200 AI Supercomputer ในงาน COMPUTEX 2023

NVIDIA ประกาศเปิดตัว AI ซูเปอร์คอมพิวเตอร์ หน่วยความจําขนาดใหญ่ ระดับใหม่ — ซูเปอร์คอมพิวเตอร์ NVIDIA DGX™ ที่ขับเคลื่อนโดย NVIDIA GH200 Grace Hopper Superchips และ NVIDIA® NVLink® Switch System — สร้างขึ้นเพื่อเปิดใช้งานการพัฒนาโมเดลขนาดยักษ์, โมเดลภาษารุ่นต่อไปสำหรับ Generative AI, ระบบให้การแนะนํา และปริมาณงานการวิเคราะห์ข้อมูล

พื้นที่หน่วยความจำที่ใช้ร่วมกันขนาดใหญ่ของ NVIDIA DGX GH200 ใช้เทคโนโลยีการเชื่อมต่อระหว่าง NVLink กับ NVLink Switch System เพื่อรวม GH200 Superchips จำนวน 200 ตัวเข้าด้วยกัน ทำให้สามารถทำงานเป็น GPU เดียวได้ สิ่งนี้มอบประสิทธิภาพระดับ 1 exaflop และมีแบนด์วิดธ์ของหน่วยความจำที่ 144 เทราไบต์ ที่ใช้ร่วมกัน — หน่วยความจำมากกว่าเกือบ 500 เท่าของ NVIDIA DGX A100 รุ่นก่อนหน้าที่เปิดตัวในปี 2020

Jensen Huang ผู้ก่อตั้งและ CEO ของ NVIDIA กล่าวว่า “Generative AI, โมเดลภาษาขนาดใหญ่ และระบบผู้แนะนำคือเครื่องมือดิจิทัลของเศรษฐกิจยุคใหม่ AI ซูเปอร์คอมพิวเตอร์ DGX GH200 ผสานรวมเทคโนโลยีคอมพิวเตอร์และเครือข่ายเร่งความเร็วขั้นสูงสุดของ NVIDIA เพื่อขยายขอบเขตของ AI”

เทคโนโลยี NVIDIA NVLink ขยาย AI ในวงกว้าง

ซูเปอร์ชิป GH200 ช่วยลดความจําเป็นในการเชื่อมต่อ PCIe CPU-to-GPU แบบดั้งเดิมโดยการรวม CPU NVIDIA Grace™ ที่ใช้ Arm เข้ากับ NVIDIA H100 Tensor Core GPU ในแพ็คเกจเดียวกันโดยใช้การเชื่อมต่อระหว่างชิปด้วย NVIDIA NVLink-C2C สิ่งนี้จะเพิ่มแบนด์วิดธ์ระหว่าง GPU และ CPU ได้ถึง 7 เท่า เมื่อเทียบกับเทคโนโลยี PCIe ล่าสุด ลดการใช้พลังงานในการเชื่อมต่อมากกว่า 5 เท่า และให้บล็อกการสร้าง GPU สถาปัตยกรรม Hopper ขนาด 600GB สําหรับซูเปอร์คอมพิวเตอร์ DGX GH200

DGX GH200 เป็นซูเปอร์คอมพิวเตอร์เครื่องแรกที่จับคู่ Grace Hopper Superchips กับ NVIDIA NVLink Switch System ซึ่งเป็นการเชื่อมต่อโครงข่ายใหม่ที่ช่วยให้ GPU ทั้งหมดในระบบ DGX GH200 ทํางานร่วมกันเป็นหนึ่งเดียว ระบบรุ่นก่อนหน้ามีให้สําหรับ GPU แปดตัวเท่านั้น ที่จะรวมกับ NVLink เป็น GPU เดียวโดยไม่ลดทอนประสิทธิภาพ

สถาปัตยกรรม DGX GH200 ให้แบนด์วิดธ์ NVLink มากกว่ารุ่นก่อนหน้าถึง 48 เท่า มอบพลังของซูเปอร์คอมพิวเตอร์ AI ขนาดใหญ่ด้วยความเรียบง่ายในการเขียนโปรแกรม GPU ตัวเดียว

เครื่องมือวิจัยใหม่สําหรับผู้บุกเบิก AI

Google Cloud, Meta และ Microsoft เป็นหนึ่งในกลุ่มแรก ๆ ที่คาดว่าจะสามารถเข้าถึง DGX GH200 เพื่อสํารวจความสามารถสําหรับปริมาณงาน AI เชิงสร้างสรรค์ NVIDIA ยังตั้งใจที่จะให้การออกแบบ DGX GH200 เป็นต้นแบบให้กับผู้ให้บริการคลาวด์และไฮเปอร์สเกลอื่น ๆ เพื่อให้พวกเขาสามารถปรับแต่งเพิ่มเติมสําหรับโครงสร้างพื้นฐานของตนได้

“การสร้างโมเดล Generative ขั้นสูงต้องใช้แนวทางที่เป็นนวัตกรรมสําหรับโครงสร้างพื้นฐาน AI” Mark Lohmeyer รองประธานฝ่ายประมวลผลของ Google Cloud กล่าว “สเกล NVLink ใหม่และหน่วยความจําที่ใช้ร่วมกันของ Grace Hopper Superchips ช่วยแก้ปัญหาคอขวดที่สําคัญใน AI ขนาดใหญ่ และเราหวังว่าจะได้สํารวจความสามารถของ Google Cloud และโครงการริเริ่มด้าน Generative AI ของเรา”

“เมื่อโมเดล AI มีขนาดใหญ่ขึ้น พวกเขาต้องการโครงสร้างพื้นฐานที่มีประสิทธิภาพซึ่งสามารถปรับขนาดเพื่อตอบสนองความต้องการที่เพิ่มขึ้น” Alexis Björlin รองประธานฝ่ายโครงสร้างพื้นฐาน ระบบ AI และแพลตฟอร์มเร่งความเร็วที่ Meta กล่าว “การออกแบบ Grace Hopper ของ NVIDIA จะช่วยให้นักวิจัยสามารถสํารวจแนวทางใหม่ ๆ เพื่อแก้ปัญหาความท้าทายที่ยิ่งใหญ่ที่สุดของพวกเขา”

“การฝึกอบรมโมเดล AI ขนาดใหญ่เป็นงานที่ต้องใช้ทรัพยากรและเวลามาก” Girish Bablani รองประธานองค์กรของ Azure Infrastructure ที่ Microsoft กล่าว “ศักยภาพของ DGX GH200 ในการทํางานกับชุดข้อมูลขนาดเทราไบต์จะช่วยให้นักพัฒนาสามารถทําการวิจัยขั้นสูงในระดับที่ใหญ่ขึ้นและเร่งความเร็วได้”

NVIDIA Helios Supercomputer เพื่อความก้าวหน้าในการวิจัยและพัฒนา

NVIDIA กําลังสร้าง AI ซูเปอร์คอมพิวเตอร์ ที่ใช้ DGX GH200 ของตัวเองเพื่อขับเคลื่อนการทํางานของนักวิจัยและทีมพัฒนา

NVIDIA Helios ซูเปอร์คอมพิวเตอร์จะมีระบบ DGX GH200 สี่ชุด แต่ละเครือข่ายจะเชื่อมต่อกับเครือข่าย NVIDIA Quantum-2 InfiniBand เพื่อเพิ่มปริมาณการประมวลผลข้อมูลสําหรับการฝึกอบรมโมเดล AI ขนาดใหญ่ Helios จะรวม Grace Hopper Superchips 1,024 ตัวและคาดว่าจะออนไลน์ได้ภายในสิ้นปีนี้

ครบวงจรและสร้างขึ้นตามวัตถุประสงค์สําหรับโมเดลขนาดยักษ์

ซูเปอร์คอมพิวเตอร์ DGX GH200 ประกอบด้วยซอฟต์แวร์ NVIDIA เพื่อมอบโซลูชันแบบฟูลสแตกแบบครบวงจรสําหรับปริมาณงาน AI และการวิเคราะห์ข้อมูลที่ใหญ่ที่สุด ซอฟต์แวร์ NVIDIA Base Command™ ให้การจัดการเวิร์กโฟลว์ AI การจัดการคลัสเตอร์ระดับองค์กรไลบรารีที่เร่งการประมวลผลการจัดเก็บข้อมูลและโครงสร้างพื้นฐานเครือข่ายและซอฟต์แวร์ระบบที่ปรับให้เหมาะสมสําหรับการเรียกใช้ปริมาณงาน AI

นอกจากนี้ยังมี NVIDIA AI Enterprise ซึ่งเป็นเลเยอร์ซอฟต์แวร์ของแพลตฟอร์ม NVIDIA AI มีเฟรมเวิร์กมากกว่า 100 เฟรมเวิร์กโมเดลที่ผ่านการฝึกอบรมและเครื่องมือการพัฒนาเพื่อปรับปรุงการพัฒนาและการปรับใช้ AI การผลิตรวมถึง Generative AI, คอมพิวเตอร์วิทัศน์, Speech AI และอื่น ๆ

ความพร้อมในการใช้งาน

ซูเปอร์คอมพิวเตอร์ NVIDIA DGX GH200 คาดว่าจะพร้อมใช้งานภายในสิ้นปีนี้

รับชม Huang พูดคุยเกี่ยวกับซูเปอร์คอมพิวเตอร์ NVIDIA DGX GH200 ระหว่างการปราศรัยที่ COMPUTEX