Oracle Cloud Infrastructure เป็นรายแรกที่รัน NVIDIA AI Supercomputing Instances; Microsoft Azure และ Google Cloud ส่วนผู้ให้บริการคลาวด์อื่น ๆ จะติดตั้ง DGX Cloud เร็ว ๆ นี้
NVIDIA ประกาศในวันนี้ NVIDIA DGX Cloud™ ซึ่งเป็นบริการซูเปอร์คอมพิวเตอร์ด้าน AI ที่ช่วยให้องค์กรต่าง ๆ เข้าถึงโครงสร้างพื้นฐานและซอฟต์แวร์ที่จำเป็นในการฝึกอบรมโมเดลขั้นสูงสำหรับ Generation AI และแอปพลิเคชันที่ก้าวล้ำอื่น ๆ ได้ทันที
DGX Cloud มอบคลัสเตอร์เฉพาะของ NVIDIA DGX™ AI Supercomputing ที่จับคู่กับ NVIDIA AI ซอฟต์แวร์ บริการนี้ทำให้ทุกองค์กรสามารถเข้าถึงซูเปอร์คอมพิวเตอร์ AI ของตนเองได้โดยใช้เว็บเบราว์เซอร์ธรรมดา ซึ่งช่วยขจัดความซับซ้อนในการจัดหา ปรับใช้ และจัดการโครงสร้างพื้นฐานภายในองค์กร
องค์กรต่าง ๆ สามารถเช่าคลัสเตอร์ DGX Cloud เป็นรายเดือน ซึ่งช่วยให้มั่นใจได้ว่าจะสามารถปรับขนาดการพัฒนาเวิร์กโหลดการฝึกอบรมหลายโหนดขนาดใหญ่ได้อย่างรวดเร็วและง่ายดาย โดยไม่ต้องรอทรัพยากรการประมวลผลแบบเร่งความเร็วที่มักมีความต้องการสูง

“เราอยู่ในยุค iPhone ของ AI สตาร์ทอัปทั้งหลายกำลังแข่งกันสร้างผลิตภัณฑ์และโมเดลธุรกิจที่พลิกโฉมหน้าธุรกิจ และผู้ครอบครองตลาดก็มองหาการตอบสนอง” Jensen Huang ผู้ก่อตั้งและ CEO ของ NVIDIA กล่าว “DGX Cloud ช่วยให้ลูกค้าเข้าถึงซุปเปอร์คอมพิวเตอร์ NVIDIA AI ในระบบคลาวด์ระดับโลกได้ทันที”
NVIDIA กำลังร่วมมือกับผู้ให้บริการคลาวด์ชั้นนำเพื่อติดตั้งโครงสร้างพื้นฐาน DGX Cloud โดยเริ่มจาก Oracle Cloud Infrastructure (OCI) OCI RDMA Supercluster นำเสนอเครือข่าย RDMA ที่สร้างขึ้นตามวัตถุประสงค์ การประมวลผลแบบ Bare Metal และพื้นที่เก็บข้อมูลแบบโลคัลและบล็อกประสิทธิภาพสูงที่สามารถปรับขนาดเป็นซูเปอร์คลัสเตอร์ที่มี GPU มากกว่า 32,000 ตัว
Microsoft Azure คาดว่าจะเริ่มติดตั้ง DGX Cloud ในไตรมาสหน้า และบริการจะขยายไปยัง Google Cloud และอื่น ๆ ในเร็ว ๆ นี้
ยักษ์ใหญ่ในอุตสาหกรรมใช้ NVIDIA DGX Cloud เพื่อเร่งความเร็วของความสำเร็จ
Amgen หนึ่งในบริษัทเทคโนโลยีชีวภาพชั้นนำของโลก ผู้นำด้านเทคโนโลยีการประกันภัย CCC Intelligent Solutions (CCC) และผู้ให้บริการแพลตฟอร์มธุรกิจดิจิทัล ServiceNow เป็นหนึ่งในผู้บุกเบิก AI รายแรกที่ใช้ DGX Cloud
Amgenกำลังใช้ DGX Cloud กับ Nvidia BioNeMo™ ซอฟต์แวร์โมเดลภาษาขนาดใหญ่เพื่อเร่งการค้นพบยา รวมถึงซอฟต์แวร์ NVIDIA AI Enterprise พร้อมด้วย NVIDIA RAPIDS ไลบรารีการเร่งความเร็ววิทยาศาสตร์ข้อมูล
“ด้วย NVIDIA DGX Cloud และ NVIDIA BioNeMo นักวิจัยของเราสามารถมุ่งเน้นไปที่ชีววิทยาเชิงลึกแทนที่จะต้องจัดการกับโครงสร้างพื้นฐาน AI และตั้งค่าวิศวกรรม ML” Peter Grandsard กรรมการบริหารของ Research, Biologics Therapeutic Discovery, Center for Research Acceleration กล่าว โดยนวัตกรรมดิจิทัลที่ Amgen “ความสามารถในการประมวลผลและมัลติโหนดอันทรงพลังของ DGX Cloud ช่วยให้เราสามารถฝึกฝน LLM โปรตีนได้เร็วขึ้น 3 เท่าด้วย BioNeMo และวิเคราะห์หลังการฝึกเร็วขึ้นสูงสุด 100 เท่าด้วย NVIDIA RAPIDS เมื่อเทียบกับแพลตฟอร์มทางเลือก”
CCC ซึ่งเป็นแพลตฟอร์มคลาวด์ชั้นนำสำหรับธุรกิจประกันทรัพย์สินและวินาศภัย กำลังใช้ DGX Cloud เพื่อเพิ่มความเร็วและปรับขนาดการพัฒนาและการฝึกอบรมโมเดล AI โมเดลเหล่านี้ช่วยขับเคลื่อนโซลูชันการแก้ไขปัญหาการเคลมรถยนต์ที่เป็นนวัตกรรมใหม่ของบริษัท ช่วยเร่งระบบอัตโนมัติอัจฉริยะของอุตสาหกรรม และปรับปรุงประสบการณ์การเคลมสำหรับผู้ใช้ทางธุรกิจนับล้านรายและผู้บริโภคทุกวัน
ServiceNow กำลังใช้ DGX Cloud กับซูเปอร์คอมพิวเตอร์ NVIDIA DGX ภายในองค์กรสำหรับซูเปอร์คอมพิวติ้ง AI บนคลาวด์แบบไฮบริดที่ยืดหยุ่นและปรับขนาดได้ ซึ่งช่วยขับเคลื่อนการวิจัย AI บนโมเดลภาษาขนาดใหญ่ การสร้างโค้ด และการวิเคราะห์ทั่วไป นอกจากนี้ ServiceNow ยังร่วมดูแลโครงการ BigCode ซึ่งเป็นโครงการริเริ่ม Generative AI ด้านวิทยาศาสตร์แบบเปิดที่รับผิดชอบ ซึ่งได้รับการฝึกฝนบนเฟรมเวิร์ก Megatron-LM จาก NVIDIA
เปิดเบราว์เซอร์เพื่อเข้าถึง NVIDIA AI Supercomputing และซอฟต์แวร์
องค์กรจัดการและตรวจสอบภาระงานการฝึกอบรม DGX Cloud โดยใช้แพลตฟอร์มซอฟต์แวร์ NVIDIA Base Command™ ซึ่งมอบประสบการณ์ผู้ใช้ที่ราบรื่นบน DGX Cloud รวมถึง NVIDIA DGX ซูเปอร์คอมพิวเตอร์ การใช้แพลตฟอร์ม Base Command ลูกค้าสามารถจับคู่ปริมาณงานของตนกับปริมาณและประเภทของโครงสร้างพื้นฐาน DGX ที่เหมาะสมซึ่งจำเป็นสำหรับแต่ละงาน
DGX Cloud ประกอบด้วย NVIDIA AI Enterprise ซึ่งเป็นเลเยอร์ซอฟต์แวร์ของแพลตฟอร์ม NVIDIA AI ซึ่งให้เฟรมเวิร์ก AI แบบ end-to-end และโมเดลที่ได้รับการฝึกอบรมล่วงหน้าเพื่อเร่งความเร็วกระบวนการวิทยาศาสตร์ข้อมูลและปรับปรุงการพัฒนาและปรับใช้ AI การผลิตโมเดลที่ได้รับการฝึกอบรมใหม่ เฟรมเวิร์กที่ได้รับการปรับปรุง และไลบรารีซอฟต์แวร์วิทยาศาสตร์ข้อมูลแบบเร่งความเร็ว พร้อมใช้งานแล้วใน NVIDIA AI Enterprise 3.1 เปิดตัวแล้ววันนี้ให้นักพัฒนาเพิ่มการเริ่มต้นโครงการ AI ของพวกเขาได้ทันที
แต่ละอินสแตนซ์ของ DGX Cloud มี NVIDIA H100 จำนวน 8 ตัว หรือ A100 80GB Tensor Core GPU สำหรับหน่วยความจำ GPU ทั้งหมดจะมี 640GB ต่อโหนด แฟบริคประสิทธิภาพสูงและความหน่วงต่ำที่สร้างขึ้นด้วย NVIDIA Networking ทำให้มั่นใจได้ว่าปริมาณงานสามารถปรับขยายตามคลัสเตอร์ของระบบที่เชื่อมต่อกัน ทำให้อินสแตนซ์หลายตัวทำหน้าที่เป็น GPU ขนาดใหญ่เพียงตัวเดียวเพื่อตอบสนองความต้องการด้านประสิทธิภาพของการฝึกอบรม AI ขั้นสูง พื้นที่จัดเก็บข้อมูลประสิทธิภาพสูงรวมอยู่ใน DGX Cloud เพื่อมอบโซลูชันที่สมบูรณ์สำหรับการประมวลผลแบบ AI ซูเปอร์คอมพิวติ้ง
คุณสมบัติ DGX Cloud ได้รับการสนับสนุนจากผู้เชี่ยวชาญของ NVIDIA ตลอดขั้นตอนการพัฒนา AI ลูกค้าสามารถทำงานร่วมกับวิศวกรของ NVIDIA ได้โดยตรงเพื่อเพิ่มประสิทธิภาพโมเดลของพวกเขาและแก้ไขปัญหาความท้าทายในการพัฒนาอย่างรวดเร็วในกรณีการใช้งานที่หลากหลายของอุตสาหกรรม
ความพร้อมใช้งาน
อินสแตนซ์ DGX Cloud เริ่มต้นที่ $36,999 ต่ออินสแตนซ์ต่อเดือน องค์กรต่าง ๆ สามารถติดต่อพาร์ทเนอร์ NPN เพื่อขอรายละเอียดเพิ่มเติมได้
ดูการกล่าวประเด็นสำคัญของ Huang ในการพูดคุยเกี่ยวกับ NVIDIA DGX Cloud ในคำปราศรัยในงาน GTC ของเขาตามต้องการ และติดตามสามารถติดตาม GTC พร้อมผู้บุกเบิก NVIDIA DGX Cloud ได้ที่นี่