AMD-ROCm-7
| |

AMD เปิดตัว ROCm 7.0: ก้าวสำคัญสำหรับนักพัฒนา AI ด้วยนวัตกรรมโอเพนซอร์ส

AMD ได้ประกาศเปิดตัว AMD ROCm™ 7.0 ซึ่งเป็นการอัปเดตซอฟต์แวร์ครั้งสำคัญที่ออกแบบมาเพื่อตอบสนองความต้องการที่เพิ่มขึ้นอย่างรวดเร็วของนวัตกรรม AI การเปิดตัวครั้งนี้ถือเป็นก้าวสำคัญสำหรับนักพัฒนาและองค์กรที่ต้องการปรับขนาด ปรับใช้ และจัดการโมเดล AI ด้วยความมั่นใจและประสิทธิภาพที่เหนือกว่า

ความท้าทายในยุค AI และบทบาทของ ROCm 7.0

นวัตกรรม AI กำลังเติบโตอย่างรวดเร็ว โดยมีโมเดลที่ขยายขนาดเป็นแสนล้านพารามิเตอร์ และความต้องการในการอนุมาน (inference) ที่เพิ่มขึ้นอย่างต่อเนื่อง สิ่งนี้สร้างแรงกดดันให้กับนักพัฒนาในการตามให้ทันพร้อมทั้งต้องมั่นใจในความยืดหยุ่น การพกพา และความพร้อมสำหรับอนาคต ROCm 7.0 ถูกสร้างขึ้นโดยมุ่งเน้นที่การใช้งาน ประสิทธิภาพ และการรองรับอัลกอริทึมล่าสุด เพื่อช่วยให้นักพัฒนาและองค์กรสามารถทำงานได้เร็วขึ้น ปรับขนาดได้ชาญฉลาดขึ้น และปรับใช้ AI ได้อย่างมั่นใจ

จุดเด่นสำคัญของ ROCm 7.0 ที่ AMD มอบให้ ได้แก่:

  • ประสิทธิภาพการฝึกอบรมและการอนุมานที่ก้าวล้ำ ด้วย GPU ตระกูล AMD Instinct™ MI350
  • การอนุมานแบบกระจาย (distributed inference) ที่ราบรื่น ทั่วทั้งคลัสเตอร์ด้วยการรองรับเฟรมเวิร์กชั้นนำ
  • การพกพาโค้ดที่ได้รับการปรับปรุง ด้วย HIP 7.0 ช่วยให้การพัฒนาและการโยกย้ายข้ามระบบฮาร์ดแวร์เป็นไปอย่างคล่องตัว
  • เครื่องมือใหม่สำหรับองค์กร เพื่อทำให้การจัดการและการปรับใช้โครงสร้างพื้นฐาน AI เป็นเรื่องง่าย
  • รองรับโมเดลขนาดใหญ่ยอดนิยม เช่น MXFP4 และ FP8 ที่ถูกควอนไทซ์ด้วย AMD Quark

พลังของ GPU ตระกูล AMD Instinct MI350 และ ROCm 7.0

หัวใจหลักของ ROCm 7.0 คือการรองรับ GPU ตระกูล AMD Instinct™ MI350 Series อย่างเต็มรูปแบบ ซึ่งขับเคลื่อนด้วยสถาปัตยกรรม AMD CDNA™ 4 ด้วยหน่วยความจำแบนด์วิดท์สูงและเอนจิ้นการประมวลผลที่ได้รับการปรับปรุง ROCm 7.0 มอบความก้าวหน้าอย่างมากสำหรับนักพัฒนา AI เพื่อให้สามารถเข้าถึงประสิทธิภาพเหล่านี้ได้ทันที AMD ยังได้จัดเตรียม Docker images ของ ROCm 7.0 vLLM และ SGLang ที่สร้างไว้ล่วงหน้า สำหรับ GPU Instinct MI355, MI350, MI325 และ MI300 ซึ่งได้รับการปรับให้เหมาะกับประสิทธิภาพ MXFP4* และ FP8 นอกจากนี้ ยังมีโมเดลขนาดใหญ่ MXFP4, FP8 ที่พร้อมใช้งานในเวอร์ชันการผลิต ซึ่งรวมถึง DeepSeek R1, Llama 3.3 70B, Llama 3.1-405B และอื่นๆ อีกมากมาย ที่ได้รับการปรับให้เหมาะสมสำหรับการปรับใช้บนเฟรมเวิร์ก vLLM และ SGLang โมเดลเหล่านี้ถูกควอนไทซ์โดย AMD Quark ซึ่งเป็นชุดเครื่องมือโอเพนซอร์สของ AMD สำหรับการปรับแต่งโมเดล การปรับปรุงเหล่านี้ส่งผลโดยตรงต่อเวลาในการได้ผลลัพธ์ที่เร็วขึ้น ต้นทุนโครงสร้างพื้นฐานที่ต่ำลง และความสามารถในการทดลอง ปรับแต่ง และปรับใช้โมเดลล้ำสมัยได้อย่างมีประสิทธิภาพยิ่งขึ้น

MI300X-peak-performance

การอนุมานแบบกระจาย: ขยายขีดจำกัดนอกเหนือจากโหนดเดี่ยว

AI ในปัจจุบันไม่ได้เป็นเพียงแค่ประสิทธิภาพของโหนดเดียวเท่านั้น แต่ยังเกี่ยวกับการปรับขนาดข้ามคลัสเตอร์และการให้บริการโมเดลด้วยปริมาณงานมหาศาล ROCm 7.0 ทำให้การอนุมานแบบกระจายเป็นไปอย่างราบรื่นด้วยการผสานรวมโอเพนซอร์ส ทำให้นักพัฒนาและองค์กรสามารถรันโมเดล AI ล้ำสมัยในขนาดใหญ่ข้าม GPU หลายตัวโดยใช้เฟรมเวิร์กยอดนิยม ด้วยอัลกอริทึม attention และ reasoning ที่ขยายตัว การรองรับ Mixtures of Experts (MoE) และรูปแบบความแม่นยำต่ำ เช่น FP4, FP6 และ FP8 ทำให้ ROCm 7.0 มั่นใจได้ว่าองค์กรและนักพัฒนาสามารถรันปริมาณงานการอนุมานขนาดใหญ่ได้อย่างมีประสิทธิภาพมากกว่าที่เคย เฟรมเวิร์กอย่าง SGLang ใช้ประโยชน์จากความสามารถแบบกระจายของ AMD ROCm ได้อย่างเต็มที่ โดยปลดล็อกความเร็วที่เพิ่มขึ้นอย่างมากด้วยการใช้ Prefill–Decode disaggregation ซึ่งให้ปริมาณงานที่สูงขึ้นและเวลาแฝงที่ต่ำลงเมื่อเทียบกับการอนุมานแบบโหนดเดียว

AI สำหรับองค์กร: เปิดกว้างและปรับขนาดได้

ด้วย ROCm 7.0, AMD ได้เปิดตัวเครื่องมือใหม่เพื่อช่วยลูกค้าองค์กรในการจัดการความต้องการที่เพิ่มขึ้นสำหรับโครงสร้างพื้นฐาน AI การเปิดตัวครั้งนี้มอบสององค์ประกอบหลัก:

  • AMD Resource Manager – ช่วยลดความซับซ้อนของการจัดระเบียบขนาดคลัสเตอร์และเพิ่มประสิทธิภาพของปริมาณงาน AI ทั่วทั้ง Kubernetes, Slurm และสภาพแวดล้อมองค์กร
  • AMD AI Workbench – สภาพแวดล้อมที่ยืดหยุ่นสำหรับการปรับใช้ ดัดแปลง และปรับขนาดโมเดล AI พร้อมการรองรับในตัวสำหรับการอนุมาน การปรับแต่ง และการผสานรวมเข้ากับเวิร์กโฟลว์ขององค์กร

นักพัฒนาที่สนใจสามารถลงทะเบียนเพื่อเข้าถึงเครื่องมือ AMD Enterprise AI เหล่านี้ได้ก่อน ด้วยการยึดมั่นในหลักการโอเพนซอร์ส AMD รับประกันความโปร่งใส ความยืดหยุ่น และการทำงานร่วมกันของระบบนิเวศ ซึ่งช่วยให้องค์กรสร้างระบบอัจฉริยะและอัตโนมัติที่สร้างผลกระทบในโลกแห่งความเป็นจริง

เริ่มต้นวันนี้

ROCm 7.0 ทำให้ AI ประสิทธิภาพสูงเข้าถึงได้ง่ายกว่าที่เคย นักพัฒนาสามารถสำรวจ ROCm AI developer hub สำหรับบทช่วยสอน คำแนะนำ และเครื่องมืออื่นๆ เพื่อเร่งการทำงานของคุณ ใช้ Docker images ที่สร้างไว้ล่วงหน้า เช่น SGLang, vLLM, Megatron-LM และ Jax เพื่อเปรียบเทียบประสิทธิภาพบน GPU AMD Instinct และเจาะลึกหน้าเอกสารประกอบ ROCm สำหรับแนวทางปฏิบัติที่ดีที่สุดและคำแนะนำในการปรับใช้อย่างละเอียด ไม่ว่าคุณจะกำลังปรับขนาด AI สำหรับองค์กร หรือทดลองกับโมเดลล่าสุด ROCm 7.0 ก็พร้อมให้คุณเริ่มต้นสร้างสรรค์ได้แล้ววันนี้

ข้อมูล: AMD