AMD เปิดตัว ROCm 6.4: ใช้งานง่ายบนการ์ดจอ Radeon, AI Inference แรงขึ้น 3 เท่า และ Ecosystem ที่เติบโต

AMD ได้ประกาศเปิดตัว ROCm 6.4 ซึ่งเป็นเวอร์ชันล่าสุดของแพลตฟอร์มซอฟต์แวร์แบบเปิดสำหรับการประมวลผลประสิทธิภาพสูง (HPC) และปัญญาประดิษฐ์ (AI) การอัปเดตครั้งนี้นับเป็นก้าวสำคัญ โดยมุ่งเน้นไปที่การเพิ่มประสิทธิภาพการประมวลผล AI Inference อย่างก้าวกระโดด ทำให้การติดตั้งและใช้งานง่ายขึ้นแบบ Plug-and-Play บนการ์ดจอ Radeon สำหรับผู้บริโภค และขยายการรองรับ Ecosystem ของ AI ให้กว้างขวางยิ่งขึ้น

ประสิทธิภาพ AI Inference พุ่งทะยาน

จุดเด่นสำคัญของ ROCm 6.4 คือการปรับปรุงประสิทธิภาพด้าน AI Inference โดยเฉพาะกับโมเดลภาษาขนาดใหญ่ (LLM) อย่าง Mixtral 8x7B บนฮาร์ดแวร์ AMD Instinct™ MI300X ซึ่ง AMD อ้างว่าให้ประสิทธิภาพเพิ่มขึ้นถึง 3 เท่าเมื่อเทียบกับ ROCm 6.1 ความเร็วที่เพิ่มขึ้นนี้เป็นผลมาจากการปรับปรุงประสิทธิภาพในหลายส่วน ทั้งในระดับ Kernel, ไลบรารีสำคัญอย่าง hipBLASLt, rocBLAS, MIOpen และการทำงานร่วมกับเฟรมเวิร์กยอดนิยมอย่าง PyTorch

ใช้งานง่ายขึ้นด้วย Plug-and-Play บนการ์ดจอ Radeon

อีกหนึ่งการเปลี่ยนแปลงที่น่าสนใจคือการทำให้ ROCm ใช้งานได้ง่ายขึ้นบนการ์ดจอสำหรับผู้บริโภคและเวิร์คสเตชัน เช่น AMD Radeon™ PRO W7900, Radeon™ RX 7900 XTX และ Radeon™ RX 7900 GRE รวมไปถึงการ์ดจอรุ่นใหม่อย่าง RX 9070 Series และ RX 9060 Series ที่กำลังจะเปิดตัว

สำหรับผู้ใช้งานระบบปฏิบัติการ Ubuntu 22.04.4 LTS ที่ใช้ Linux Kernel 6.8 (ซึ่งเป็นเวอร์ชันล่าสุด ณ วันที่เผยแพร่) จะสามารถใช้งาน ROCm 6.4 ได้ทันทีโดยไม่จำเป็นต้องติดตั้ง amdgpu-dkms kernel module ที่ซับซ้อนเหมือนในอดีต เพียงติดตั้งแพ็คเกจ ROCm ที่จำเป็น ก็สามารถเริ่มต้นพัฒนาและรันแอปพลิเคชัน AI/ML ได้เลย ช่วยลดความยุ่งยากในการตั้งค่าเริ่มต้นลงได้อย่างมาก

ROCm

Ecosystem ที่แข็งแกร่งและเติบโต

AMD ยังคงเดินหน้าขยาย Ecosystem ของ ROCm อย่างต่อเนื่องในเวอร์ชัน 6.4 นี้:

  • รองรับเฟรมเวิร์กหลากหลาย: ปรับปรุงการรองรับ PyTorch, ONNX Runtime และ TensorFlow ให้ดียิ่งขึ้น
  • ไลบรารีและเครื่องมือใหม่/ปรับปรุง:
    • hipSPARSELt: ไลบรารีใหม่สำหรับเร่งการคำนวณ Sparse Matrix ซึ่งสำคัญมากสำหรับ LLM สมัยใหม่
    • hipFFT, rocSOLVER, rocRAND: มีการปรับปรุงประสิทธิภาพและการรองรับเพิ่มเติม
    • RCCL: ปรับปรุงประสิทธิภาพการสื่อสารระหว่าง GPU หลายตัว
  • การสนับสนุนจากชุมชน: โครงการโอเพนซอร์สยอดนิยมอย่าง llama.cpp และ Ollama มีการปรับปรุงการรองรับ ROCm อย่างต่อเนื่อง ช่วยให้นักพัฒนาและผู้ใช้งานเข้าถึงโมเดล AI ล่าสุดบนฮาร์ดแวร์ AMD ได้ง่ายขึ้น
  • ความร่วมมือ: ทำงานร่วมกับพันธมิตรอย่าง LaminiAI และ Hugging Face เพื่อเพิ่มประสิทธิภาพและขยายการเข้าถึงโมเดล AI บนแพลตฟอร์ม ROCm

การรองรับฮาร์ดแวร์

ROCm 6.4 ขยายการรองรับฮาร์ดแวร์เพิ่มเติม รวมถึงการ์ดจอ Instinct™ และ Radeon™ รุ่นต่างๆ (ตรวจสอบรายการฮาร์ดแวร์ที่รองรับทั้งหมดได้จากเอกสารทางการของ AMD)

สรุป

การเปิดตัว ROCm 6.4 ถือเป็นก้าวที่สำคัญของ AMD ในการพัฒนาแพลตฟอร์ม AI แบบเปิดที่ทรงพลังและเข้าถึงง่าย โดยเฉพาะการทำให้สามารถใช้งานร่วมกับการ์ดจอทั่วไปอย่าง Radeon RX 7000 Series ที่มีอยู่ในตลาดมากพอสมควรรวมถึงการเติบโตของ Radeon RX 9070 Series ที่กำลังมาแรง การเพิ่มประสิทธิภาพด้าน Inference อย่างมีนัยสำคัญ และการขยาย Ecosystem อย่างต่อเนื่อง จะช่วยให้นักพัฒนา นักวิจัย และผู้ใช้งานทั่วไปสามารถใช้ประโยชน์จากพลังการประมวลผลของฮาร์ดแวร์ AMD สำหรับงาน AI และ HPC ได้อย่างเต็มศักยภาพมากขึ้น

สำหรับผู้ที่สนใจ สามารถดูรายละเอียดเพิ่มเติม เอกสารประกอบ และดาวน์โหลด ROCm 6.4 ได้ที่:


เรียบเรียงจาก: AMD Community Blog