AMD-EPYC-Processors

Agenti AI ทำให้ CPU กลับมามีบทบาทสำคัญอีกครั้งใน AI Data Center เพื่อใช้การประมวลผลเชิงตรรกะ และการบริหารจัดการกราฟิกการ์ดที่ซับซ้อนมากยิ่งขึ้น

ประเด็นสำคัญ

  • แม้โปรเซสเซอร์ (CPU) จะเป็นส่วนหนึ่งของการทำงานด้าน AI มาโดยตลอด แต่ปัจจุบัน โปรเซสเซอร์จะทวีความสำคัญขึ้นไปอีกระดับ เพราะ Agentic AI จำเป็นต้องใช้การประมวลผลเชิงตรรกะและการบริหารจัดการกราฟิกการ์ด (GPU) ที่ซับซ้อนมากยิ่งขึ้น
  • ยิ่งมีการใช้งาน Agentic AI แพร่หลายมากขึ้น การนำ AI ไปใช้งานจริง (inference) ก็จะกลายเป็นกระบวนการที่มีหลายขั้นตอน ซึ่งไปกระตุ้นให้เกิดความต้องการในด้านพลังการประมวลผลจากโปรเซสเซอร์เพิ่มขึ้นตามไปด้วย
  • ในระบบ AI คลัสเตอร์ยุคใหม่ โปรเซสเซอร์ทำหน้าที่ด้านระบบที่สำคัญมาก โดยคอยช่วยให้ตัวเร่งการประมวลผลต่าง ๆ ทำงานได้อย่างมีประสิทธิภาพ ไม่ว่าจะเป็นการจัดคิวงาน เตรียมข้อมูล จัดการหน่วยความจำ (memory & I/O) และควบคุมโฟลว์การทำงาน
  • เซิร์ฟเวอร์โปรเซสเซอร์ AMD EPYC™ ช่วยให้ลูกค้าสามารถสร้างโครงสร้างพื้นฐาน AI ที่สมดุลและเปิดกว้าง ทำงานสอดประสานเป็นเนื้อเดียวกันกับกราฟิกการ์ด AMD Instinct™, เทคโนโลยีเครือข่าย AMD Pensando™ และระบบซอฟต์แวร์ AMD ROCm™

ในงานสัมมนา AMD Advancing AI ดร. ลิซ่า ซู ซีอีโอและประธานบริษัทAMDได้อธิบายถึง Agentic AI ว่าเป็นเสมือนกลุ่มผู้ใช้งานรูปแบบใหม่คือระบบที่ตื่นตัวอยู่ตลอดเวลา คอยเข้าถึงข้อมูล แอปพลิเคชัน และบริการต่าง ๆ อย่างต่อเนื่อง เพื่อนำไปวิเคราะห์ ตัดสินใจ และทำงานที่ซับซ้อนให้สำเร็จ

จริงอยู่ที่ระบบเหล่านี้ต้องพึ่งพาชิปประมวลผลกราฟิกการ์ดประสิทธิภาพสูงเพื่อวิเคราะห์และสร้างข้อมูลเจาะลึกแบบเรียลไทม์ แต่โครงสร้างพื้นฐานที่อยู่รายล้อมระบบก็สำคัญไม่แพ้กัน ยิ่งกิจกรรมของ Agentic AI ขยายตัวมากขึ้น โปรเซสเซอร์ประสิทธิภาพสูงก็จะยิ่งต้องรับบทหนักในการประสานงาน ประมวลผลและเคลื่อนย้ายข้อมูล รวมถึงคอยดูแลการดำเนินงานต่าง ๆ มากมายที่เกิดขึ้นรอบ ๆ ตัวโมเดลAI

แม้กราฟิกการ์ดจะทำงานได้อย่างยอดเยี่ยมในเรื่องการประมวลผลข้อมูลปริมาณมหาศาล  พร้อม ๆ กัน (parallel processing) ซึ่งจำเป็นมากเวลาใช้สอน (training) โมเดลAIและงานทั่วไป แต่การจะนำAIไปใช้งานในยุคปัจจุบันให้มีความเสถียรนั้น ต้องพึ่งพาระบบที่มีความสมดุล โดยทั้งโปรเซสเซอร, กราฟิกการ์ด,ระบบเครือข่าย และซอฟต์แวร์ ต่างก็มีบทบาทเฉพาะตัวที่จะช่วยดันประสิทธิภาพของระบบในภาพรวมให้สามารถรองรับการขยายขนาดได้

ในสภาพแวดล้อมเช่นนี้ โปรเซสเซอร์จะรับบทเป็น “ผู้ควบคุมและสั่งการ” ภาระงานต่าง ๆ เพื่อจัดการหน่วยความจำและการย้ายข้อมูล รวมถึงซัพพอร์ตแอปพลิเคชันระดับองค์กรที่รันอยู่ควบคู่กับโมเดลAI บนระบบจริง สิ่งนี้เองที่ทำให้ประสิทธิภาพการประมวลผลและการประหยัดพลังงานของโปรเซสเซอร์กลายมาเป็นเรื่องที่สำคัญยิ่งกว่าที่เคย ต่อประสิทธิภาพโดยรวมของโครงสร้างพื้นฐานAI ยุคใหม่

จากข้อมูลล่าสุดที่มีการเผยแพร่ มีการประเมินว่าระบบที่ใช้โปรเซสเซอร์5th Gen AMD EPYC ให้ประสิทธิภาพการทำงานต่อคอร์ (performance per core) สูงกว่าระบบที่ใช้โปรเซสเซอร์คู่แข่งเช่นNvidia Grace Superchip ในระดับเดียวกันถึง2.1 เท่า นอกจากนี้ เมื่อนำระบบของ AMD EPYC ไปเทียบกับระบบของNvidia Grace Superchip แบบหมัดต่อหมัด ยังพบว่าระบบของ AMD ให้ประสิทธิภาพการทำงานต่อหน่วยพลังงาน (วัตต์) ดีกว่าสูงสุดถึง2.26 เท่า (อ้างอิงจากการวัดผลด้วย SPECpower)

ที่สำคัญไม่แพ้กัน ด้วยสถาปัตยกรรมโปรเซสเซอร์x86ยังมอบข้อได้เปรียบให้ลูกค้าในส่วนของระบบนิเวศซอฟต์แวร์ที่กว้างขวางและผ่านการพิสูจน์มาแล้ว ระบบขององค์กรส่วนใหญ่สามารถรันการทำงานบนสถาปัตยกรรมนี้ได้โดยตรงทั้งบนเซิร์ฟเวอร์บริษัท (on-prem) และบนคลาวด์ โดยไม่ต้องมานั่งรื้อเขียนโค้ดใหม่ (refactoring/recompiling) หรือวุ่นวายกับการจัดการโค้ดหลาย ๆ ชุด ซึ่งมักจะเป็นปัญหาชวนปวดหัวเวลาที่ต้องนำระบบที่ใช้สถาปัตยกรรมArmเข้ามาผสมผสาน

โปรเซสเซอร์และกราฟิกการ์ดทำงานร่วมกันอย่างไร

เพื่อให้เห็นภาพ ลองนึกถึงความสัมพันธ์ระหว่างโปรเซสเซอร์ (CPU) และกราฟิกการ์ด (GPU) ใน AI Data Center ว่าเหมือนกับ “หัวหน้าโค้ช”กับ “ทีมนักกีฬาที่มีความปราดเปรียว”

หัวหน้าโค้ช (CPU) จะเป็นคนวางแผนการเล่น คอยแก้เกมทีมคู่แข่ง ดูเวลา และควบคุมให้นักกีฬาทุกคนเคลื่อนที่ไปในทิศทางที่ถูกต้อง ส่วนเหล่านักกีฬา (GPU) คือผู้ที่มีความเชี่ยวชาญเฉพาะทาง ลงไปเล่นตามแผนในแต่ละจังหวะได้อย่างมีประสิทธิภาพ

เซิร์ฟเวอร์โปรเซสเซอร์ออกแบบมาให้รับมือกับงานที่ซับซ้อนและสั่งการกราฟิกการ์ดในระบบ โดยจะดึงข้อมูลขึ้นมาจากหน่วยความจำ เตรียมข้อมูลให้พร้อมสำหรับกราฟิกการ์ด จัดคิวส่งข้อมูลให้อยู่ในเวลาที่เหมาะสม และจัดการป้อนคำสั่งรวมถึงข้อมูลที่กราฟิกการ์ดต้องใช้ในการทำงาน ส่วนฝั่งกราฟิกการ์ดซึ่งมีขนาดคอร์เล็กกว่า จะออกแบบมาให้ทำงานที่ตรงไปตรงมา แต่เน้นทำซ้ำ ๆ ด้วยความรวดเร็วมหาศาลแทน

บทบาทที่เปลี่ยนไประหว่างการ “สอน” (Training) และ “ใช้งานจริง” (Inference)

ช่วงการฝึกคือเวทีที่กราฟิกการ์ดและขุมพลังการประมวลผลประสิทธิภาพสูงได้เฉิดฉาย โครงข่ายประสาทเทียมต้องอาศัยการประมวลผลตารางข้อมูลขนาดใหญ่ การฝึกAIจึงต้องใช้ทีมกราฟิกการ์ดมาช่วยกันย่อยข้อมูลขนาดใหญ่ซ้ำแล้วซ้ำเล่าเพื่อให้ระบบเกิดการเรียนรู้

ในระหว่างกระบวนการฝึก โปรเซสเซอร์จะคอยจัดการและป้อนข้อมูลให้กราฟิกการ์ด เพื่อให้สามารถทำงานได้เต็มประสิทธิภาพที่สุด นอกจากนี้โปรเซสเวอร์ยังต้องคอยรันระบบปฏิบัติการ จัดการหน่วยความจำ และจัดคิวงานต่าง ๆ ฟังดูเหมือนงานเยอะ แต่นี่ไม่ใช่เรื่องที่สร้างความตึงเครียดให้กับโปรเซสเซอร์เลย

แต่เมื่องานAIส่วนใหญ่ก้าวเข้าสู่ช่วงการนำไปใช้งานจริง (inference)โปรเซสเซอร์จะลดบทบาทหน้าที่ของการจัดระเบียบลง แล้วสวมหมวกผู้จัดการที่เน้นผลลัพธ์มากขึ้น โดยกราฟิกการ์ดจะยังคงรับหน้าที่ประมวลผลสมการคณิตศาสตร์หนัก ๆ ต่อไป แต่โปรเซสเซอร์จะเข้ามารับงานที่ต้องคิดวิเคราะห์ซับซ้อนแทน เช่น การรวบรวมข้อมูล กำหนดเส้นทางข้อมูล ตีความผลลัพธ์ และการตัดสินใจขั้นสุดท้าย บทบาทของโปรเซสเซอร์ในช่วงใช้งานจริงนี้จะมีความเข้มข้นมาก เพราะต้องทำทั้งในส่วนของการควบคุม ประสานงาน และตัดสินใจเรื่องยาก ๆ ไปพร้อม ๆ กัน

ตรงนี้เองที่ชี้ให้เห็นว่าสถาปัตยกรรมมีความสำคัญมากแค่ไหน

AMD เป็นผู้นำด้านการออกแบบชิปเล็ต (chiplet)แนวทางการประกอบที่ยืดหยุ่นได้นี้ ช่วยให้AMDสามารถปรับแต่งทั้งประสิทธิภาพการประมวลผล, การเข้าออกของข้อมูล (I/O), แบนด์วิดท์หน่วยความจำ และการใช้พลังงาน ให้ตอบโจทย์และเหมาะสมกับทุกสเกลงาน ตั้งแต่แอปพลิเคชันหลักขององค์กร ระบบ Virtualization ไปจนถึงการสั่งการกราฟิกการ์ด และดูแลเวิร์กโฟลว์ของAgentic AI ที่มีหลายขั้นตอน

Agentic AI พึ่งพาโปรเซสเซอร์ (CPU) อย่างหนักหน่วง

การมาถึงของ Agentic AI (ปัญญาประดิษฐ์ที่สามารถวางแผน ตัดสินใจ และลงมือทำได้เองโดยแทบไม่ต้องพึ่งพามนุษย์) ทำให้เราต้องการโปรเซสเซอร์ที่ทำอะไรได้มากกว่าที่เคย ในโลกของAI Agent ชิปโปรเซสเซอร์จะต้องใช้เวลาและตรรกะมากขึ้นเพื่อคิดทบทวนผลลัพธ์ แทนที่จะแค่ส่งคำตอบกลับมาเหมือนการประมวลผลAIแบบเดิม ๆ และหลายครั้งที่โปรเซสเซอร์จะตีกลับปัญหาไปให้กราฟิกการ์ด (GPU) ประมวลผลใหม่อีกรอบพร้อมแนบคำสั่งที่ปรับแก้แล้ว ก่อนที่จะยอมปล่อยผลลัพธ์สุดท้ายออกมา

นอกเหนือจากหน้าที่หลักแล้ว โปรเซสเซอร์ในระบบAgentic AI ยังต้องคอยจัดการคำสั่งเรียกใช้เครื่องมือต่าง ๆ, การขอข้อมูลผ่านAPIและการค้นหาข้อมูลในหน่วยความจำ ซึ่งในโลกที่สมบูรณ์แบบ โปรเซสเซอร์ต้องทำสิ่งเหล่านี้ทั้งหมดไปพร้อม ๆ กับการป้อนงานให้กราฟิกการ์ด การเติบโตของAgentic AI จึงทำให้โปรเซสเซอร์ต้องทำงานหนักขึ้น (รอบการทำงานของโปรเซสเซอร์สูงขึ้น) ในการคอยวิ่งส่งข้อมูลไปมาระหว่างตัวAgent, แอปพลิเคชันขององค์กร และบ่อพักข้อมูล (data lakes)

ถ้าเปรียบเป็นโค้ช โปรเซสเซอร์ไม่ได้แค่วางแผนช่วง2นาทีสุดท้ายของเกม แต่มันต้องคิดแผนบุกครั้งแล้วครั้งเล่าเพื่อทำแต้มให้ได้ การตัดสินใจของโค้ชจะเป็นตัวชี้วัดเลยว่ากราฟิกการ์ดจะถูกใช้งานคุ้มค่าแค่ไหน ปริมาณงานโดยรวมทำได้ดีเพียงใด และที่สำคัญที่สุดสำหรับผู้ให้บริการAIก็คือ มันส่งผลโดยตรงต่อต้นทุนหรือไม่ (TCO)

ถึงเวลาของเซิร์ฟเวอร์โปรเซสเซอร์ AMD EPYC

Agentic AIกำลังทลายขีดจำกัดว่าAIสามารถทำอะไรได้บ้าง และมันก็กำลังตอกย้ำความจริงที่คนออกแบบดาต้าเซ็นเตอร์ทุกคนรู้ดีอยู่แล้ว นั่นคือ ผลลัพธ์AIที่ดีที่สุด ย่อมมาจากระบบที่สมดุลที่สุด กราฟิกการ์ดจะยังคงเป็นตัวขับเคลื่อนพลังการประมวลผลต่อไป แต่โปรเซสเซอร์จะทวีความสำคัญมากขึ้นเรื่อย ๆ ในเรื่องการสั่งการ ควบคุมประสิทธิภาพ และการรวมศูนย์ดาต้าเซ็นเตอร์ เพื่อสร้างพื้นที่รองรับระบบAIใหม่ ๆ เพิ่ม โดยไม่ต้องขยายพื้นที่ดาต้าเซ็นเตอร์ หรือเพิ่มอัตราการกินไฟ

ปัจจุบัน ประสิทธิภาพของAI วัดกันที่ระบบในภาพรวม และAMD ก็อยู่ในจุดที่ได้เปรียบอย่างมาก เพราะสามารถปรับแต่ง (optimize) ทุกอย่างได้ตั้งแต่โปรเซสเซอร์ กราฟิกการ์ด ไปจนถึงระบบเครือข่ายและระบบซอฟต์แวร์แบบเปิดกว้าง เพื่อรีดประสิทธิภาพการทำงานต่อวัตต์ของทั้งคลัสเตอร์ออกมาให้ได้มากที่สุด โปรเซสเซอร์AMD EPYC สามารถผสานการทำงานอย่างแนบเนียนไปกับกราฟิกการ์ดAMD Instinct เพื่อรองรับการบริหารจัดการกราฟิกการ์ดอย่างมีประสิทธิภาพ โดยมีระบบซอฟต์แวร์AMD ROCm เป็นตัวร้อยเรียงระบบทั้งหมดเข้าด้วยกัน

AMD กำลังเร่งสร้างสิ่งใหม่ ๆ บนรากฐานที่แข็งแกร่งนี้ โปรเซสเซอร์ AMD EPYC เจนเนอเรชั่นถัดไป (โค้ดเนม “Venice”) ถูกวางตัวมาให้เป็นขุมพลังของสถาปัตยกรรมAIระดับแร็คตัวใหม่เช่น “Helios” โดยคาดว่าสถาปัตยกรรม “Venice” จะเข้ามาต่อยอดความเป็นผู้นำทั้งในด้านประสิทธิภาพ ความหนาแน่นของตัวระบบ และประสิทธิภาพการประหยัดไฟ สำหรับงานด้านAIและการประมวลผลทั่วไป

AI กำลังเร่งความต้องการพลังการประมวลผลในทุกภาคส่วน และผลักดันให้เกิดรอบการยกระดับเซิร์ฟเวอร์ครั้งใหญ่ทั่วโลก โปรเซสเซอร์AMD EPYC คือการที่AMD ส่งมอบรากฐาน โปรเซสเซอร์ที่แข็งแกร่งตอบโจทย์สิ่งที่ลูกค้าต้องการ เพื่อก้าวไปสู่เทคโนโลยีขั้นต่อไป และเพื่อรับบทเป็นโค้ชให้กับเหล่ากราฟิกการ์ดประสิทธิภาพสูงทั้งหมด