IBM Cloud เป็นผู้ให้บริการรายแรกที่นำ Intel Gaudi 3 มาใช้ เพิ่มทางเลือกและความคุ้มค่าสำหรับ AI
ไอบีเอ็ม ได้กลายเป็นผู้ให้บริการคลาวด์รายแรกที่เปิดให้ลูกค้าเข้าถึงตัวเร่งการประมวลผล AI รุ่น Intel® Gaudi® 3 นับเป็นการเคลื่อนไหวสำคัญที่ออกแบบมาเพื่อทำให้ความสามารถด้านปัญญาประดิษฐ์เข้าถึงได้ง่ายขึ้น และเพื่อจัดการกับปัญหาเรื่องค่าใช้จ่ายที่สูงของฮาร์ดแวร์ AI โดยเฉพาะ
สำหรับ Intel แล้ว การเปิดตัว Gaudi 3 บน IBM Cloud ถือเป็นการนำ Gaudi 3 มาใช้งานเชิงพาณิชย์ครั้งใหญ่ครั้งแรก ซึ่งนำเสนอทางเลือกใหม่ให้กับตลาด ด้วยการใช้ประโยชน์จาก Intel Gaudi 3 บน IBM Cloud ทั้งสองบริษัทมีเป้าหมายที่จะช่วยให้ลูกค้าสามารถทดสอบ สร้างสรรค์ และปรับใช้โซลูชัน GenAI ได้อย่างคุ้มค่า
จากข้อมูลคาดการณ์ล่าสุดของบริษัทวิจัย Gartner การใช้จ่ายทั่วโลกด้าน Generative AI (GenAI) คาดว่าจะสูงถึง 6.44 แสนล้านดอลลาร์สหรัฐฯ ในปี 2568 เพิ่มขึ้น 76.4% จากปี 2567 งานวิจัยพบว่า “GenAI จะมีผลกระทบที่เปลี่ยนแปลงในทุกๆ ด้านของตลาดการใช้จ่ายด้านไอที ซึ่งบ่งชี้ถึงอนาคตที่เทคโนโลยี AI จะมีความสำคัญต่อการดำเนินงานทางธุรกิจและผลิตภัณฑ์สำหรับผู้บริโภคมากขึ้นเรื่อยๆ”
สำหรับลูกค้าองค์กรหลายราย ประโยชน์ที่ได้รับนั้นชัดเจนเมื่อเครื่องมืออย่าง GenAI ช่วยให้งานเป็นไปโดยอัตโนมัติ ปรับปรุงขั้นตอนการทำงาน และขับเคลื่อนนวัตกรรม อย่างไรก็ตาม การใช้งานแอปพลิเคชัน AI ต้องการพลังการประมวลผลที่สำคัญ ซึ่งมักจะต้องใช้โปรเซสเซอร์พิเศษที่มีราคาแพง ซึ่งอาจทำให้ธุรกิจจำนวนมากไม่สามารถได้รับประโยชน์จาก AI ได้
ตัวเร่งการประมวลผล AI รุ่น Gaudi 3 ได้รับการออกแบบมาโดยเฉพาะเพื่อช่วยตอบสนองความต้องการที่เพิ่มขึ้นอย่างรวดเร็วสำหรับ GenAI, Large Model Inferencing และ Model Fine-tuning ในขณะที่ยังรองรับ Open Development Framework Gaudi 3 ยังเหมาะสำหรับ Multimodal Large Language Models (LLMs) และ Retrieval-Augmented Generation (RAG)
“ด้วยการนำตัวเร่งการประมวลผล AI รุ่น Intel Gaudi 3 มาสู่ IBM Cloud เรากำลังช่วยให้ธุรกิจต่างๆ สามารถขยายขอบเขตงาน Generative AI ด้วยประสิทธิภาพที่เหมาะสมที่สุดสำหรับการประมวลผลและการปรับแต่งโมเดล” นาย Saurabh Kulkarni รองประธานฝ่ายกลยุทธ์ Data Center AI ของ Intel กล่าว “ความร่วมมือนี้ตอกย้ำความมุ่งมั่นร่วมกันของเราในการทำให้ AI เข้าถึงได้ง่ายขึ้นและคุ้มค่าสำหรับองค์กรต่างๆ ทั่วโลก”
IBM Cloud ให้บริการลูกค้าองค์กรหลากหลายกลุ่ม โดยเฉพาะอย่างยิ่งในอุตสาหกรรมที่มีการควบคุม เช่น บริการทางการเงิน, การดูแลสุขภาพและวิทยาศาสตร์เพื่อชีวิต และภาครัฐ ธนาคารและบริษัทประกันใช้คลาวด์สำหรับการตรวจจับการฉ้อโกงหรือการบริการลูกค้าแบบเฉพาะบุคคล ในขณะที่ผู้ให้บริการด้านการดูแลสุขภาพใช้สำหรับการเร่งการค้นคว้าและพัฒนายา, การวินิจฉัยที่ขับเคลื่อนด้วย AI, แพลตฟอร์มการแพทย์ทางไกล และการติดตามผู้ป่วยแบบเรียลไทม์ ผู้ค้าปลีกใช้เทคโนโลยีคลาวด์สำหรับแพลตฟอร์มอีคอมเมิร์ซหรือการจัดการสินค้าคงคลัง นอกจากนี้ยังเป็นตัวเลือกสำหรับบริษัทที่ต้องการปรับปรุงระบบเก่าให้ทันสมัยโดยไม่สูญเสียการควบคุมหรือความปลอดภัย
Gaudi 3 พร้อมให้บริการแล้วในภูมิภาคของ IBM Cloud ได้แก่ แฟรงก์เฟิร์ต ประเทศเยอรมนี; วอชิงตัน ดี.ซี.; และดัลลัส รัฐเท็กซัส Gaudi 3 ยังถูกรวมเข้ากับข้อเสนอโครงสร้างพื้นฐาน AI ที่กว้างขวางของ IBM ลูกค้าสามารถใช้ Gaudi 3 ผ่าน IBM Cloud Virtual Servers บน IBM Virtual Private Cloud (VPC) ได้แล้ว ลูกค้าจะสามารถปรับใช้ข้ามสถาปัตยกรรมได้เริ่มตั้งแต่ครึ่งหลังของปี 2568 เป็นต้นไป คาดว่าจะมีการรองรับ Red Hat OpenShift และแพลตฟอร์ม AI watsonx ของ IBM ในไตรมาสนี้
“ความสามารถในการจัดการข้อมูลจำนวนมาก และมีประสิทธิภาพสูงขึ้น ทั้งหมดนี้จะช่วยขับเคลื่อนการนำ AI ไปใช้ได้ดียิ่งขึ้นสำหรับลูกค้าทั่วโลก” นาย Satinder Sethi ผู้จัดการทั่วไปฝ่ายบริการโครงสร้างพื้นฐาน IBM Cloud กล่าว “Intel Gaudi 3 มอบทางเลือกที่มากขึ้น อิสระที่มากขึ้น และแพลตฟอร์มฮาร์ดแวร์ AI ที่คุ้มค่ามากขึ้นสำหรับลูกค้าที่ต้องการใช้งาน”

การเปรียบเทียบต้นทุนและประสิทธิภาพ
ตัวเร่งการประมวลผล AI รุ่น Intel Gaudi 3 ได้รับการออกแบบมาเพื่อแก้ไขปัญหาด้านต้นทุนด้วยการสร้างสมดุลระหว่างประสิทธิภาพและราคา การทดสอบเปรียบเทียบประสิทธิภาพการประมวลผล AI ล่าสุดที่ดำเนินการโดยบริษัทวิจัย Signal65 และได้รับมอบหมายจาก Intel พบว่า Gaudi 3 มีประสิทธิภาพด้านต้นทุน (ประสิทธิภาพต่อดอลลาร์) ดีกว่าคู่แข่งถึง 92% เมื่อรันบนโมเดล Llama-3.1-405B-Instruct-FP8 ของ Meta ที่มีขนาดคอนเท็กซ์ใหญ่
ประสิทธิภาพด้านต้นทุนเป็นตัวชี้วัดที่สำคัญ เนื่องจากช่วยให้ธุรกิจสามารถประมวลผล AI ได้มากขึ้นด้วยการลงทุนเท่าเดิม หรือประมวลผลจำนวนเท่าเดิมด้วยต้นทุนที่ต่ำลง การเพิ่มขึ้นของประสิทธิภาพมีวัตถุประสงค์เพื่อลดอุปสรรคด้านต้นทุนสำหรับบริษัทที่ต้องการปรับใช้หรือปรับแต่งโมเดล โดยเฉพาะอย่างยิ่งเมื่อการนำ GenAI มาใช้แพร่หลายมากขึ้น
ประสิทธิภาพหรือ Throughput หมายถึงปริมาณการประมวลผล AI ที่ตัวเร่งสามารถทำได้ในแต่ละช่วงเวลา หรือที่เรียกว่า Tokens per second Gaudi 3 ให้ความเร็วในการประมวลผล AI ที่เร็วกว่าคู่แข่งอย่างมาก บนโมเดล IBM Granite-3.1-8B-Instruct, Gaudi 3 ให้ Tokens per second มากกว่า 43% สำหรับเวิร์คโหลด AI ขนาดเล็ก และมากกว่า 36% ด้วยขนาดคอนเท็กซ์ใหญ่เมื่อเทียบกับคู่แข่งเมื่อรันโมเดล Llama-3.1-405B-Instruct-FP8 ของ Meta
ข้อมูลเพิ่มเติม Intel News Room
You must be logged in to post a comment.