DeepSeek AI Chip
|

DeepSeek เตรียมสร้าง AI Chip และ GPU ของตัวเอง

หลังจาก DeepSeek ได้สร้างความฮือฮาในวงการ AI DeepSeek ได้รับความนิยมอย่างมากเนื่องจากคุณค่าที่นำมาสู่วงการ AI ทั้งหมด V3 และ R1 เป็นโอเพนซอร์ส และ API มีราคาถูกมากสำหรับการอนุมาน อินเทอร์เฟซแชทใช้งานได้ฟรีและไม่มีการจำกัดอัตรา DeepSeek ประสบความสำเร็จทั้งหมดนี้ด้วย GPU ในรุ่นที่ถูกจำกัดประสิทธิภาพ แต่ก็ยังสามารถสร้างโมเดลที่ค่อนข้างดีออกมาได้

เซิร์ฟเวอร์รองรับไม่ไหว

หลังจากที่ DeepSeek เป็นที่นิยมอย่างรวดเร็ว ก็เริ่มประสบปัญหาการหยุดทำงานเนื่องจากมีผู้ใช้แพลตฟอร์มจำนวนมาก อย่างไรก็ตาม พวกเขาเริ่มติดตั้งเซิร์ฟเวอร์เพิ่มเติม มีรายงานว่า DeepSeek ใช้ชิป Huawei Ascend สำหรับการอนุมาน ซึ่งมีประสิทธิภาพประมาณ 60% ของ Nvidia H100 และใช้พลังงานน้อยกว่า ทีม DeepSeek ได้เขียนเลเยอร์ความเข้ากันได้ตั้งแต่เริ่มต้นสำหรับการอนุมานและงานที่เกี่ยวข้อง เนื่องจากชิป Huawei Ascend เหล่านี้ไม่รองรับเฟรมเวอร์ที่เป็น CUDA ของ Nvidia

แนวทางสร้างชิปของ DeepSeek

DeepSeek กำลังพัฒนาชิปของตัวเองที่สามารถจัดการทั้งการอนุมานและการฝึกโมเดล DigiTimes Asia รายงานว่า DeepSeek ได้เริ่มการสรรหาบุคลากรครั้งใหญ่สำหรับผู้มีความสามารถด้านการออกแบบเซมิคอนดักเตอร์ ซึ่งบ่งบอกถึงแผนการพัฒนาโปรเซสเซอร์ที่เป็นกรรมสิทธิ์ของตนเองอาจจะใช้เวลานาน

อย่างไรก็ตามในระหว่างนี้ถ้า DeepSeek ต้องการความรวดเร็วในการตอบสนองกับผู้ใช้ก็อาจจะสามารถเลือกใช้งานจากผู้ผลิตชิปอย่าง Groq, Cerebras และ SambaNova ที่สามารถสร้างชิปที่เป็นกรรมสิทธิ์ซึ่งมีประสิทธิภาพ ในราคาถูก และรวดเร็วอย่างน่าอัศจรรย์

โดยเฉพาะ Groq ที่มีการผลิตชิป LPU (Language Processing Unit) ออกมาซึ่งทำหน้าที่สำหรับการอนุมาณหรือการประมวลจากโมเดล LLM ที่สร้างไว้เรียบร้อยแล้ว สามารถนำมาปรับเพื่อใช้งานร่วมกับโมเดลของ DeepSeek ได้ทันที และตอนนี้ทาง Groq เองก็ได้เปิดเซิร์ฟเวอร์ที่ใช้ LPU ซึ่งทำงานร่วมกับ DeepSeek-R1 อยู่ในขณะนี้ซึ่งทุกคนสามารถเข้าไปทดลองใช้งานได้ แต่ว่าอาจจะมีการจำกัดจำนวนข้อความและความยาวในการพูดคุย เพราะนี่เป็นส่วนของการสาธิตเท่านั้น

ถึงเวลาบริษัท AI มีชิปของตัวเอง

นอกจาก DeepSeek แล้ว ก่อนหน้านี้บริษัทอย่าง OpenAI เองก็มีแผนที่จะพัฒนาชิปเป็นของตัวเองมานานแล้วเช่นกัน และกำลังเจรจากับ TSMC เพื่อสร้างชิปด้วยกระบวนการ 3 นาโนเมตร เพื่อให้ได้ชิปสำหรับการอนุมานที่ถูกที่สุดและเร็วที่สุดสำหรับโมเดลภาษาของตน พวกเขากำลังทำเช่นนี้เพื่อลดการพึ่งพาการทำงานบางส่วนจากชิปของ Nvidia

อย่างไรก็ตามการผลิตชิปประมวลผลของบริษัท AI ส่วนใหญ่จะมุ่งเน้นไปที่งานการอนุมาน (inference) กันเป็นหลัก ซึ่งถ้าเปรียบง่าย ๆ ก็เหมือนกับเรามีคอมพิวเตอร์ไว้สำหรับเล่นเกมหรือใช้งานซอฟต์แวร์ที่พัฒนามาเสร็จแล้วและพร้อมใช้งานไม่ได้มีฮาร์ดแวร์ซับซ้อนอะไรมาก ในขณะที่บริษัทผู้สร้างเกมหรือซอฟต์แวร์จะต้องมีทรัพยากรมากมายและขั้นตอนในการผลิตเนื้อหาของเกมหรือคุณสมบัติของซอฟต์แวร์นั้น ๆ ออกมา

และถ้ามองในมุมนี้แม้ว่า Nvidia อาจจะได้ผลกระทบบ้างแต่ก็คงไม่มากนัก เพราะถ้าคุณต้องการพัฒนาหรือปรับปรุงประสิทธิภาพในการทำงานของโมเดลก็ยังจำเป็นต้องใช้ชิป AI ที่มีประสิทธิภาพจาก Nvidia อยู่ดี และยิ่งการแข่งขันของ AI รุนแรงและเปลี่ยนแปลงอย่างรวดเร็ว ก็ยิ่งเป็นเรื่องยากที่จะหาชิปอื่นนอกจากของ Nvidia มาใช้งาน เพราะมีความพร้อมในทุกด้านทั้งฮาร์ดแวร์ ซอฟต์แวร์ และเฟรมเวิร์คต่าง ๆ รวมถึงความเข้ากันได้กับระบบเดิมที่มีอยู่ก่อนแล้ว

โอเพ่นซอร์สเปลี่ยนโลก AI

หลายคนที่อยู่ในวงการซอฟต์แวร์ก็คงจะพอรู้จักกับเรื่องโอเพ่นซอร์สและได้เห็นพลังของคอมมูนิตี้เหล่านี้กันมาบ้างแล้ว แต่ที่ผ่านมาก็ไม่ค่อยจะมีผลต่อซอฟต์แวร์ที่เป็นระบบปิดมากนัก ดูง่าย ๆ อย่างพวก Linux กับ Windows และ macOS แต่พอมาเป็นฝั่ง AI ที่มีต้นทุนการเริ่มต้นสูง และทุกคนคิดว่าการเป็นเจ้าของโมเดลที่ทรงพลังจะสามารถเป็นเจ้าตลาดและเป็นผู้นำได้ พอมีโอเพ่นซอร์สเข้ามาและทำให้ผู้คนที่มีต้นทุนไม่สูงสามารถหยิบจับโมเดลที่เป็นระบบเปิดมาต่อยอดได้มันก็จะทำให้ความก้าวหน้าที่ทุกคนต้องการนี้มีอัตราเริ่งเพิ่มขึ้นไปอีก

ดังนั้นคนที่เป็นเจ้าตลาดเดิมอย่าง OpenAI และโมเดล AI ในระบบปิดอื่น ๆ ก็ต้องเจอกับความท้าทายเหล่านี้อย่างที่ไม่เคยเป็นมาก่อน แม้จะมีพวกโมเดลที่เป็นโอเพ่นซอร์สใช้งานกันอยู่ทั่วไปอยู่บ้างแล้วแต่การมาของ DeepSeek-R1 ได้ไปกระตุ้นความเปลี่ยนแปลงในครั้งนี้อย่างเห็นได้ชัด ทำให้เกิดมุมมองใหม่ ๆ ในการพัฒนา AI และจากนี้การแข่งขันในโลกของ AI ก็จะไม่เหมือนเดิมอีกต่อไป