Xiaomi กำลังเร่งขยายคลัสเตอร์ GPU จำนวน 10,000 ตัว เพื่อสนับสนุนการพัฒนาโมเดล AI ขนาดใหญ่
เว็บไซต์ Jiemian News รายงานว่า Xiaomi กำลังเร่งสร้างคลัสเตอร์ GPU จำนวน 10,000 ตัว เพื่อสนับสนุนการพัฒนาโมเดล AI ขนาดใหญ่ โดยตอนนี้มี GPU อยู่แล้ว 6,500 ตัว ตั้งแต่เริ่มก่อตั้งทีม
Jiemian News ได้ติดต่อ Xiaomi เพื่อขอคำยืนยัน แต่จนถึงขณะนี้ แต่ทาง Xiaomi ยังไม่ให้ความเห็นใดๆ
แหล่งข่าวหนึ่งเปิดเผยกับนักข่าวของ Jiemian News ว่าแผนการนี้ดำเนินมาหลายเดือนแล้ว และ Lei Jun มีบทบาทสำคัญในฐานะผู้นำ “ในเรื่องฮาร์ดแวร์ AI สิ่งที่สำคัญที่สุดคือสมาร์ทโฟน ไม่ใช่แว่นตา Xiaomi ไม่สามารถไม่ทุ่มเทเต็มที่ในด้านนี้ได้”

ก่อนหน้านี้มีสัญญาณที่แสดงให้เห็นว่า Xiaomi ให้ความสำคัญกับโมเดล AI ขนาดใหญ่มากขึ้น เมื่อวันที่ 20 ธันวาคม ตามรายงานของ China Business News, Luo Fuli หนึ่งในผู้พัฒนาหลักของโมเดลโอเพนซอร์ส DeepSeek-V2 จะเข้าร่วมกับ Xiaomi และอาจทำงานในห้องปฏิบัติการ AI ของ Xiaomi เพื่อนำทีมพัฒนาโมเดล AI ขนาดใหญ่
ก่อนหน้านี้ DeepSeek มีนวัตกรรมสำคัญในด้านโครงสร้างโมเดลด้วยการใช้ MLA (Multi-head Latent Attention) ซึ่งมีบทบาทสำคัญในการลดต้นทุนการใช้โมเดลขนาดใหญ่ และ Luo Fuli เป็นหนึ่งในบุคคลหลักของงานนี้
ในเดือนเมษายน 2023 ทีมงานโมเดล AI ขนาดใหญ่ของห้องปฏิบัติการ AI Xiaomi ได้รับการจัดตั้งอย่างเป็นทางการ โดยแต่งตั้ง Luan Jian เป็นหัวหน้าทีม และรายงานต่อ Wang Bin รองประธานคณะกรรมการเทคโนโลยีและผู้อำนวยการห้องปฏิบัติการ AI ของ Xiaomi
Luan Jian เคยเป็นหัวหน้าทีมของห้องปฏิบัติการ AI และเคยดำรงตำแหน่งนักวิจัยที่ Toshiba (China) Research Institute, นักวิทยาศาสตร์ระดับสูงที่ Microsoft (China) Engineering Institute, หัวหน้านักวิทยาศาสตร์และทีมงานของ Microsoft Xiaoice
ในเวลาเดียวกัน Lei Jun ได้เขียนบทความเกี่ยวกับมุมมองของเขาต่อรูปแบบ AI ขนาดใหญ่และ AIGC โดยระบุว่า Xiaomi ได้ทำงานในด้าน AI มาเป็นเวลาหลายปีแล้ว และมีทีมงานเช่นห้องปฏิบัติการ AI, Xiao Ai และรถยนต์ขับอัตโนมัติ “สำหรับโมเดล AI ขนาดใหญ่ เราจะทุ่มเทเต็มที่และยอมรับอย่างแน่นอน เรากำลังพัฒนาบางเทคโนโลยีและผลิตภัณฑ์ที่น่าสนใจ และจะนำเสนอเมื่อเราพัฒนาเสร็จสิ้น”
ต่อมาในการบรรยายฉลองครบรอบปี 2023 ของ Xiaomi Lei Jun ได้พูดถึงความคืบหน้าของธุรกิจโมเดล AI ขนาดใหญ่ของบริษัทอีกครั้ง
เขาระบุว่าหลังจากจัดตั้งทีมงานแล้ว ทิศทางการพัฒนาหลักของเทคโนโลยีโมเดล AI ขนาดใหญ่ของ Xiaomi คือการทำให้เบาและสามารถใช้งานได้ในอุปกรณ์พกพาหรือในตัวอุปกรณ์เครื่องใช้ปลายทางไม่ต้องทำงานบนคลาวด์ ผลลัพธ์ล่าสุดคือ Xiaomi ได้ทดสอบโมเดลขนาดใหญ่บนสมาร์ทโฟน (13 พันล้านพารามิเตอร์) ซึ่งในบางสถานการณ์ให้ผลลัพธ์ใกล้เคียงกับโมเดลขนาด 6 หมื่นล้านพารามิเตอร์บนคลาวด์ และจะอัปเดต Xiao Ai ด้วยโมเดลขนาดใหญ่เวอร์ชันใหม่
ในเวลานั้น Xiaomi มีโมเดลสองรุ่นคือ MiLM-6B และ 1.3B Wang Bin ในการให้สัมภาษณ์กับสื่อเช่น Jiemian News เน้นย้ำว่าโมเดลที่ Xiaomi ฝึกฝนนั้นเริ่มต้นจากศูนย์ รวมถึงข้อมูลและอัลกอริทึม แต่ทีมงานไม่ปฏิเสธโมเดลขนาดใหญ่จากบุคคลที่สาม และจะยึดมั่นในแนวทางเปิดกว้างโดยผสมผสานการวิจัยและพัฒนาของตนเองกับความร่วมมือจากบุคคลที่สามเพื่อขับเคลื่อนการพัฒนารูปแบบ AI ขนาดใหญ่
สิ่งที่น่าสนใจคือ เวอร์ชันโมเดลขนาดใหญ่ครั้งแรกที่ Xiao Ai ได้รับการอัปเกรดนั้นใช้วิธีการผสมผสานระหว่างโมเดลจากบุคคลที่สามและโมเดลที่พัฒนาขึ้นเอง

จากข้อมูลสาธารณะแสดงให้เห็นว่า นับตั้งแต่ก่อตั้งทีม AI ในปี 2016 ทีมปัญญาประดิษฐ์ของ Xiaomi ได้ขยายตัว 6 ครั้งในระยะเวลา 7 ปี โดยปัจจุบันมีบุคลากรในสาขาที่เกี่ยวข้องมากกว่า 3,000 คน ความสามารถด้าน AI ของบริษัทครอบคลุมหลายทิศทาง ทั้งด้านการมองเห็น, ด้านเสียง, ด้านการประมวลผลภาษาธรรมชาติ (NLP), ด้านกราฟความรู้, ด้านการเรียนรู้ของเครื่อง, ด้านโมเดลขนาดใหญ่, และด้านมัลติโมดัล และค่อยๆ เชื่อมต่อกับธุรกิจต่างๆ เช่น สมาร์ทโฟน, รถยนต์, AIoT (อินเทอร์เน็ตของสิ่งต่าง ๆ ที่ใช้ AI), และหุ่นยนต์
ข้อมูลจาก: https://www.jiemian.com/article/12171559.html