MT GPU 01
|

Moore Threads ผู้ผลิตกราฟิกชิปจากจีน เปิดตัวกราฟิกชิปรุ่นใหม่ เล่นเกมดีขึ้นกว่ารุ่นก่อนหน้า 15 เท่า และรองรับ AI แบบจัดเต็ม

Moore Threads ผู้ผลิต GPU สัญชาติจีน เดินหน้ารุกตลาดชิปกราฟิกและ AI อย่างจริงจัง ด้วยการเปิดตัวสถาปัตยกรรมจีพียูรุ่นใหม่ “Huagang” (Flower Harbor) ควบคู่กับโครงสร้างพื้นฐานคลัสเตอร์ขนาดใหญ่และโน้ตบุ๊ก AI รุ่นแรกของบริษัท ท่ามกลางแรงกดดันจากข้อจำกัดด้านเทคโนโลยีของสหรัฐฯ และภาระขาดทุนสะสมที่ยังคงสูง

สถาปัตยกรรม Huagang และ GPU Lushan / Huashan

MT GPU 02

ที่งาน MUSA 2025 Summit เมื่อวันที่ 20 ธันวาคม Moore Threads เปิดตัวสถาปัตยกรรม “Huagang” ซึ่งจะเป็นฐานให้กับ GPU สองไลน์หลัก คือ Lushan สำหรับเกมมิ่งและคอนเทนต์ครีเอชัน และ Huashan สำหรับงาน AI และดาต้าเซ็นเตอร์ Zhang Jianzhong ผู้ก่อตั้งและซีอีโอ (อดีตรองประธาน NVIDIA ประจำประเทศจีน) ระบุว่า Huagang เพิ่มความหนาแน่นการประมวลผลได้ราว 50% และยกระดับประสิทธิภาพด้านพลังงานขึ้นถึงสิบเท่าเมื่อเทียบกับเจนก่อนของบริษัท เพื่อลดช่องว่างกับจีพียูระดับท็อปจากตะวันตก

MT GPU 01
  • ประสิทธิภาพเกม AAA (เกมกราฟิกหนักระดับสูง เช่น Genshin Impact, Cyberpunk) เพิ่มขึ้น 15 เท่า
  • ประสิทธิภาพ AI (เช่น AI up scaling, ray tracing) เพิ่มขึ้น 64 เท่า
  • การประมวลผลรูปทรง 3D (geometry processing) เพิ่มขึ้น 16 เท่า
  • การเติม纹เจอร์ (texture filling) เพิ่มขึ้น 4 เท่า
  • Ray tracing (การจำลองแสงเงาอย่างสมจริง) เพิ่มขึ้น 50 เท่า
  • การเข้าถึงหน่วยความจำระดับ atomic (สำคัญสำหรับการเรนเดอร์ซับซ้อน) เพิ่มขึ้น 8 เท่า
  • ความจุการแสดงผล (เช่น รองรับความละเอียดสูงกว่า หรือ multi-display) เพิ่มขึ้น 4 เท่า

ฝั่งเกมมิ่ง Lushan ถูกออกแบบมาให้รองรับ DirectX 12 Ultimate อย่างเต็มรูปแบบ พร้อมเคลมว่าประสิทธิภาพในเกม AAA สูงขึ้นถึง 15 เท่า และประสิทธิภาพเรย์เทรซิ่งดีขึ้นถึง 50 เท่าเมื่อเทียบกับจีพียูรุ่นก่อนของ Moore Threads เอง นอกจากนี้ยังเพิ่ม throughput สำหรับ geometry สูงสุด 16 เท่า และการประมวลผลด้าน AI สูงถึง 64 เท่า เพื่อรองรับงานอย่างอัปสเกลภาพ รีคอนสตรักชันเฟรม และเอฟเฟกต์กราฟิกที่ขับเคลื่อนด้วยแมชชีนเลิร์นนิง

ด้าน Huashan ซึ่งเป็นจีพียูสาย AI บริษัทระบุว่ารองรับตั้งแต่ FP64 สำหรับงาน HPC ไปจนถึงความละเอียดต่ำอย่าง FP4 รวมถึงฟอร์แมตเฉพาะภายในสำหรับงาน mixed precision เพื่อเพิ่มประสิทธิภาพการเทรนและอินเฟอร์เรนซ์โมเดลขนาดใหญ่ รายงานบางแหล่งระบุว่าเป้าหมายของ Huashan คือการเข้าใกล้หรือท้าชนระดับสมรรถนะของจีพียูสาย AI รุ่นล่าสุดจากตะวันตกทั้งด้าน compute และแบนด์วิดท์หน่วยความจำ โดยอาศัย MTLink อินเตอร์คอนเน็กต์ความเร็วสูงสำหรับสเกลคลัสเตอร์จำนวนมาก

MT GPU 03
  • MMA: รองรับ Mixed Precision Matrix Multiplication แบบครบถ้วน: TF32 / FP16 / BF16 / FP8 / FP6 / FP4 / INT8
  • ยกระดับประสิทธิภาพการคำนวณ tensor ในความแม่นยำต่ำ (FP6/FP4) อย่างมหาศาล
  • เพิ่มโหมด TCE-PAIR ใหม่ เพื่อเพิ่มการ reuse ข้อมูลภายใน (ลดการเข้าถึงหน่วยความจำภายนอก ทำให้เร็วและประหยัดพลังงานมากขึ้น)
  • เทคนิคการคำนวลผสม low-precision (เช่น MTFP8/6/4) เพื่อความเร็วสูง
  • รองรับรูปแบบ MXFP (คล้าย NVIDIA) และ NVFP พร้อมเทคนิคชดเชยความแม่นยำในตัว

คลัสเตอร์ Kua E และงาน LLM ระดับ Exa-Scale

เพื่อต่อยอดจากจีพียูใหม่ สถาปัตยกรรม Huagang ถูกผูกเข้ากับแพลตฟอร์มโครงสร้างพื้นฐาน “Kua E” ซึ่งออกแบบให้รองรับการเชื่อมต่อจีพียูได้สูงสุด 10,000 ตัวภายในคลัสเตอร์เดียว โดยให้กำลังประมวลผลรวมระดับ 10 Exa-Flops สำหรับงาน AI และ HPC รายละเอียดเชิงเทคนิคของระบบสื่อสารคาดว่าพึ่งพาเครือข่ายความเร็วสูงระดับ 400Gbps ต่อโหนด และโซลูชันสวิตช์ของฝั่งจีนมากขึ้นในอนาคต เนื่องจากบริษัทอยู่ในบัญชี Entity List ของสหรัฐฯ ทำให้การใช้ฮาร์ดแวร์เครือข่ายตะวันตกมีข้อจำกัด

ในการสาธิต Moore Threads ใช้จีพียู MTT S5000 รันโมเดล DeepSeek R1 ขนาด 671 พันล้านพารามิเตอร์ โดยอ้างว่าอินเฟอร์เรนซ์สามารถดัน prefill throughput ได้มากกว่า 4,000 tokens ต่อวินาที และ decode throughput มากกว่า 1,000 tokens ต่อวินาทีต่อจีพียูหนึ่งตัว บริษัทยังเปิดเผยตัวเลข utilization ของคลัสเตอร์ 10,000 จีพียู ว่าสามารถทำ MFU ได้ราว 60% สำหรับโมเดล dense และประมาณ 40% สำหรับโมเดล MOE พร้อมอัตราเวลามีประสิทธิผลมากกว่า 90% ของเวลารันจริง ซึ่งใช้เป็นหลักฐานโชว์ว่าระบบซอฟต์แวร์และเครือข่ายภายในเริ่มอยู่ในระดับที่รองรับงาน LLM ขนาดมหึมาได้

สำหรับตลาดจีนที่ต้องพึ่งพาชิปภายในประเทศมากขึ้นจากทั้งข้อจำกัดนำเข้าจากสหรัฐฯ และนโยบายรัฐที่ผลักดัน “ชิปจีน” คลัสเตอร์ Kua E กลายเป็นหมากยุทธศาสตร์ที่ช่วยให้ผู้ให้บริการคลาวด์และศูนย์ข้อมูลในจีนมีทางเลือกนอกเหนือจาก NVIDIA และ AMD หาก Moore Threads สามารถแปลง proof-of-concept นี้ให้กลายเป็น deployment เชิงพาณิชย์ขนาดใหญ่ได้จริง จะช่วยตอกย้ำบทบาทของบริษัทในฐานะผู้เล่นหลักใน ecosystem AI ของจีน

โน้ตบุ๊ก AI AIBOOK และ ecosystem ปลายทาง

อีกหนึ่งไฮไลต์คือการเปิดตัวโน้ตบุ๊ก AI รุ่นแรก “MTT AIBOOK” ที่ใช้ชิป SoC ตระกูล Changjiang ซึ่งรวม CPU และ GPU ที่ออกแบบเองเข้าด้วยกัน เพื่อรองรับงาน AI บนดีไวซ์ปลายทางโดยตรง รุ่นเปิดตัวมาพร้อมหน่วยความจำ 32GB และสโตเรจ 1TB พร้อมเคลมกำลังประมวลผล AI สูงสุด 50 TOPS ตั้งราคาที่ 9,999 หยวน และวางกำหนดวางขายในวันที่ 10 มกราคม 2026 เจาะกลุ่มนักพัฒนาและผู้ใช้มืออาชีพที่ต้องการอุปกรณ์พกพาสำหรับรันโมเดลขนาดกลางในเครื่อง

การมีฮาร์ดแวร์ตั้งแต่ระดับศูนย์ข้อมูลจนถึงระดับพีซีพกพาช่วยให้ Moore Threads สร้าง ecosystem ซอฟต์แวร์และเครื่องมือพัฒนาในแบบ “ปลายทางถึงปลายทาง” ได้มากขึ้น นักพัฒนาที่ปรับแต่งและทดสอบโมเดลบน AIBOOK สามารถย้ายเวิร์กโหลดไปยังคลัสเตอร์ Kua E หรือจีพียูในศูนย์ข้อมูลที่ใช้สถาปัตยกรรมเดียวกันได้สะดวกขึ้น ซึ่งช่วยลดอุปสรรคการย้ายแพลตฟอร์มจากโซลูชันสหรัฐฯ มายังแพลตฟอร์มจีน

ภาพรวมธุรกิจ IPO ขนาดใหญ่และความท้าทาย

ด้านการเงิน Moore Threads เพิ่งสร้างสถิติ IPO ครั้งใหญ่ในตลาดหลักทรัพย์เซี่ยงไฮ้ โดยระดมทุนได้ราว 1.1 พันล้านดอลลาร์สหรัฐ และราคาหุ้นวันแรกพุ่งขึ้นราว 500% จากราคาเสนอขาย ทำให้มูลค่าบริษัทแตะระดับราว 300,000 ล้านหยวน ซึ่งสะท้อนความคาดหวังมหาศาลของนักลงทุนต่ออนาคตของบริษัท อย่างไรก็ตาม นักวิเคราะห์เตือนว่าราคาดังกล่าวได้ “ลงราคา” การเติบโตหลายปีข้างหน้าไปแล้ว โดยสมมติฐานในเอกสารชี้ชวนประเมินว่ารายได้อาจพุ่งแตะเกือบ 6 พันล้านหยวนในปี 2027 พร้อมมาร์จิ้นขั้นต้นที่ประมาณ 61%

ในปัจจุบัน Moore Threads ยังขาดทุนอย่างต่อเนื่อง โดยมีตัวเลขขาดทุนสุทธิประมาณ 1.8 พันล้านหยวนในปี 2022, 1.7 พันล้านหยวนในปี 2023, 1.5 พันล้านหยวนในปี 2024 และราว 270 ล้านหยวนในครึ่งแรกของปี 2025 ขณะที่รายได้เติบโตจากเพียง 46 ล้านหยวนในปี 2022 มาเป็น 438 ล้านหยวนในปี 2024 และ 702 ล้านหยวนในครึ่งแรกของปี 2025 โดยบริษัทประเมินว่ามีโอกาสเริ่มทำกำไรรวมระดับกลุ่มบริษัทได้เร็วสุดราวปี 2027 หากสามารถเร่งสเกลยอดขายจีพียูและแพลตฟอร์ม AI ได้ตามเป้า

ชื่อผลิตภัณฑ์หรือสถาปัตยกรรมประเภทคุณสมบัติและประสิทธิภาพที่สำคัญกลุ่มเป้าหมายหรือการประยุกต์ใช้งานปีที่คาดว่าจะเปิดตัวหรือพร้อมใช้งานความเข้ากันได้ของระบบหรือเทคโนโลยี (Inferred)
Huagangสถาปัตยกรรม GPU (Architecture)ชุดคำสั่งใหม่เพิ่มความหนาแน่นการประมวลผล 50%, ประสิทธิภาพการใช้พลังงานดีขึ้น 10 เท่า, รองรับการประมวลผล FP8/FP6/FP4, รองรับคลัสเตอร์ระดับ 100,000 การ์ดการฝึกโมเดล AI ขนาดใหญ่ (LLM Training), การเรนเดอร์กราฟิกขั้นสูง, Ray Tracing ยุคที่ 22025MUSA 5.0, DX12 Ultimate, Ray Tracing (Hardware Accelerated), Scale-up (MT Link 4.0/Ethernet-like protocol)
HuashanAI SoC / Chipประสิทธิภาพการคำนวณ Floating Point สูง (อยู่ระหว่าง B100 และ Hopper), แบนด์วิดท์หน่วยความจำระดับแนวหน้า, รองรับ MT Link 4.0การฝึกและการอนุมานโมเดล AI (AI Training & Inference), การประมวลผลอัจฉริยะ (Super Intelligence)2025MUSA 5.0, Asynchronous Programming Model, LLM Acceleration Engine, MT Link 4.0
LushanGPU ประมวลผลกราฟิกมืออาชีพประสิทธิภาพเกมดีขึ้น 15 เท่าเมื่อเทียบกับ S80, พลังประมวลผล AI เพิ่มขึ้น 64 เท่า, ประสิทธิภาพ Ray Tracing เพิ่มขึ้น 50 เท่างานกราฟิกมืออาชีพ (CAD/CAE), การออกแบบอุตสาหกรรม, เกมระดับ AAA2025MUSA 5.0, AGR (AI Based Generative Rendering), DX12 Ultimate, Unified Task Engine
ChangjiangAI SoC (Super SoC)รวม CPU, GPU, NPU, VPU, DPU, DSP และ ISP ไว้ในชิปเดียว, ประสิทธิภาพสูงสำหรับการประมวลผลที่ปลายทาง (Edge Computing)หุ่นยนต์อัจฉริยะ (Embodied AI), อุปกรณ์พกพา, การประมวลผล Edge AI2025MUSA 5.0, ROS 2, Linux, Android Container
Kua’eAI Clusterพลังประมวลผล Floating Point ระดับ 10 Exaflops, MFU สูงกว่า 60%, ประสิทธิภาพการปรับขนาด 95%โรงงาน AI (AI Factory), การฝึกโมเดลขนาดใหญ่ระดับล้านล้านพารามิเตอร์เปิดตัวปี 2024 (พร้อมใช้งาน)MUSA 5.0, Kua’e Software Stack, FP8/FP16 Support
MTT AI Bookคอมพิวเตอร์พกพา (AI Notebook / Computing Book)ใช้ชิป Changjiang, รองรับระบบปฏิบัติการหลายตัว, ติดตั้งเครื่องมือพัฒนา AI มาล่วงหน้า (PyTorch, Docker, VS Code)นักพัฒนา AI, งานสร้างสรรค์, การเรียนรู้การเขียนโปรแกรม MUSAมกราคม 2025 (เริ่มจัดส่ง)MUSA AIOS (Linux-based), Windows VM support, Android Container
MTT AI Cubeเวิร์กสเตชันขนาดเล็ก / AI Stationจุดศูนย์กลางข้อมูลส่วนบุคคล (Personal Data Center), รองรับการประมวลผล AI ภายในบ้านAI NAS (การจัดการข้อมูลในบ้าน), ศูนย์กลางสมาร์ทโฮม, งานสำนักงานทั่วไป2025 (Inferred)MUSA 5.0, Digital Human Support, Local Data Encryption
MUSA 5.0ซอฟต์แวร์สแต็คและระบบนิเวศประสิทธิภาพการคำนวณ GEMM สูงถึง 98%, การสื่อสาร 97%, รองรับภาษา Mulan และชุดเครื่องมือ MTXนักพัฒนาซอฟต์แวร์ GPU, การวิจัย AI, กราฟิกและการจำลองทางฟิสิกส์เปิดตัวพร้อมใช้ทันที (2024/2025)รองรับ CPU/OS จีนและสากล, PyTorch, Triton, DX12, Linux

แรงกดดันด้านภูมิรัฐศาสตร์และความหมายต่ออุตสาหกรรมจีน

อีกปัจจัยที่หลีกเลี่ยงไม่ได้คือการที่ Moore Threads ถูกกระทรวงพาณิชย์สหรัฐขึ้นบัญชีในรายการ Entity List ตั้งแต่ปี 2023 ส่งผลให้การเข้าถึงเทคโนโลยีกระบวนการผลิตและฮาร์ดแวร์บางประเภทจากสหรัฐฯ ถูกจำกัดอย่างมาก สถานะดังกล่าวทำให้บริษัทต้องพึ่งพา supply chain ภายในประเทศจีนและพันธมิตรในเอเชียมากขึ้น ทั้งในแง่โรงงานผลิต ชิปเครือข่าย ไปจนถึงซอฟต์แวร์และเครื่องมือพัฒนา เพื่อหลีกเลี่ยงความเสี่ยงด้านข้อกำกับจากต่างประเทศ

ในภาพใหญ่ การเปิดตัว Huagang, Lushan, Huashan, คลัสเตอร์ Kua E และโน้ตบุ๊ก AIBOOK จึงไม่ได้เป็นเพียงการออกผลิตภัณฑ์ใหม่ แต่ยังเป็นการประกาศว่าอุตสาหกรรมจีพียูของจีนกำลังก้าวจากสถานะ “ผู้ตาม” ไปสู่การมีแพลตฟอร์มของตนเองทั้งห่วงโซ่ตั้งแต่ชิปจนถึงคลาวด์ คำถามสำคัญถัดไปคือ Moore Threads จะพิสูจน์ได้มากน้อยแค่ไหนว่าตัวเลขเคลมด้านประสิทธิภาพและสเกลสามารถแปลงเป็น deployment จริงในตลาด และจะรักษาสมดุลระหว่างการเผาเงินลงทุนเพื่อวิจัยพัฒนา กับความจำเป็นต้องแสดงศักยภาพทำกำไรให้ทันตามเส้นเวลาที่นักลงทุนและรัฐจีนคาดหวังได้หรือไม่

ข้อมูล: FUTUBULL