Moore Threads ผู้ผลิต GPU สัญชาติจีน เดินหน้ารุกตลาดชิปกราฟิกและ AI อย่างจริงจัง ด้วยการเปิดตัวสถาปัตยกรรมจีพียูรุ่นใหม่ “Huagang” (Flower Harbor) ควบคู่กับโครงสร้างพื้นฐานคลัสเตอร์ขนาดใหญ่และโน้ตบุ๊ก AI รุ่นแรกของบริษัท ท่ามกลางแรงกดดันจากข้อจำกัดด้านเทคโนโลยีของสหรัฐฯ และภาระขาดทุนสะสมที่ยังคงสูง

สถาปัตยกรรม Huagang และ GPU Lushan / Huashan

ที่งาน MUSA 2025 Summit เมื่อวันที่ 20 ธันวาคม Moore Threads เปิดตัวสถาปัตยกรรม “Huagang” ซึ่งจะเป็นฐานให้กับ GPU สองไลน์หลัก คือ Lushan สำหรับเกมมิ่งและคอนเทนต์ครีเอชัน และ Huashan สำหรับงาน AI และดาต้าเซ็นเตอร์ Zhang Jianzhong ผู้ก่อตั้งและซีอีโอ (อดีตรองประธาน NVIDIA ประจำประเทศจีน) ระบุว่า Huagang เพิ่มความหนาแน่นการประมวลผลได้ราว 50% และยกระดับประสิทธิภาพด้านพลังงานขึ้นถึงสิบเท่าเมื่อเทียบกับเจนก่อนของบริษัท เพื่อลดช่องว่างกับจีพียูระดับท็อปจากตะวันตก

ประสิทธิภาพเกม AAA (เกมกราฟิกหนักระดับสูง เช่น Genshin Impact, Cyberpunk) เพิ่มขึ้น 15 เท่า
ประสิทธิภาพ AI (เช่น AI up scaling, ray tracing) เพิ่มขึ้น 64 เท่า
การประมวลผลรูปทรง 3D (geometry processing) เพิ่มขึ้น 16 เท่า
การเติม纹เจอร์ (texture filling) เพิ่มขึ้น 4 เท่า
Ray tracing (การจำลองแสงเงาอย่างสมจริง) เพิ่มขึ้น 50 เท่า
การเข้าถึงหน่วยความจำระดับ atomic (สำคัญสำหรับการเรนเดอร์ซับซ้อน) เพิ่มขึ้น 8 เท่า
ความจุการแสดงผล (เช่น รองรับความละเอียดสูงกว่า หรือ multi-display) เพิ่มขึ้น 4 เท่า

ฝั่งเกมมิ่ง Lushan ถูกออกแบบมาให้รองรับ DirectX 12 Ultimate อย่างเต็มรูปแบบ พร้อมเคลมว่าประสิทธิภาพในเกม AAA สูงขึ้นถึง 15 เท่า และประสิทธิภาพเรย์เทรซิ่งดีขึ้นถึง 50 เท่าเมื่อเทียบกับจีพียูรุ่นก่อนของ Moore Threads เอง นอกจากนี้ยังเพิ่ม throughput สำหรับ geometry สูงสุด 16 เท่า และการประมวลผลด้าน AI สูงถึง 64 เท่า เพื่อรองรับงานอย่างอัปสเกลภาพ รีคอนสตรักชันเฟรม และเอฟเฟกต์กราฟิกที่ขับเคลื่อนด้วยแมชชีนเลิร์นนิง

ด้าน Huashan ซึ่งเป็นจีพียูสาย AI บริษัทระบุว่ารองรับตั้งแต่ FP64 สำหรับงาน HPC ไปจนถึงความละเอียดต่ำอย่าง FP4 รวมถึงฟอร์แมตเฉพาะภายในสำหรับงาน mixed precision เพื่อเพิ่มประสิทธิภาพการเทรนและอินเฟอร์เรนซ์โมเดลขนาดใหญ่ รายงานบางแหล่งระบุว่าเป้าหมายของ Huashan คือการเข้าใกล้หรือท้าชนระดับสมรรถนะของจีพียูสาย AI รุ่นล่าสุดจากตะวันตกทั้งด้าน compute และแบนด์วิดท์หน่วยความจำ โดยอาศัย MTLink อินเตอร์คอนเน็กต์ความเร็วสูงสำหรับสเกลคลัสเตอร์จำนวนมาก

MMA: รองรับ Mixed Precision Matrix Multiplication แบบครบถ้วน: TF32 / FP16 / BF16 / FP8 / FP6 / FP4 / INT8
ยกระดับประสิทธิภาพการคำนวณ tensor ในความแม่นยำต่ำ (FP6/FP4) อย่างมหาศาล
เพิ่มโหมด TCE-PAIR ใหม่ เพื่อเพิ่มการ reuse ข้อมูลภายใน (ลดการเข้าถึงหน่วยความจำภายนอก ทำให้เร็วและประหยัดพลังงานมากขึ้น)
เทคนิคการคำนวลผสม low-precision (เช่น MTFP8/6/4) เพื่อความเร็วสูง
รองรับรูปแบบ MXFP (คล้าย NVIDIA) และ NVFP พร้อมเทคนิคชดเชยความแม่นยำในตัว

คลัสเตอร์ Kua E และงาน LLM ระดับ Exa-Scale

เพื่อต่อยอดจากจีพียูใหม่ สถาปัตยกรรม Huagang ถูกผูกเข้ากับแพลตฟอร์มโครงสร้างพื้นฐาน “Kua E” ซึ่งออกแบบให้รองรับการเชื่อมต่อจีพียูได้สูงสุด 10,000 ตัวภายในคลัสเตอร์เดียว โดยให้กำลังประมวลผลรวมระดับ 10 Exa-Flops สำหรับงาน AI และ HPC รายละเอียดเชิงเทคนิคของระบบสื่อสารคาดว่าพึ่งพาเครือข่ายความเร็วสูงระดับ 400Gbps ต่อโหนด และโซลูชันสวิตช์ของฝั่งจีนมากขึ้นในอนาคต เนื่องจากบริษัทอยู่ในบัญชี Entity List ของสหรัฐฯ ทำให้การใช้ฮาร์ดแวร์เครือข่ายตะวันตกมีข้อจำกัด

ในการสาธิต Moore Threads ใช้จีพียู MTT S5000 รันโมเดล DeepSeek R1 ขนาด 671 พันล้านพารามิเตอร์ โดยอ้างว่าอินเฟอร์เรนซ์สามารถดัน prefill throughput ได้มากกว่า 4,000 tokens ต่อวินาที และ decode throughput มากกว่า 1,000 tokens ต่อวินาทีต่อจีพียูหนึ่งตัว บริษัทยังเปิดเผยตัวเลข utilization ของคลัสเตอร์ 10,000 จีพียู ว่าสามารถทำ MFU ได้ราว 60% สำหรับโมเดล dense และประมาณ 40% สำหรับโมเดล MOE พร้อมอัตราเวลามีประสิทธิผลมากกว่า 90% ของเวลารันจริง ซึ่งใช้เป็นหลักฐานโชว์ว่าระบบซอฟต์แวร์และเครือข่ายภายในเริ่มอยู่ในระดับที่รองรับงาน LLM ขนาดมหึมาได้

สำหรับตลาดจีนที่ต้องพึ่งพาชิปภายในประเทศมากขึ้นจากทั้งข้อจำกัดนำเข้าจากสหรัฐฯ และนโยบายรัฐที่ผลักดัน “ชิปจีน” คลัสเตอร์ Kua E กลายเป็นหมากยุทธศาสตร์ที่ช่วยให้ผู้ให้บริการคลาวด์และศูนย์ข้อมูลในจีนมีทางเลือกนอกเหนือจาก NVIDIA และ AMD หาก Moore Threads สามารถแปลง proof-of-concept นี้ให้กลายเป็น deployment เชิงพาณิชย์ขนาดใหญ่ได้จริง จะช่วยตอกย้ำบทบาทของบริษัทในฐานะผู้เล่นหลักใน ecosystem AI ของจีน

โน้ตบุ๊ก AI AIBOOK และ ecosystem ปลายทาง

อีกหนึ่งไฮไลต์คือการเปิดตัวโน้ตบุ๊ก AI รุ่นแรก “MTT AIBOOK” ที่ใช้ชิป SoC ตระกูล Changjiang ซึ่งรวม CPU และ GPU ที่ออกแบบเองเข้าด้วยกัน เพื่อรองรับงาน AI บนดีไวซ์ปลายทางโดยตรง รุ่นเปิดตัวมาพร้อมหน่วยความจำ 32GB และสโตเรจ 1TB พร้อมเคลมกำลังประมวลผล AI สูงสุด 50 TOPS ตั้งราคาที่ 9,999 หยวน และวางกำหนดวางขายในวันที่ 10 มกราคม 2026 เจาะกลุ่มนักพัฒนาและผู้ใช้มืออาชีพที่ต้องการอุปกรณ์พกพาสำหรับรันโมเดลขนาดกลางในเครื่อง

การมีฮาร์ดแวร์ตั้งแต่ระดับศูนย์ข้อมูลจนถึงระดับพีซีพกพาช่วยให้ Moore Threads สร้าง ecosystem ซอฟต์แวร์และเครื่องมือพัฒนาในแบบ “ปลายทางถึงปลายทาง” ได้มากขึ้น นักพัฒนาที่ปรับแต่งและทดสอบโมเดลบน AIBOOK สามารถย้ายเวิร์กโหลดไปยังคลัสเตอร์ Kua E หรือจีพียูในศูนย์ข้อมูลที่ใช้สถาปัตยกรรมเดียวกันได้สะดวกขึ้น ซึ่งช่วยลดอุปสรรคการย้ายแพลตฟอร์มจากโซลูชันสหรัฐฯ มายังแพลตฟอร์มจีน

ภาพรวมธุรกิจ IPO ขนาดใหญ่และความท้าทาย

ด้านการเงิน Moore Threads เพิ่งสร้างสถิติ IPO ครั้งใหญ่ในตลาดหลักทรัพย์เซี่ยงไฮ้ โดยระดมทุนได้ราว 1.1 พันล้านดอลลาร์สหรัฐ และราคาหุ้นวันแรกพุ่งขึ้นราว 500% จากราคาเสนอขาย ทำให้มูลค่าบริษัทแตะระดับราว 300,000 ล้านหยวน ซึ่งสะท้อนความคาดหวังมหาศาลของนักลงทุนต่ออนาคตของบริษัท อย่างไรก็ตาม นักวิเคราะห์เตือนว่าราคาดังกล่าวได้ “ลงราคา” การเติบโตหลายปีข้างหน้าไปแล้ว โดยสมมติฐานในเอกสารชี้ชวนประเมินว่ารายได้อาจพุ่งแตะเกือบ 6 พันล้านหยวนในปี 2027 พร้อมมาร์จิ้นขั้นต้นที่ประมาณ 61%

ในปัจจุบัน Moore Threads ยังขาดทุนอย่างต่อเนื่อง โดยมีตัวเลขขาดทุนสุทธิประมาณ 1.8 พันล้านหยวนในปี 2022, 1.7 พันล้านหยวนในปี 2023, 1.5 พันล้านหยวนในปี 2024 และราว 270 ล้านหยวนในครึ่งแรกของปี 2025 ขณะที่รายได้เติบโตจากเพียง 46 ล้านหยวนในปี 2022 มาเป็น 438 ล้านหยวนในปี 2024 และ 702 ล้านหยวนในครึ่งแรกของปี 2025 โดยบริษัทประเมินว่ามีโอกาสเริ่มทำกำไรรวมระดับกลุ่มบริษัทได้เร็วสุดราวปี 2027 หากสามารถเร่งสเกลยอดขายจีพียูและแพลตฟอร์ม AI ได้ตามเป้า

ชื่อผลิตภัณฑ์หรือสถาปัตยกรรม	ประเภท	คุณสมบัติและประสิทธิภาพที่สำคัญ	กลุ่มเป้าหมายหรือการประยุกต์ใช้งาน	ปีที่คาดว่าจะเปิดตัวหรือพร้อมใช้งาน	ความเข้ากันได้ของระบบหรือเทคโนโลยี (Inferred)
Huagang	สถาปัตยกรรม GPU (Architecture)	ชุดคำสั่งใหม่เพิ่มความหนาแน่นการประมวลผล 50%, ประสิทธิภาพการใช้พลังงานดีขึ้น 10 เท่า, รองรับการประมวลผล FP8/FP6/FP4, รองรับคลัสเตอร์ระดับ 100,000 การ์ด	การฝึกโมเดล AI ขนาดใหญ่ (LLM Training), การเรนเดอร์กราฟิกขั้นสูง, Ray Tracing ยุคที่ 2	2025	MUSA 5.0, DX12 Ultimate, Ray Tracing (Hardware Accelerated), Scale-up (MT Link 4.0/Ethernet-like protocol)
Huashan	AI SoC / Chip	ประสิทธิภาพการคำนวณ Floating Point สูง (อยู่ระหว่าง B100 และ Hopper), แบนด์วิดท์หน่วยความจำระดับแนวหน้า, รองรับ MT Link 4.0	การฝึกและการอนุมานโมเดล AI (AI Training & Inference), การประมวลผลอัจฉริยะ (Super Intelligence)	2025	MUSA 5.0, Asynchronous Programming Model, LLM Acceleration Engine, MT Link 4.0
Lushan	GPU ประมวลผลกราฟิกมืออาชีพ	ประสิทธิภาพเกมดีขึ้น 15 เท่าเมื่อเทียบกับ S80, พลังประมวลผล AI เพิ่มขึ้น 64 เท่า, ประสิทธิภาพ Ray Tracing เพิ่มขึ้น 50 เท่า	งานกราฟิกมืออาชีพ (CAD/CAE), การออกแบบอุตสาหกรรม, เกมระดับ AAA	2025	MUSA 5.0, AGR (AI Based Generative Rendering), DX12 Ultimate, Unified Task Engine
Changjiang	AI SoC (Super SoC)	รวม CPU, GPU, NPU, VPU, DPU, DSP และ ISP ไว้ในชิปเดียว, ประสิทธิภาพสูงสำหรับการประมวลผลที่ปลายทาง (Edge Computing)	หุ่นยนต์อัจฉริยะ (Embodied AI), อุปกรณ์พกพา, การประมวลผล Edge AI	2025	MUSA 5.0, ROS 2, Linux, Android Container
Kua’e	AI Cluster	พลังประมวลผล Floating Point ระดับ 10 Exaflops, MFU สูงกว่า 60%, ประสิทธิภาพการปรับขนาด 95%	โรงงาน AI (AI Factory), การฝึกโมเดลขนาดใหญ่ระดับล้านล้านพารามิเตอร์	เปิดตัวปี 2024 (พร้อมใช้งาน)	MUSA 5.0, Kua’e Software Stack, FP8/FP16 Support
MTT AI Book	คอมพิวเตอร์พกพา (AI Notebook / Computing Book)	ใช้ชิป Changjiang, รองรับระบบปฏิบัติการหลายตัว, ติดตั้งเครื่องมือพัฒนา AI มาล่วงหน้า (PyTorch, Docker, VS Code)	นักพัฒนา AI, งานสร้างสรรค์, การเรียนรู้การเขียนโปรแกรม MUSA	มกราคม 2025 (เริ่มจัดส่ง)	MUSA AIOS (Linux-based), Windows VM support, Android Container
MTT AI Cube	เวิร์กสเตชันขนาดเล็ก / AI Station	จุดศูนย์กลางข้อมูลส่วนบุคคล (Personal Data Center), รองรับการประมวลผล AI ภายในบ้าน	AI NAS (การจัดการข้อมูลในบ้าน), ศูนย์กลางสมาร์ทโฮม, งานสำนักงานทั่วไป	2025 (Inferred)	MUSA 5.0, Digital Human Support, Local Data Encryption
MUSA 5.0	ซอฟต์แวร์สแต็คและระบบนิเวศ	ประสิทธิภาพการคำนวณ GEMM สูงถึง 98%, การสื่อสาร 97%, รองรับภาษา Mulan และชุดเครื่องมือ MTX	นักพัฒนาซอฟต์แวร์ GPU, การวิจัย AI, กราฟิกและการจำลองทางฟิสิกส์	เปิดตัวพร้อมใช้ทันที (2024/2025)	รองรับ CPU/OS จีนและสากล, PyTorch, Triton, DX12, Linux

แรงกดดันด้านภูมิรัฐศาสตร์และความหมายต่ออุตสาหกรรมจีน

อีกปัจจัยที่หลีกเลี่ยงไม่ได้คือการที่ Moore Threads ถูกกระทรวงพาณิชย์สหรัฐขึ้นบัญชีในรายการ Entity List ตั้งแต่ปี 2023 ส่งผลให้การเข้าถึงเทคโนโลยีกระบวนการผลิตและฮาร์ดแวร์บางประเภทจากสหรัฐฯ ถูกจำกัดอย่างมาก สถานะดังกล่าวทำให้บริษัทต้องพึ่งพา supply chain ภายในประเทศจีนและพันธมิตรในเอเชียมากขึ้น ทั้งในแง่โรงงานผลิต ชิปเครือข่าย ไปจนถึงซอฟต์แวร์และเครื่องมือพัฒนา เพื่อหลีกเลี่ยงความเสี่ยงด้านข้อกำกับจากต่างประเทศ

ในภาพใหญ่ การเปิดตัว Huagang, Lushan, Huashan, คลัสเตอร์ Kua E และโน้ตบุ๊ก AIBOOK จึงไม่ได้เป็นเพียงการออกผลิตภัณฑ์ใหม่ แต่ยังเป็นการประกาศว่าอุตสาหกรรมจีพียูของจีนกำลังก้าวจากสถานะ “ผู้ตาม” ไปสู่การมีแพลตฟอร์มของตนเองทั้งห่วงโซ่ตั้งแต่ชิปจนถึงคลาวด์ คำถามสำคัญถัดไปคือ Moore Threads จะพิสูจน์ได้มากน้อยแค่ไหนว่าตัวเลขเคลมด้านประสิทธิภาพและสเกลสามารถแปลงเป็น deployment จริงในตลาด และจะรักษาสมดุลระหว่างการเผาเงินลงทุนเพื่อวิจัยพัฒนา กับความจำเป็นต้องแสดงศักยภาพทำกำไรให้ทันตามเส้นเวลาที่นักลงทุนและรัฐจีนคาดหวังได้หรือไม่

ข้อมูล: FUTUBULL

สถาปัตยกรรม Huagang และ GPU Lushan / Huashan

คลัสเตอร์ Kua E และงาน LLM ระดับ Exa-Scale

โน้ตบุ๊ก AI AIBOOK และ ecosystem ปลายทาง

ภาพรวมธุรกิจ IPO ขนาดใหญ่และความท้าทาย

แรงกดดันด้านภูมิรัฐศาสตร์และความหมายต่ออุตสาหกรรมจีน

Last update:

Beginner's Guide: