DeepSeek AI เปิดตัว DeepSeek-V3.2-Exp โมเดล AI รุ่นใหม่ เพิ่มประสิทธิภาพการประมวลผลบริบทที่ยาวขึ้น ด้วยเทคโนโลยี DSA
DeepSeek AI บริษัทพัฒนาเทคโนโลยีปัญญาประดิษฐ์จากจีน ได้ประกาศเปิดตัว DeepSeek-V3.2-Exp โมเดลภาษาขนาดใหญ่ (Large Language Model) เวอร์ชันทดลองล่าสุด เมื่อวันที่ 29 กันยายนที่ผ่านมา โดยถือเป็นก้าวสำคัญสู่รุ่นถัดไปของซีรีส์ DeepSeek V3 ซึ่งพัฒนาต่อเนื่องจาก DeepSeek-V3.1-Terminus ที่เปิดตัวก่อนหน้านี้
โมเดล V3.2-Exp นี้มุ่งเน้นการปรับปรุงประสิทธิภาพการประมวลผล โดยนำเสนอเทคโนโลยี DeepSeek Sparse Attention (DSA) ซึ่งเป็นกลไกการให้ความสนใจแบบ sparse (บางส่วน) ที่ละเอียดยิบ ช่วยให้การฝึกและการอนุมาน (inference) ทำงานได้เร็วกว่าและประหยัดทรัพยากรการคำนวณ โดยเฉพาะในบริบทข้อความยาว (long contexts) โดยไม่กระทบต่อคุณภาพผลลัพธ์มากนัก DSA นี้ช่วยลดต้นทุนการคำนวณลงอย่างมีนัยสำคัญ ขณะที่ยังคงกระบวนการ post-training และชุดข้อมูลเดิมจาก V3.1-Terminus
DeepSeek Sparse Attention (DSA) คือเทคนิค sparse attention แบบ fine-grained ที่ DeepSeek AI พัฒนาขึ้นเองใหม่สำหรับโมเดล DeepSeek-V3.2-Exp โดยปรับปรุงจากเวอร์ชันก่อนหน้า (V3.1-Terminus) เพื่อให้การคำนวณ attention มีประสิทธิภาพสูงขึ้น โดยเฉพาะกับ long contexts ลดต้นทุนการคำนวณลงอย่างมากแต่ยังคงคุณภาพผลลัพธ์ใกล้เคียงเดิม
จากผลทดสอบเบนช์มาร์กเบื้องต้น พบว่า DeepSeek-V3.2-Exp มีประสิทธิภาพใกล้เคียงกับ V3.1-Terminus ในด้านต่างๆ เช่น การตอบคำถาม การใช้เหตุผล และการสร้างสรรค์เนื้อหา ซึ่งถือเป็นหลักฐานว่าการนำ DSA มาใช้ไม่ลดทอนความสามารถของโมเดล แต่กลับเสริมจุดแข็งด้านประสิทธิภาพ นอกจากนี้ DeepSeek AI ยังได้อัปเกรดบริการ deepseek-chat และ deepseek-reasoner ให้ใช้ V3.2-Exp แล้ว โดยผู้ใช้สามารถเข้าถึงได้ทันทีผ่านแอปพลิเคชัน เว็บไซต์ และ API
สำหรับการใช้งาน โมเดลนี้เปิดให้ดาวน์โหลดฟรีในรูปแบบ open source บนแพลตฟอร์ม Hugging Face และรองรับการรันบน GPU เช่น 8xH200 หรือ H20 ผ่านเครื่องมือ vLLM รายงานทางเทคนิคฉบับสมบูรณ์สามารถดาวน์โหลดได้จาก GitHib ซึ่งรวมถึงเคอร์เนล GPU สำคัญในภาษา TileLang และ CUDA เพื่อการพัฒนาต้นแบบวิจัยที่รวดเร็ว

จุดเด่นอีกประการคือ DeepSeek AI ได้ปรับลดราคาค่าบริการ API ลงกว่า 50% ทันที โดยราคาต่อ 1 ล้านโทเค็น input ลดเหลือต่ำกว่า 3 เซ็นต์ (ประมาณ 1 บาท) ซึ่งจะช่วยให้ผู้พัฒนาและธุรกิจเข้าถึงเทคโนโลยี AI ระดับสูงได้ง่ายขึ้น”DeepSeek-V3.2-Exp คือจุดเริ่มต้นของการทดลองเทคโนโลยีใหม่ที่มุ่งสู่รุ่นถัดไปของ DeepSeek โดยเราหวังว่าจะได้รับ feedback จากชุมชนเพื่อปรับปรุงต่อไป” แถลงการณ์จาก DeepSeek AI ระบุ สำหรับผู้ที่ต้องการเปรียบเทียบ V3.1-Terminus ยังคงใช้งานได้ชั่วคราวผ่าน API จนถึงวันที่ 15 ตุลาคม 2568 (UTC) และสามารถส่งความเห็นเกี่ยวกับ DSA ได้ที่ https://feedback.deepseek.com/dsa
การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางการแข่งขันด้าน AI ที่รุนแรง โดย DeepSeek AI ซึ่งก่อตั้งในปี 2566 ได้กลายเป็นผู้เล่นหลักจากจีน ต่อยอดจาก DeepSeek-V3 ที่เปิดตัวในเดือนธันวาคม 2567 ซึ่งมีพารามิเตอร์กว่า 400 พันล้านตัว นักวิเคราะห์คาดว่า V3.2-Exp จะเป็นฐานสำคัญสำหรับโมเดลรุ่นใหญ่ในอนาคต ช่วยให้ DeepSeek แข่งขันกับยักษ์ใหญ่อย่าง OpenAI และ Google ได้ดียิ่งขึ้น ผู้สนใจสามารถติดตามข้อมูลเพิ่มเติมได้ที่เว็บไซต์อย่างเป็นทางการของ DeepSeek AI (https://api-docs.deepseek.com)