ByteDance
|

ByteDance เปิดตัว Seed-OSS-36B โมเดล AI แบบ Open-Source ที่ทรงพลังและยืดหยุ่น

ByteDance บริษัทเทคโนโลยีชั้นนำจากจีน ผู้อยู่เบื้องหลัง TikTok เปิดตัว Seed-OSS-36B โมเดลภาษาขนาดใหญ่ (Large Language Model) แบบ open-source ที่มีพารามิเตอร์ถึง 36 พันล้านตัว ภายใต้การพัฒนาของทีม Seed พร้อมให้ใช้งานฟรีผ่านใบอนุญาต Apache-2.0 บนแพลตฟอร์ม Hugging Face และ GitHub นับเป็นก้าวสำคัญที่อาจเปลี่ยนเกมการแข่งขันในวงการ AI ระดับโลก

Seed-OSS-36B: ทรงพลังและยืดหยุ่น

Seed-OSS-36B ประกอบด้วยสามรุ่นย่อย: Seed-OSS-36B-Base (มีและไม่มีข้อมูลสังเคราะห์) และ Seed-OSS-36B-Instruct โดยโมเดลนี้ถูกออกแบบมาให้ตอบโจทย์ทั้งนักวิจัยและนักพัฒนา ด้วยจุดเด่นที่เหนือชั้นดังนี้:

  • บริบทขนาดยาว: รองรับบริบท (Context) สูงสุดถึง 512,000 โทเค็น มากกว่า GPT-5 (256,000 โทเค็น) และ DeepSeek V3.1 (128,000 โทเค็น) ทำให้เหมาะสำหรับงานที่ต้องประมวลผลเอกสารยาวหรือการสนทนาที่ซับซ้อน
  • ควบคุมการใช้เหตุผล: ฟีเจอร์ “Thinking Budget” ช่วยให้ผู้ใช้ปรับความยาวของการประมวลผลเหตุผลได้ตามความซับซ้อนของงาน ตั้งแต่ 512 โทเค็นสำหรับงานง่าย ไปจนถึงระดับสูงสำหรับงานยาก เช่น การแก้โจทย์คณิตศาสตร์หรือเขียนโค้ด
  • ประสิทธิภาพระดับแนวหน้า: รุ่น Instruct ทำคะแนนได้ 91.7% ใน AIME24 (การสอบคณิตศาสตร์ระดับมัธยม) และ 67.4 ใน LiveCodeBench (การเขียนโค้ด) ซึ่งเป็นผลงานระดับ state-of-the-art ในหมู่โมเดล open-source ส่วนรุ่น Base (ที่มีข้อมูลสังเคราะห์) ได้คะแนน 65.1 ใน MMLU-Pro และ 81.7 ใน MATH
  • รองรับหลายภาษา: ได้คะแนน 78.4 ใน MMMLU multilingual benchmark ทำให้เหมาะสำหรับการใช้งานในระดับสากล

ออกแบบเพื่อนักพัฒนาและนักวิจัย

Seed-OSS-36B ใช้สถาปัตยกรรม causal language model ด้วยเทคโนโลยี RoPE, GQA attention, RMSNorm และ SwiGLU มี 64 เลเยอร์, hidden size 5120 และขนาดคำศัพท์ 155,000 โมเดลนี้เหมาะสำหรับทั้งงานวิจัยและการใช้งานเชิงพาณิชย์:

  • สำหรับนักวิจัย: รุ่น Base-woSyn (ไม่มีข้อมูลสังเคราะห์) เหมาะสำหรับการปรับแต่งโมเดล (fine-tuning) หรือการพัฒนาด้วย RLHF
  • สำหรับนักพัฒนา: รุ่น Instruct รองรับงานทั่วไป เช่น การตอบคำถาม, การเขียนโค้ด, และการสร้างเนื้อหา โดยสามารถใช้งานผ่าน API ที่เข้ากันได้กับ OpenAI และรันบนระบบหลาย GPU เช่น NVIDIA H100
  • ใบอนุญาต Apache-2.0: อนุญาตให้ใช้งาน, แก้ไข และแจกจ่ายโมเดลได้ฟรีทั้งในงานวิจัยและเชิงพาณิชย์ โดยไม่ต้องเสียค่า API หรือลิขสิทธิ์

ชนหมดไม่สนลูกใคร

การเปิดตัวโมเดล Seed-OSS-36B เป็นหนึ่งในหมากของ ByteDance ที่ใช้ขยับเข้าไปในสนามแข่งขัน AI ระดับโลก โดยมีเป้าหมายเพื่อวางตำแหน่งตัวเองเทียบเคียงกับผู้เล่นรายใหญ่จากจีน เช่น DeepSeek และ Alibaba Cloud รวมถึงจากฝั่งสหรัฐฯ อย่าง OpenAI และ Anthropic การปล่อยโมเดลแบบ open-source ครั้งนี้สะท้อนถึงแนวทางที่ ByteDance เลือกใช้ในการมีส่วนร่วมกับนักพัฒนาทั่วโลก และอาจช่วยลดช่องว่างด้านเทคโนโลยีระหว่างจีนกับสหรัฐฯ ในบางมิติ ขณะเดียวกัน โมเดลเชิงพาณิชย์หลักของบริษัทอย่าง Doubao ยังคงถูกพัฒนาในรูปแบบ closed-sourc

สำหรับนักพัฒนาและนักวิจัยที่สนใจ สามารถดาวน์โหลด Seed-OSS-36B ได้ที่ Hugging Face หรือดูรายละเอียดเพิ่มเติมที่ GitHub