ace step feature image
|

AMD แนะนำ ACE Step 1.5 โมเดลแต่งเพลง AI ที่ใช้งานเชิงพาณิชย์ได้ ใช้งานฟรีรันแบบออฟไลน์บนซีพียู Ryzen AI และ Radeon ผ่าน ComfyUI

AMD ประกาศความพร้อมของ ACE Step v1.5 โมเดล AI สำหรับสร้างเพลงเชิงพาณิชย์ที่สามารถรันแบบ local-first บนพีซีที่ใช้ AMD Ryzen AI และการ์ดจอ AMD Radeon ผ่าน ComfyUI โดยใช้สแตกซอฟต์แวร์ AMD ROCm 7.2 แนวทางนี้เปิดโอกาสให้ครีเอเตอร์ นักดนตรี และนักพัฒนาสามารถสร้างเพลงเต็มเพลง ทดลองไอเดีย และวนลูปปรับแต่งงานเสียงได้บนเครื่องของตัวเองโดยไม่ต้องพึ่งบริการบนคลาวด์หรือเสียค่าใช้จ่ายรายแทร็ก

ace step generation times

ACE Step: สร้างเพลงออฟไลน์ ไม่ติดลิมิต และใช้เพื่อการค้าได้

AMD ชูคอนเซ็ปต์ local-first เป็นหัวใจสำคัญของ ACE Step 1.5 เพราะช่วยให้ผู้ใช้สร้างเพลงจำนวนมากได้โดยไม่มีข้อจำกัดเรื่องโควตาอัปโหลดหรือค่าใช้จ่ายต่อเพลง พร้อมรักษาไฟล์เสียงทั้งหมดไว้บนเครื่องตั้งแต่พรอมป์ต์จนถึงไฟล์สุดท้าย. ด้วยการประมวลผลบนฮาร์ดแวร์ Ryzen AI และ Radeon ผู้ใช้สามารถทดลองแนวเพลง โครงเพลง และซาวด์ดีไซน์หลายเวอร์ชันได้อย่างรวดเร็ว รักษาโฟลว์การสร้างสรรค์โดยไม่ต้องรอส่งงานขึ้นเซิร์ฟเวอร์

ในแง่ลิขสิทธิ์ ACE Step 1.5 ปล่อยภายใต้ไลเซนส์ MIT ที่เปิดกว้างและระบุว่าใช้ชุดข้อมูลที่เป็นรอยัลตี้ฟรีและไม่ติดลิขสิทธิ์ ทำให้เหมาะกับเวิร์กโฟลว์ที่ต้องการความชัดเจนด้านกฎหมาย เช่น งานโปรดักชันเชิงพาณิชย์ คอนเทนต์ออนไลน์ หรือการใช้งานในสายงานมืออาชีพ

ทำงานผ่าน ComfyUI รองรับ Ryzen AI และ Radeon

ACE Step v1.5 ถูกรันผ่าน ComfyUI ซึ่งเป็นสภาพแวดล้อมแบบ node-based ที่นิยมใช้สร้างและจัดการเวิร์กโฟลว์เจเนอเรทีฟ ทั้งเวอร์ชัน ComfyUI Desktop บน Windows รวมถึงเวอร์ชันพกพาและแบบ git โดย AMD ระบุว่ามีการรองรับ ROCm และ ACE Step 1.5 ตั้งแต่วันแรกสำหรับผู้ใช้ฮาร์ดแวร์ AMD

สำหรับประสิทธิภาพ AMD ระบุว่า ACE Step v1.5 สามารถสร้างเพลงได้เร็วราว 4 เท่าของระยะเวลาฟังจริงบนการ์ดจอ Radeon AI PRO R9700 และราว 1.8 เท่าเมื่อรันบนแพลตฟอร์ม Ryzen AI Max+ ซึ่งเพียงพอสำหรับการลองหลายเวอร์ชันต่อเนื่องโดยยังคงจังหวะในการสร้างสรรค์. นอกจากนี้ โมเดลยังออกแบบให้ใช้ VRAM ไม่สูงและรองรับการปรับจูนสไตล์แบบเบาๆ ผ่าน LoRA จากชุดเพลงตัวอย่างจำนวนน้อย

สถาปัตยกรรม: ภาษา + เพลง และรองรับหลายภาษา

ACE-Step 1.5 ใช้แนวคิดไฮบริด โดยมีเลเยอร์ language model ทำหน้าที่เป็น “ตัววางแผนเพลง” สร้างโครงร่างเชิงโครงสร้าง เช่น เมตะดาต้า เนื้อเพลง และคำอธิบาย ที่ใช้เป็นเงื่อนไขควบคุมตัวสร้างเสียงเพลงอีกที ทำให้ได้เพลงที่มีโครงสร้างชัดเจนและสอดคล้องกับพรอมป์ต์มากขึ้น. AMD ระบุว่าโมเดลนี้ให้คุณภาพระดับ state-of-the-art ในด้านความต่อเนื่องทางดนตรี (musical coherence) และการจัดวางเนื้อร้อง (lyric alignment)

อีกหนึ่งจุดขายคือความเป็นพหุภาษา ACE-Step v1.5 รายงานว่ารองรับพรอมป์ต์มากกว่า 50 ภาษา พร้อมการยึดตามคำสั่ง (prompt adherence) ที่ดี ซึ่งเหมาะกับครีเอเตอร์จากทั่วโลก รวมถึงงานที่ต้องใช้เสียงร้องหรือเนื้อเพลงหลายภาษาในโปรเจ็กต์เดียว

บทสรุปสำหรับสายครีเอเตอร์และนักพัฒนา

สำหรับครีเอเตอร์สายเพลงและโปรดิวเซอร์ที่ใช้ฮาร์ดแวร์ AMD การมาของ ACE-Step 1.5 ทำให้สามารถตั้งสตูดิโอ AI เพลงที่รันบนเครื่องตัวเองได้จริง ตั้งแต่การสเก็ตช์เดโมไปจนถึงการใช้งานเชิงพาณิชย์ โดยไม่ต้องจ่ายค่าบริการรายเดือนหรือกังวลเรื่องข้อมูลเสียงหลุดออกจากระบบ. ด้านนักพัฒนา ACE-Step 1.5 ที่เป็นโอเพนซอร์สและมีไลเซนส์ MIT ทำให้สามารถนำไปต่อยอดในแอปของตัวเอง ผูกกับระบบวางแผนด้วย LLM หรือผสานเข้ากับเวิร์กโฟลว์ ComfyUI ที่ใช้อยู่แล้วบนแพลตฟอร์ม AMD ได้อย่างยืดหยุ่น

ข้อมูล: AMD Blogs

ดาวน์โหลด: Ace Step 1.5

เกี่ยวกับ: AMD