NVIDIA เปิดตัวบริการคลาวด์โมเดลภาษาขนาดใหญ่ เพื่อความก้าวหน้าของ AI และชีววิทยาดิจิทัล
บริการ NVIDIA NeMo LLM ช่วยนักพัฒนาปรับแต่งโมเดลภาษาขนาดใหญ่; บริการ NVIDIA BioNeMo ช่วยให้นักวิจัยสร้างและคาดการณ์ล่วงหน้าเกี่ยวกับโมเลกุล โปรตีน และดีเอ็นเอ

ซานตาคลารา แคลิฟอร์เนีย—GTC—กันยายน 2022— NVIDIA ได้ประกาศเปิดตัวบริการโมเดลภาษาขนาดใหญ่ด้าน AI บนคลาวด์ สองบริการ — NVIDIA NeMo Large Language Model Service และ NVIDIA BioNeMo LLM Service — ที่ช่วยให้นักพัฒนาสามารถปรับ LLM และปรับใช้แอปพลิเคชัน AI แบบกำหนดเองสำหรับการสร้างเนื้อหา, การสรุปข้อความ, แชทบอท, การพัฒนาโค้ด ตลอดจนโครงสร้างโปรตีนและการทำนายคุณสมบัติทางชีวโมเลกุล และอื่น ๆ
บริการ NeMo LLM ช่วยให้นักพัฒนาปรับแต่งโมเดลพื้นฐานที่ได้รับการฝึกอบรมล่วงหน้าจำนวนหนึ่งได้อย่างรวดเร็วโดยใช้วิธีการฝึกอบรมที่เรียกว่า prompt learning บนโครงสร้างพื้นฐานที่จัดการโดย NVIDIA, บริการ NVIDIA BioNeMo เป็น API การเขียนโปรแกรมแอปพลิเคชันบนคลาวด์ที่ขยายกรณีการใช้งาน LLM นอกเหนือจากโมเดลภาษาแล้ว ยังเป็นแอปพลิเคชันทางวิทยาศาสตร์เพื่อเร่งการค้นพบยาสำหรับบริษัทยาและเทคโนโลยีชีวภาพ
“โมเดลภาษาขนาดใหญ่มีศักยภาพที่จะเปลี่ยนแปลงทุกอุตสาหกรรม” Jensen Huang ผู้ก่อตั้งและซีอีโอของ NVIDIA กล่าว “ความสามารถในการปรับแต่งโมเดลพื้นฐานทำให้พลังของ LLM เข้าถึงนักพัฒนาหลายล้านคนที่ตอนนี้สามารถสร้างบริการภาษาและขับเคลื่อนการค้นพบทางวิทยาศาสตร์โดยไม่จำเป็นต้องสร้างแบบจำลองขนาดใหญ่ตั้งแต่เริ่มต้น”
บริการ NeMo LLM เพิ่มความแม่นยำด้วยการเรียนรู้ที่รวดเร็ว เร่งการปรับใช้ด้วยบริการ NeMo LLM ทำให้นักพัฒนาสามารถใช้ข้อมูลการฝึกอบรมของตนเองเพื่อปรับแต่งโมเดลพื้นฐานตั้งแต่พารามิเตอร์ในระดับ 3 พันล้านพารามิเตอร์ จนถึงพารามิเตอร์ขนาดมโหฬารในระดับ 530 พันล้านพารามิเตอร์ได้ (Megatron-Turing – NLG 530B) ซึ่งเป็นหนึ่งใน LLM ที่ใหญ่ที่สุดในโลก กระบวนการนี้ใช้เวลาเพียงไม่กี่นาทีไปจนถึงหลักชั่วโมงเท่านั้น เมื่อเทียบกับสัปดาห์หรือเดือนที่ต้องใช้ในการฝึกโมเดลตั้งแต่เริ่มต้น
โมเดลได้รับการปรับแต่งด้วยการเรียนรู้ที่รวดเร็ว ซึ่งใช้เทคนิคที่เรียกว่า p-tuning ซึ่งช่วยให้นักพัฒนาใช้ตัวอย่างเพียงไม่กี่ร้อยตัวอย่างเพื่อปรับแต่งโมเดลพื้นฐานได้อย่างรวดเร็ว ซึ่งเดิมได้รับการฝึกฝนด้วยจุดข้อมูลหลายพันล้านจุด กระบวนการปรับแต่งเองจะสร้าง prompt token เฉพาะงาน ซึ่งจะรวมกับโมเดลพื้นฐานเพื่อมอบความแม่นยำที่สูงขึ้นและการตอบสนองที่เกี่ยวข้องมากขึ้นสำหรับกรณีการใช้งานเฉพาะ
นักพัฒนาสามารถปรับแต่งสำหรับการใช้งานหลายกรณีโดยใช้โมเดลเดียวกันและสร้าง prompt token ที่แตกต่างกันมากมาย ฟีเจอร์ Playground มีตัวเลือกที่ไม่ต้องใช้โค้ดเพื่อทดสอบและโต้ตอบกับโมเดลอย่างง่ายดาย เพิ่มประสิทธิภาพและการเข้าถึงของ LLM สำหรับกรณีการใช้งานเฉพาะอุตสาหกรรม
เมื่อพร้อมที่จะปรับใช้แล้ว โมเดลที่ปรับแต่งแล้วสามารถทำงานบนอินสแตนซ์คลาวด์ ระบบในองค์กร หรือผ่าน API
บริการ BioNeMo LLM ช่วยให้นักวิจัยสัมผัสพลังของโมเดลขนาดใหญ่
บริการ BioNeMo LLM ประกอบด้วยโมเดลภาษา BioNeMo ใหม่สองรูปแบบสำหรับการใช้งานด้านเคมีและชีววิทยา โดยให้การสนับสนุนข้อมูลโปรตีน ดีเอ็นเอ และเคมี เพื่อช่วยให้นักวิจัยค้นพบรูปแบบและข้อมูลเชิงลึกในลำดับทางชีววิทยา
BioNeMo ช่วยให้นักวิจัยขยายขอบเขตงานของตนโดยใช้ประโยชน์จากแบบจำลองที่มีพารามิเตอร์หลายพันล้านตัว โมเดลขนาดใหญ่เหล่านี้สามารถเก็บข้อมูลเพิ่มเติมเกี่ยวกับโครงสร้างของโปรตีน ความสัมพันธ์เชิงวิวัฒนาการระหว่างยีน และแม้กระทั่งสร้างชีวโมเลกุลแบบใหม่สำหรับการประยุกต์ใช้ในการรักษา
Cloud API ให้การเข้าถึง Megatron 530B, โมเดลสำเร็จรูปอื่น ๆ
นอกเหนือจากการปรับโมเดลพื้นฐานแล้ว บริการ LLM ยังมีตัวเลือกในการใช้โมเดลสำเร็จรูปและแบบกำหนดเองผ่าน API ของระบบคลาวด์
ซึ่งช่วยให้นักพัฒนาสามารถเข้าถึง LLM ที่ผ่านการฝึกอบรมมาแล้วมากมาย รวมถึง Megatron 530B นอกจากนี้ยังให้การเข้าถึงรุ่น T5 และ GPT-3 ที่สร้างขึ้นด้วยเฟรมเวิร์ก NVIDIA NeMo Megatron ซึ่งขณะนี้มีให้ใช้งานในโอเพ่นเบต้าแล้ว เพื่อรองรับแอพพลิเคชั่นที่หลากหลายและความต้องการบริการหลายภาษา
ผู้นำในอุตสาหกรรมยานยนต์, คอมพิวเตอร์, การศึกษา, การดูแลสุขภาพ, โทรคมนาคม และอุตสาหกรรมอื่น ๆ ใช้ NeMo Megatron เพื่อบุกเบิกบริการสำหรับลูกค้าในภาษาจีน, อังกฤษ, เกาหลี, สวีเดน และภาษาอื่น ๆ
ความพร้อมใช้งาน
บริการ NeMo LLM และ BioNeMo และ cloud APIs คาดว่าจะพร้อมให้ใช้งานในช่วงต้นเดือนหน้า นักพัฒนาสามารถสมัครตอนนี้เพื่อดูรายละเอียดเพิ่มเติม
เฟรมเวิร์ก NeMo Megatron รุ่นเบต้าพร้อมใช้งานจาก NVIDIA NGC™ และได้รับการปรับให้ทำงานบน NVIDIA DGX™ Foundry และ NVIDIA DGX SuperPOD™ รวมถึงอินสแตนซ์ระบบคลาวด์แบบเร่งความเร็วจาก Amazon Web Services, Microsoft Azure และ Oracle Cloud Infrastructure
หากต้องการสัมผัสกับเฟรมเวิร์ก NeMo Megatron นักพัฒนาสามารถลองใช้แล็บ NVIDIA LaunchPad ได้ฟรี
ติดตามประเด็นสำคัญของ Huang ได้ที่ GTC 22 เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับโมเดลภาษาขนาดใหญ่ที่ขับเคลื่อนโดย NVIDIA AI
เกี่ยวกับ NVIDIA
นับตั้งแต่ก่อตั้งในปี 1993 NVIDIA (NASDAQ: NVDA) เป็นผู้บุกเบิกด้านการประมวลผลแบบเร่งความเร็ว การประดิษฐ์ GPU ของบริษัทในปี 1999 ได้จุดประกายการเติบโตของตลาดเกมพีซี กำหนดนิยามใหม่ของคอมพิวเตอร์กราฟิก และจุดประกายยุคของ AI สมัยใหม่ ปัจจุบัน NVIDIA เป็นบริษัทประมวลผลแบบฟูลสแตกซึ่งมีข้อเสนอระดับศูนย์ข้อมูลที่กำลังพลิกโฉมอุตสาหกรรม ข้อมูลเพิ่มเติมได้ที่ https://nvidianews.nvidia.com/
ข้อความบางส่วนในข่าวประชาสัมพันธ์ฉบับนี้ รวมถึงแต่ไม่จำกัดเพียง ข้อความเกี่ยวกับ: ประโยชน์ ผลกระทบ ความสามารถ และความพร้อมใช้งานของผลิตภัณฑ์และเทคโนโลยีของเรา รวมถึงบริการ NeMo LLM และบริการ BioNeMo LLM ศักยภาพของแบบจำลองภาษาขนาดใหญ่ในการเปลี่ยนแปลงทุกอุตสาหกรรม ผลกระทบของความสามารถในการปรับแต่งแบบจำลองพื้นฐาน และแบบจำลองขนาดใหญ่ที่จัดเก็บข้อมูลเพิ่มเติมเกี่ยวกับโครงสร้างของโปรตีน ความสัมพันธ์เชิงวิวัฒนาการระหว่างยีน และการสร้างชีวโมเลกุลใหม่สำหรับการใช้งานด้านการรักษา เป็นข้อความเชิงคาดการณ์ล่วงหน้าที่อาจมีความเสี่ยงและความไม่แน่นอนที่อาจทำให้ผลลัพธ์แตกต่างอย่างมากจากที่คาดการณ์ไว้ ปัจจัยสำคัญที่อาจทำให้ผลลัพธ์ที่แท้จริงแตกต่างไปอย่างมาก ได้แก่ ภาวะเศรษฐกิจโลก การพึ่งพาบุคคลที่สามในการผลิต ประกอบ บรรจุหีบห่อ และทดสอบผลิตภัณฑ์ของเรา ผลกระทบของการพัฒนาเทคโนโลยีและการแข่งขัน การพัฒนาผลิตภัณฑ์และเทคโนโลยีใหม่หรือการปรับปรุงผลิตภัณฑ์และเทคโนโลยีที่มีอยู่ของเรา การยอมรับของตลาดสำหรับผลิตภัณฑ์ของเราหรือผลิตภัณฑ์ของพันธมิตรของเรา ข้อบกพร่องด้านการออกแบบ การผลิต หรือซอฟต์แวร์ การเปลี่ยนแปลงความชอบหรือความต้องการของผู้บริโภค การเปลี่ยนแปลงมาตรฐานอุตสาหกรรมและส่วนต่อประสาน การสูญเสียประสิทธิภาพของผลิตภัณฑ์หรือเทคโนโลยีของเราโดยไม่คาดคิดเมื่อรวมเข้ากับระบบ ตลอดจนปัจจัยอื่นๆ ที่มีรายละเอียดเป็นครั้งคราวในรายงานล่าสุด ไฟล์ NVIDIA กับสำนักงานคณะกรรมการกำกับหลักทรัพย์และตลาดหลักทรัพย์ หรือ ก.ล.ต. ซึ่งรวมถึงแต่ไม่จำกัดเพียงรายงานประจำปีในแบบฟอร์ม 10-K และรายงานรายไตรมาสในแบบฟอร์ม 10-Q . สำเนารายงานที่ยื่นต่อ SEC จะถูกโพสต์บนเว็บไซต์ของบริษัทและหาได้จาก NVIDIA โดยไม่มีค่าใช้จ่าย ข้อความที่เป็นการคาดการณ์ล่วงหน้าเหล่านี้ไม่ได้รับประกันประสิทธิภาพในอนาคตและพูดเฉพาะ ณ วันที่ในที่นี้เท่านั้น และยกเว้นตามที่กฎหมายกำหนด NVIDIA ปฏิเสธภาระผูกพันใด ๆ ในการปรับปรุงข้อความคาดการณ์ล่วงหน้าเหล่านี้เพื่อสะท้อนถึงเหตุการณ์หรือสถานการณ์ในอนาคต
© 2022 บริษัท NVIDIA คอร์ปอเรชั่น สงวนลิขสิทธิ์. NVIDIA, โลโก้ NVIDIA, NVIDIA NGC, NVIDIA DGX และ NVIDIA DGX SuperPOD เป็นเครื่องหมายการค้าและ/หรือเครื่องหมายการค้าจดทะเบียนของ NVIDIA Corporation ในสหรัฐอเมริกาและประเทศอื่นๆ ชื่อบริษัทและผลิตภัณฑ์อื่นๆ อาจเป็นเครื่องหมายการค้าของบริษัทที่เกี่ยวข้องกัน คุณสมบัติ ราคา ความพร้อมใช้งาน และข้อมูลจำเพาะอาจเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบ