NVIDIA NeMo Retriever image

NVIDIA นำระบบธุรกิจอัจฉริยะมาสู่ Chatbots, Copilots และเครื่องมือสรุปข้อมูล ด้วยไมโครเซอร์วิส Generative AI ระดับองค์กร

NVIDIA ประกาศเปิดตัวไมโครเซอร์วิส Generative AI ที่ช่วยให้องค์กรต่าง ๆ เชื่อมต่อโมเดลภาษาขนาดใหญ่ที่กำหนดเองกับข้อมูลองค์กร เพื่อให้การตอบสนองที่แม่นยำสูงสำหรับแอปพลิเคชัน AI ของตน

NVIDIA NeMo™ Retriever — ข้อเสนอใหม่ใน NVIDIA NeMo กลุ่มเฟรมเวิร์กและเครื่องมือสำหรับการสร้าง ปรับแต่ง และปรับใช้โมเดล Generative AI ช่วยให้องค์กรต่าง ๆ ปรับปรุงแอปพลิเคชั่น Generative AI โดยใช้ retrieval-augmented generation (RAG) ระดับองค์กร

ในฐานะไมโครเซอร์วิสที่เป็นเครื่องมือสำหรับการเข้าถึงข้อมูลที่มีความหมายเฉพาะทางสำหรับองค์กร NeMo Retreater จะช่วยให้แอปพลิเคชัน AI ทั่วไปให้การตอบสนองที่แม่นยำยิ่งขึ้นผ่านอัลกอริธึมที่ปรับให้เหมาะสมโดย NVIDIA นักพัฒนาที่ใช้ไมโครเซอร์วิสสามารถเชื่อมต่อแอปพลิเคชัน AI ของตนกับเข้ากับข้อมูลธุรกิจไม่ว่าจะอยู่ที่ใดบนคลาวด์และศูนย์ข้อมูล เพิ่มความสามารถ RAG โดยใช้อัลกอริธึมที่ปรับให้เหมาะสมจาก NVIDIA ไปยัง AI foundries และเป็นส่วนหนึ่งของ NVIDIA AI Enterprise แพลตฟอร์มซอฟต์แวร์ที่มีอยู่ใน AWS Marketplace

Retrieval Augmented Generation RAG

Cadence, Dropbox, SAP และ ServiceNow เป็นหนึ่งในผู้บุกเบิกที่ทำงานร่วมกับ NVIDIA เพื่อสร้าง RAG ที่มีความสามารถที่พร้อมใช้งานจริงในแอปพลิเคชันและบริการ Generative AI ที่ปรับแต่งเอง

“แอปพลิเคชั่น Generative AI ที่มีความสามารถ RAG ถือเป็นแอปนักฆ่าตัวต่อไปขององค์กร” Jensen Huang ผู้ก่อตั้งและซีอีโอของ NVIDIA กล่าว “ด้วย NVIDIA NeMo Retriever นักพัฒนาสามารถสร้างแชทบอท Generative AI ที่กำหนดเองได้, Copilot และเครื่องมือสรุปที่ปรับแต่งได้ ซึ่งสามารถเข้าถึงข้อมูลทางธุรกิจของพวกเขาเพื่อแปลงประสิทธิภาพการทำงานด้วยความชาญฉลาดของ Generative AI ที่แม่นยำและมีคุณค่า”

ผู้นำระดับโลกปรับปรุงความแม่นยำของ LLM ด้วย NeMo Retriever

Cadence Design Systems ผู้นำด้านการออกแบบระบบอิเล็กทรอนิกส์ให้บริการแก่บริษัทต่าง ๆ ในตลาดการประมวลผลระดับไฮเปอร์สเกล, การสื่อสาร 5G, ยานยนต์, อุปกรณ์เคลื่อนที่, อวกาศ, ผลิตภัณฑ์สำหรับผู้บริโภค และการดูแลสุขภาพ กำลังทำงานร่วมกับ NVIDIA เพื่อพัฒนาคุณสมบัติ RAG สำหรับแอปพลิเคชัน Generative AI ในการออกแบบอุปกรณ์อิเล็กทรอนิกส์ทางอุตสาหกรรม

“Generative AI นำเสนอแนวทางที่เป็นนวัตกรรมเพื่อตอบสนองความต้องการของลูกค้า เช่น เครื่องมือในการเปิดเผยข้อบกพร่องที่อาจเกิดขึ้นในช่วงต้นของกระบวนการออกแบบ” Anirudh Devgan ประธานและซีอีโอของ Cadence Design Systems กล่าว “นักวิจัยของเรากำลังทำงานร่วมกับ NVIDIA เพื่อใช้ NeMo Retriever เพื่อเพิ่มความแม่นยำและความเกี่ยวข้องของแอปพลิเคชัน AI ทั่วไป เพื่อเปิดเผยปัญหาและช่วยให้ลูกค้าได้รับผลิตภัณฑ์คุณภาพสูงออกสู่ตลาดได้เร็วขึ้น”

tensor rt llm

การสร้างโค้ดสำหรับแอปพลิเคชัน Generative AI ที่แม่นยำ

ต่างจากชุดเครื่องมือ RAG แบบโอเพ่นซอร์ส NeMo Retriever รองรับ Generative AI ที่พร้อมสำหรับการผลิตด้วยโมเดลที่ใช้งานได้ในเชิงพาณิชย์ ความเสถียรของ API แพตช์ความปลอดภัย และการสนับสนุนระดับองค์กร

อัลกอริธึมที่ปรับให้เหมาะสมโดย NVIDIA ขับเคลื่อนผลลัพธ์ที่แม่นยำที่สุด ในการฝังตัวด้วยโมเดลของ Retriever โมเดลการฝังตัวที่ได้รับการปรับปรุงนี้จะจับความสัมพันธ์ระหว่างคำ ทำให้ LLM สามารถประมวลผลและวิเคราะห์ข้อมูลที่เป็นข้อความได้

องค์กรต่าง ๆ สามารถเชื่อมต่อ LLM กับแหล่งข้อมูลและฐานความรู้ต่าง ๆ ได้ด้วยการใช้ NeMo Retriever เพื่อให้ผู้ใช้สามารถโต้ตอบกับข้อมูลได้อย่างง่ายดาย และรับคำตอบที่แม่นยำและทันสมัยโดยใช้ข้อความแจ้งการสนทนาที่เรียบง่าย ธุรกิจที่ใช้แอปพลิเคชันที่ขับเคลื่อนด้วย Retriever ช่วยให้ผู้ใช้สามารถเข้าถึงข้อมูลได้อย่างปลอดภัย ซึ่งครอบคลุมรูปแบบข้อมูลมากมาย เช่น ข้อความ PDF รูปภาพ และวิดีโอ

องค์กรต่างๆ สามารถใช้ NeMo Retriever เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้นด้วยการฝึกอบรมที่น้อยลง เร่งเวลาออกสู่ตลาด และสนับสนุนประสิทธิภาพการใช้พลังงานในการพัฒนาแอปพลิเคชัน Generative AI

การปรับใช้ที่เชื่อถือได้ ง่าย และปลอดภัยด้วย NVIDIA AI Enterprise

บริษัทต่าง ๆ สามารถปรับใช้แอปพลิเคชันที่ขับเคลื่อนด้วย NeMo Retriever เพื่อทำงานในระหว่างการอนุมานบนคอมพิวเตอร์ที่เร่งด้วย NVIDIA บนศูนย์ข้อมูลหรือคลาวด์แทบทุกชนิด NVIDIA AI Enterprise รองรับการอนุมานที่รวดเร็วและมีประสิทธิภาพสูงด้วย NVIDIA NeMo, NVIDIA Triton Inference Server™, NVIDIA TensorRT™, NVIDIA TensorRT-LLM และซอฟต์แวร์ NVIDIA AI อื่น ๆ 

เพื่อเพิ่มประสิทธิภาพการอนุมานให้สูงสุด นักพัฒนาสามารถรันโมเดลของตนได้บน NVIDIA GH200 Grace Hopper Superchips พร้อมซอฟต์แวร์ TensorRT-LLM.

ความพร้อมใช้งาน

นักพัฒนาสามารถลงทะเบียนเพื่อเข้าใช้งาน NVIDIA NeMo Retriever ได้ก่อนใคร

เกี่ยวกับ NVIDIA

นับตั้งแต่ก่อตั้งในปี 1993 NVIDIA (NASDAQ: NVDA) เป็นผู้บุกเบิกด้านการประมวลผลแบบเร่งความเร็ว การประดิษฐ์ GPU ของบริษัทในปี 1999 ได้จุดประกายการเติบโตของตลาดเกมพีซี คอมพิวเตอร์กราฟิกที่ได้รับการปรับปรุงใหม่ จุดประกายยุคของ AI สมัยใหม่ และกำลังขับเคลื่อนการเปลี่ยนแปลงทางดิจิทัลของอุตสาหกรรมทั่วทั้งตลาด ปัจจุบัน NVIDIA เป็นบริษัทคอมพิวเตอร์แบบฟูลสแต็คที่มีข้อเสนอระดับศูนย์ข้อมูลที่กำลังพลิกโฉมอุตสาหกรรม ข้อมูลเพิ่มเติมที่ https://nvidianews.nvidia.com/