การวิเคราะห์แนวโน้มเทคโนโลยีในปี 2567 ของเวอร์เนอร์ โวเกลส์ (Werner Vogels) ซีทีโอของบริษัท Amazon ได้คาดการณ์ไว้ว่า Generative AI จะสามารถรับรู้ด้านวัฒนธรรมมากขึ้น โดยการเทรนโมเดลภาษาขนาดใหญ่ (Large language models: LLM) ซึ่งเป็นแขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้วยข้อมูลที่หลากหลาย จึงนำไปสู่ผลลัพธ์ที่ลึกซึ้งและแม่นยำยิ่งขึ้น เป้าหมายหลักคือการทำให้ Generative AI เข้าถึงผู้คนหลากหลายกลุ่มและเป็นประโยชน์แก่ผู้ใช้ทั่วโลก
อย่างไรก็ตาม LLM นั้นพึ่งพาข้อมูลที่ได้รับจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มักเป็นในรูปแบบภาษาและอักษรที่ถูกใช้จำนวนมาก อย่างเช่นภาษาอังกฤษ ที่มีข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) อยู่มากมาย สิ่งสำคัญที่องค์กรต่าง ๆ มองข้ามไม่ได้คือความสามารถในการดัดแปลง LLM ด้วยข้อมูลและภาษาท้องถิ่น เพื่อส่งเสริมความมีส่วนร่วมในสังคม กระตุ้นการเติบโตทางเศรษฐกิจด้วยการเปิดตลาดใหม่ ๆ และสร้างประสบการณ์ที่ดียิ่งขึ้นให้กับประชาชน
วัฒนธรรมมีผลในทุกๆอย่าง, นี่เป็นสิ่งที่ผลให้ AI สิงค์โปร์ (AI Singapore: AISG) ซึ่งเป็นโครงการของภาครัฐริเริ่มโดยมูลนิธิเพื่อการวิจัยแห่งชาติของสิงค์โปร์ (National Research Foundation) เพื่อเสริมสร้างศักยภาพของประเทศในด้าน AI และทำให้ LLM มีความแม่นยำตรงกับบริบททางวัฒนธรรมของแต่ละประเทศมากยิ่งขึ้น โดยเฉพาะสำหรับประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้
โครงการ SEA-LION – โครงการแรกสำหรับภูมิภาค
ต่อยอดจากโครงสร้างพื้นฐานของ AWS ที่มีความยืดหยุ่นในการปรับขนาดได้อย่างง่ายดาย AISG ได้พัฒนา SEA-LION ซึ่งเป็นโครงการด้าน LLM ที่ถูกเทรนและรับคำสั่งเฉพาะเจาะจงสำหรับภาษาและวัฒนธรรมจากประเทศในเอเชียตะวันออกเฉียงใต้ (การเทรนล่วงหน้าและรับคำสั่งแบบ instruct-tuned เป็นวิธีการที่ช่วยให้สามารถควบคุมพฤติกรรม LLM ได้ดียิ่งขึ้น) โครงการแรกในภูมิภาค SEA-LION ยังทำหน้าที่เป็นรากฐานสำหรับโครงการ National Multimodal LLM ของสิงคโปร์ ซึ่งมีส่วนสนับสนุนในการวิจัยและนวัตกรรมด้าน AI ของประเทศอีกด้วย โครงการนี้เป็นส่วนหนึ่งของ National AI Strategy 2.0 ซึ่งเป็นแผนการใช้เทคโนโลยี AI ในสิงคโปร์ให้ลึกซึ้งยิ่งขึ้น โมเดลนี้จะมุ่งเน้นไปที่ภาษาที่มีการใช้งานอย่างแพร่หลายในเอเชียตะวันออกเฉียงใต้ เช่น บาฮาซาอินโดนีเซีย บาฮาซามลายู ไทย และเวียดนาม และในระยะยาวจะถูกขยายไปยัง ภาษาอื่น ๆ ในเอเชียตะวันออกเฉียงใต้เข้ามา เช่น พม่าและลาว
การสร้าง LLM ที่ครอบคลุมหลายประเทศในระดับภูมิภาคนั้นต้องใช้ข้อมูล[เชิงลึก]และเจาะจง กับท้องถิ่นในภาษาที่เกี่ยวข้องอีกด้วย ตัวอย่างของความแตกต่างทางภาษาท้องถิ่นคือคำว่า “LOL” (คำย่อของ “laughing out loud” ในภาษาอังกฤษ) ในประเทศไทยคนมักใช้ “55555” ในขณะที่ชาวอินโดนีเซียมักใช้ “wkwkwk” LLM ที่ได้รับการเทรนด้วยข้อมูลที่หลากหลายทางวัฒนธรรม เช่น SEA-LION ช่วยเพิ่มความสามารถของแอปพลิเคชัน Generative AI ให้เข้าใจแง่มุมที่ละเอียดอ่อน เหมาะแก่ประสบการณ์ใช้งานของมนุษย์ อีกทั้งยังสามารถเข้าใจความซับซ้อนทางสังคมที่อาจเป็นอุปสรรคอีกด้วย
การเร่งพัฒนา Generative AI แบบเจาะจงในแต่ละท้องถิ่น (Hyper-local) ในเอเชียตะวันออกเฉียงใต้
SEA-LION พร้อมใช้งานแล้วบน Amazon SageMaker JumpStart รวมทั้งโมเดลที่ได้รับการเทรนล่วงหน้า (pre-trained models) และเปิดให้ใช้งานแบบสาธารณะ เพื่อช่วยลูกค้าทั่วโลกในการเริ่มต้นใช้งานกับแมชชีนเลิร์นนิง (ML) โมเดล SEA-LION ที่ได้เปิดตัวไปแล้วมีขนาดที่ค่อนข้างเล็กด้วยพารามิเตอร์ขนาด 3 พันล้านและ 7 พันล้าน และได้รับการเทรนโดยใช้ Amazon EC2 ซึ่งเป็นบริการที่ให้ความสามารถในการประมวลผลที่ปรับขนาดได้บนคลาวด์ โมเดลรุ่นเล็ก ๆ เหล่านี้มีความยืดหยุ่นและเข้าถึงได้ง่ายกว่า LLM ที่ใช้กันทั่วไปในตลาดปัจจุบัน ซึ่งโดยปกติแล้วจะมีขนาดหลายแสนล้านพารามิเตอร์
ในช่วงปลายเดือนมกราคม พ.ศ. 2567 AISG ได้ทำการเปิดตัวโมเดล SEA-LION เชิงพาณิชย์ ด้วยพารามิเตอร์เพื่อรองรับการปรับแต่งคำสั่งและจะมีความสามารถมากขึ้นในการจับความแตกต่างทางภาษาในเอเชียตะวันออกเฉียงใต้ รวมไปถึงปรับปรุงความเข้าใจในบริบทต่าง ๆ พัฒนาการใช้เหตุผลในหลายภาษา และสร้างผลลัพธ์ที่มีบริบทมากยิ่งขึ้น
พอล คอนดิลิส ผู้ช่วยรองประธาน (AVP) ด้าน Data Science ที่ Tokopedia กล่าวว่า “การที่ AISG ให้ความสำคัญกับภาษาท้องถิ่นในเอเชียตะวันออกเฉียงใต้ที่ไม่ค่อยมีบทบาทนั้นมีความสำคัญอย่างมาก เนื่องจากลูกค้าส่วนใหญ่ของเราที่ Tokopedia โต้ตอบกับเราในภาษาบาฮาซา อินโดนีเซีย การพัฒนาโมเดลที่มีความคล่องแคล่วในภาษาท้องถิ่นนั้น จะช่วยเพิ่มประสิทธิภาพของเราในการสื่อสารกับลูกค้าและพัฒนาประสบการณ์ของพวกเขา เรากำลังอยู่ในระยะทดลองขั้นต้นกับ SEA-LION ซึ่งโดยรวมดูมีแนวโน้มที่ดี”
หยิง เฉาเหว่ย หัวหน้านักวิทยาศาสตร์ที่ NCS กล่าวว่า “ในขณะที่เทคโนโลยีกำลังพัฒนาไปอย่างรวดเร็วในเอเชียแปซิฟิก เรามองเห็นโอกาสที่น่าตื่นเต้นในการปรับแต่งโมเดลภาษาเพื่อสะท้อนถึงความหลากหลายทางภาษาในภูมิภาค และพลิกโฉมวิธีการประมวลผลและแบ่งปันข้อมูล เรายินดีที่ได้ทำงานอย่างใกล้ชิดกับ AISG ในโครงการ SEA-LION LLM ที่ใช้ประโยชน์จากทรัพยากรของ AWS โครงการนี้ช่วยลดความเหลื่อมล้ำทางดิจิทัลโดยการปรับปรุงการสื่อสารระหว่างวัฒนธรรม และมอบประสบการณ์ทีเจาะจงให้สำหรับแต่ละท้องถิ่น นอกจากนี้ ธุรกิจและภาครัฐยังสามารถใช้ประโยชน์จากความเชี่ยวชาญของ NCS ในการตอบสนองความต้องการทางธุรกิจผ่านการใช้แอปพลิเคชันที่ขับเคลื่อนด้วย LLM เพื่อควบคุมศักยภาพสูงสุดของ LLM ในโครงการ SEA-LION อีกด้วย”
ML และการประมวลผลที่คุ้มค่า
การสร้าง การเทรน และการใช้งาน LLM ต้องใช้เวลา ทรัพยากรการประมวลผลจำนวนมาก และความเชี่ยวชาญ AISG จึงได้ร่วมมือกับ AWS เพื่อจัดการกับความท้าทายเหล่านี้ โดยการใช้ประสิทธิภาพอันทรงพลังของคลาวด์สำหรับงานต่าง ๆ เช่น การเทรน ML และการประมวลผลประสิทธิภาพสูงโดยใช้ NVIDIA A100 Tensor Core GPU ซึ่งมอบผลลัพธ์ระดับสูงสุดพร้อมเครือข่ายที่รวดเร็วและตอบสนองไว
ขนาดที่กะทัดรัดของ SEA-LION ทำให้มีความคุ้มค่าและประสิทธิภาพมากกว่า LLM ขนาดใหญ่ ที่มีพารามิเตอร์มากกว่าหลายร้อยเท่า LLM ขนาดเล็กช่วยให้นักพัฒนาสามารถใช้งานได้เร็วขึ้น ปรับแต่งได้ในราคาที่ถูกกว่า และดำเนินการได้รวดเร็วยิ่งขึ้นในระหว่างการเทรน ความง่ายในการปรับใช้ LLM ขนาดเล็กบนอุปกรณ์เคลื่อนที่หรือที่ Edge ยังช่วยให้ธุรกิจต่าง ๆ สามารถนำมาใช้และสร้างแอปพลิเคชันได้ง่ายขึ้นอีกด้วย
ดร. เลสลี่ย์ เทียว ผู้อำนวยการอาวุโสฝ่ายผลิตภัณฑ์ AI ของ AISG กล่าวว่า “การสร้าง LLM จำเป็นต้องมีโครงสร้างพื้นฐานระบบคลาวด์ที่เชื่อถือได้และพร้อมใช้งานทุกเมื่อ โดย AWS ช่วยให้เราสามารถปรับขนาดได้อย่างคุ้มค่า เราสร้าง LLM ที่มีพารามิเตอร์ 3 พันล้านในเวลาเพียงสามเดือนด้วย AWS และตั้งแต่นั้นมาเราได้ปรับขนาดโมเดลเป็น 7 พันล้านพารามิเตอร์ เพื่อขยายการเข้าถึงไปยังผู้คนมากขึ้น การทำงานร่วมกับ AWS ทำให้เราสามารถมุ่งเน้นไปที่การเทรนโมเดลของเราเพียงอย่างเดียวแทนที่จะต้องจัดการโครงสร้างพื้นฐาน ปัจจัยนี้จึงช่วยเร่งการพัฒนา LLM ที่เป็นเอกลักษณ์ และสะท้อนถึงความหลากหลายในภูมิภาคของเรา”
เอลซี่ ตัน ผู้จัดการประจำประเทศสิงคโปร์ ฝ่ายภาครัฐทั่วโลก ที่ AWS กล่าวว่า “LLM ที่มีความเฉพาะด้านภาษาและวัฒนธรรม เช่น SEA-LION ของ AISG จะช่วยให้การสื่อสารและความเข้าใจระหว่างวัฒนธรรมราบรื่นยิ่งขึ้น ช่วยรักษารายละเอียดทางวัฒนธรรม และช่วยให้ภาครัฐและธุรกิจสามารถให้บริการประชาชนและลูกค้าในเอเชียตะวันออกเฉียงใต้ได้ดีขึ้น เรารู้สึกตื่นเต้นที่ได้ช่วย AISG ปลดล็อกศักยภาพของ Generative AI เพื่อสร้างประโยชน์มากมายให้กับเศรษฐกิจต่าง ๆ ในอาเซียน เราหวังว่าจะได้ช่วยให้ AISG ขยายการเข้าถึงของ LLM ด้วยเครือข่ายลูกค้าและพาร์ทเนอร์ของเราในภูมิภาค”
เริ่มสร้างแอปพลิเคชัน Generative AI ในอุตสาหกรรมของท่าน บน AWS ได้แล้ววันนี้
เกี่ยวกับอะเมซอน เว็บ เซอร์วิสเซส
ตั้งแต่ปี 2549 เป็นต้นมา อะเมซอน เว็บ เซอร์วิสเซส (Amazon Web Services: AWS) เป็นผู้ให้บริการคลาวด์ที่ครอบคลุมและกว้างขวางที่สุดในโลก AWS ขยายการให้บริการอย่างต่อเนื่องเพื่อรองรับการทำงานบนคลาวด์ทุกรูปแบบ ซึ่งในปัจจุบันมีบริการอย่างเต็มรูปแบบกว่า 240 รายการ สำหรับการคำนวณ การจัดเก็บข้อมูล ฐานข้อมูล ระบบเครือข่าย การวิเคราะห์ การเรียนรู้ของเครื่อง (Machine Learning: ML) และปัญญาประดิษฐ์ (Artificial Intelligence: AI) อินเตอร์เน็ตในทุกสิ่ง (Internet of Things: IoT) โทรศัพท์มือถือ การรักษาความปลอดภัย ไฮบริด เทคโนโลยีโลกเสมือนจริง (Virtual Reality: VR) และการรวมวัตถุเสมือนเข้ากับสภาพแวดล้อมจริง (Augmented Reality: AR) สื่อและการพัฒนาแอปพลิเคชัน การใช้งาน และการจัดการจาก 102 Availability Zones (AZs) ใน 33 ภูมิภาค พร้อมประกาศแผนสำหรับ Availability Zones เพิ่มเติมอีก 12 แห่ง และ AWS Regions อีก 4 แห่งในมาเลเซีย นิวซีแลนด์ ไทย และภูมิภาคยุโรป (AWS European Sovereign Cloud) ลูกค้ากว่าล้านรายรวมไปถึงสตาร์ทอัพที่เติบโตอย่างรวดเร็ว องค์กรขนาดใหญ่ และหน่วยงานภาครัฐ ต่างเชื่อมั่นใน AWS ในการขับเคลื่อนโครงสร้างพื้นฐานของพวกเขาให้มีความคล่องตัวมากขึ้นและมีต้นทุนที่น้อยลง เรียนรู้เพิ่มเติมเกี่ยวกับ AWS ได้ที่ aws.amazon.com