LLM (Large Language Model)

LLM คือโมเดลปัญญาประดิษฐ์ (AI) ประเภทหนึ่งที่ได้รับการฝึกฝนด้วยชุดข้อมูลข้อความขนาดมหาศาล เพื่อให้สามารถเข้าใจ สร้าง และประมวลผลภาษามนุษย์ได้อย่างเป็นธรรมชาติ โดยมีความสามารถในการเรียนรู้รูปแบบและความสัมพันธ์ของคำ วลี และประโยคในภาษาต่าง ๆ ทำให้สามารถตอบคำถาม สร้างสรรค์เนื้อหา สรุปข้อความ แปลภาษา และทำงานที่เกี่ยวข้องกับภาษาได้หลากหลาย

หน้าที่สำคัญ:

  • สร้างข้อความ (Text Generation): สามารถสร้างเนื้อหาที่เป็นธรรมชาติและมีความสอดคล้องกัน ตั้งแต่บทความ, อีเมล, สคริปต์, โค้ดโปรแกรม ไปจนถึงบทกวี
  • ตอบคำถาม (Question Answering): สามารถเข้าใจคำถามและให้คำตอบที่เกี่ยวข้องจากข้อมูลที่ได้รับการฝึกฝนมา
  • สรุปความ (Summarization): ย่อข้อความยาวๆ ให้เหลือเฉพาะใจความสำคัญได้อย่างรวดเร็ว
  • แปลภาษา (Language Translation): แปลข้อความจากภาษาหนึ่งไปอีกภาษาหนึ่งได้อย่างแม่นยำและคงความหมาย
  • วิเคราะห์ความรู้สึก (Sentiment Analysis): วิเคราะห์ข้อความเพื่อระบุอารมณ์หรือทัศนคติของผู้เขียน (เช่น บวก, ลบ, เป็นกลาง)
  • สร้างโค้ดโปรแกรม (Code Generation): สามารถสร้างโค้ดโปรแกรมในภาษาต่างๆ ได้ตามคำสั่ง
  • สนทนาโต้ตอบ (Conversational AI): เป็นรากฐานสำคัญของ Chatbot และผู้ช่วยเสมือน ทำให้สามารถสนทนาโต้ตอบกับมนุษย์ได้อย่างเป็นธรรมชาติ

เกร็ดน่ารู้:

  • ขนาดที่ใหญ่: LLM ได้ชื่อมาจาก “Large” ซึ่งหมายถึงจำนวนพารามิเตอร์ (parameters) ที่มหาศาล (อาจถึงแสนล้านหรือล้านล้านพารามิเตอร์) และขนาดของชุดข้อมูลที่ใช้ในการฝึกฝน ซึ่งมักจะมาจากอินเทอร์เน็ตทั้งหมด
  • สถาปัตยกรรม Transformer: LLM ส่วนใหญ่ใช้สถาปัตยกรรมแบบ Transformer ซึ่งเป็นโครงข่ายประสาทเทียม (Neural Network) ที่ออกแบบมาเพื่อประมวลผลข้อมูลลำดับ (Sequential Data) ได้อย่างมีประสิทธิภาพ โดยเฉพาะภาษา
  • Hallucination: เป็นข้อจำกัดหนึ่งของ LLM ที่อาจสร้างข้อมูลที่ไม่ถูกต้อง หรือไม่เป็นความจริงขึ้นมาเอง เนื่องจากโมเดลพยายามสร้างคำตอบที่ “ฟังดูเป็นไปได้” แม้ว่าจะไม่มีข้อมูลจริงรองรับก็ตาม
  • Bias: LLM อาจสะท้อนอคติ (Bias) ที่มีอยู่ในชุดข้อมูลที่ใช้ฝึกฝน เช่น อคติด้านเชื้อชาติ, เพศ หรือความคิดเห็นบางอย่าง ซึ่งเป็นความท้าทายในการพัฒนา LLM ให้เป็นกลาง
  • LLM ภาษาไทย: ปัจจุบันมีการพัฒนา LLM ที่มีความเชี่ยวชาญภาษาไทยโดยเฉพาะ เช่น OpenThaiGPT และ Typhoon เพื่อรองรับการใช้งานในบริบทภาษาไทยได้ดียิ่งขึ้น

คำศัพท์ที่เกี่ยวข้อง:

  • AI (Artificial Intelligence): ปัญญาประดิษฐ์
  • Machine Learning (ML): การเรียนรู้ของเครื่อง
  • Deep Learning (DL): การเรียนรู้เชิงลึก
  • Natural Language Processing (NLP): การประมวลผลภาษาธรรมชาติ
  • Neural Network (NN): โครงข่ายประสาทเทียม
  • Transformer: สถาปัตยกรรมโครงข่ายประสาทเทียมที่ใช้ใน LLM
  • Generative AI: ปัญญาประดิษฐ์ที่สามารถสร้างสรรค์เนื้อหาใหม่ๆ ได้
  • Prompt Engineering: ศิลปะและวิทยาศาสตร์ในการออกแบบคำสั่ง (Prompt) เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดจาก LLM

อุปกรณ์ที่เกี่ยวข้อง:

  • GPU (Graphics Processing Unit): หน่วยประมวลผลกราฟิก ประมวลผลข้อมูลจำนวนมากแบบขนาน ซึ่งจำเป็นอย่างยิ่งสำหรับการฝึกฝนและรัน LLM ขนาดใหญ่ (เช่น NVIDIA A100, H100)
  • TPU (Tensor Processing Unit): หน่วยประมวลผลที่ออกแบบมาโดยเฉพาะสำหรับการเรียนรู้ของเครื่องโดย Google
  • High-performance Computing (HPC) Infrastructure: โครงสร้างพื้นฐานคอมพิวเตอร์ประสิทธิภาพสูง ที่ประกอบด้วยเซิร์ฟเวอร์, หน่วยความจำ, และระบบจัดเก็บข้อมูลขนาดใหญ่
  • Cloud Computing Platforms: แพลตฟอร์มคลาวด์ที่ให้บริการทรัพยากรประมวลผลและจัดเก็บข้อมูลสำหรับ AI/ML (เช่น AWS, Google Cloud, Azure)

กลับหน้าหลัก: พจนานุกรมคำศัพท์คอมพิวเตอร์ฉบับ DIY PC