LLM คือโมเดลปัญญาประดิษฐ์ (AI) ประเภทหนึ่งที่ได้รับการฝึกฝนด้วยชุดข้อมูลข้อความขนาดมหาศาล เพื่อให้สามารถเข้าใจ สร้าง และประมวลผลภาษามนุษย์ได้อย่างเป็นธรรมชาติ โดยมีความสามารถในการเรียนรู้รูปแบบและความสัมพันธ์ของคำ วลี และประโยคในภาษาต่าง ๆ ทำให้สามารถตอบคำถาม สร้างสรรค์เนื้อหา สรุปข้อความ แปลภาษา และทำงานที่เกี่ยวข้องกับภาษาได้หลากหลาย

หน้าที่สำคัญ:

สร้างข้อความ (Text Generation): สามารถสร้างเนื้อหาที่เป็นธรรมชาติและมีความสอดคล้องกัน ตั้งแต่บทความ, อีเมล, สคริปต์, โค้ดโปรแกรม ไปจนถึงบทกวี
ตอบคำถาม (Question Answering): สามารถเข้าใจคำถามและให้คำตอบที่เกี่ยวข้องจากข้อมูลที่ได้รับการฝึกฝนมา
สรุปความ (Summarization): ย่อข้อความยาวๆ ให้เหลือเฉพาะใจความสำคัญได้อย่างรวดเร็ว
แปลภาษา (Language Translation): แปลข้อความจากภาษาหนึ่งไปอีกภาษาหนึ่งได้อย่างแม่นยำและคงความหมาย
วิเคราะห์ความรู้สึก (Sentiment Analysis): วิเคราะห์ข้อความเพื่อระบุอารมณ์หรือทัศนคติของผู้เขียน (เช่น บวก, ลบ, เป็นกลาง)
สร้างโค้ดโปรแกรม (Code Generation): สามารถสร้างโค้ดโปรแกรมในภาษาต่างๆ ได้ตามคำสั่ง
สนทนาโต้ตอบ (Conversational AI): เป็นรากฐานสำคัญของ Chatbot และผู้ช่วยเสมือน ทำให้สามารถสนทนาโต้ตอบกับมนุษย์ได้อย่างเป็นธรรมชาติ

เกร็ดน่ารู้:

ขนาดที่ใหญ่: LLM ได้ชื่อมาจาก “Large” ซึ่งหมายถึงจำนวนพารามิเตอร์ (parameters) ที่มหาศาล (อาจถึงแสนล้านหรือล้านล้านพารามิเตอร์) และขนาดของชุดข้อมูลที่ใช้ในการฝึกฝน ซึ่งมักจะมาจากอินเทอร์เน็ตทั้งหมด
สถาปัตยกรรม Transformer: LLM ส่วนใหญ่ใช้สถาปัตยกรรมแบบ Transformer ซึ่งเป็นโครงข่ายประสาทเทียม (Neural Network) ที่ออกแบบมาเพื่อประมวลผลข้อมูลลำดับ (Sequential Data) ได้อย่างมีประสิทธิภาพ โดยเฉพาะภาษา
Hallucination: เป็นข้อจำกัดหนึ่งของ LLM ที่อาจสร้างข้อมูลที่ไม่ถูกต้อง หรือไม่เป็นความจริงขึ้นมาเอง เนื่องจากโมเดลพยายามสร้างคำตอบที่ “ฟังดูเป็นไปได้” แม้ว่าจะไม่มีข้อมูลจริงรองรับก็ตาม
Bias: LLM อาจสะท้อนอคติ (Bias) ที่มีอยู่ในชุดข้อมูลที่ใช้ฝึกฝน เช่น อคติด้านเชื้อชาติ, เพศ หรือความคิดเห็นบางอย่าง ซึ่งเป็นความท้าทายในการพัฒนา LLM ให้เป็นกลาง
LLM ภาษาไทย: ปัจจุบันมีการพัฒนา LLM ที่มีความเชี่ยวชาญภาษาไทยโดยเฉพาะ เช่น OpenThaiGPT และ Typhoon เพื่อรองรับการใช้งานในบริบทภาษาไทยได้ดียิ่งขึ้น

คำศัพท์ที่เกี่ยวข้อง:

AI (Artificial Intelligence): ปัญญาประดิษฐ์
Machine Learning (ML): การเรียนรู้ของเครื่อง
Deep Learning (DL): การเรียนรู้เชิงลึก
Natural Language Processing (NLP): การประมวลผลภาษาธรรมชาติ
Neural Network (NN): โครงข่ายประสาทเทียม
Transformer: สถาปัตยกรรมโครงข่ายประสาทเทียมที่ใช้ใน LLM
Generative AI: ปัญญาประดิษฐ์ที่สามารถสร้างสรรค์เนื้อหาใหม่ๆ ได้
Prompt Engineering: ศิลปะและวิทยาศาสตร์ในการออกแบบคำสั่ง (Prompt) เพื่อให้ได้ผลลัพธ์ที่ดีที่สุดจาก LLM

อุปกรณ์ที่เกี่ยวข้อง:

GPU (Graphics Processing Unit): หน่วยประมวลผลกราฟิก ประมวลผลข้อมูลจำนวนมากแบบขนาน ซึ่งจำเป็นอย่างยิ่งสำหรับการฝึกฝนและรัน LLM ขนาดใหญ่ (เช่น NVIDIA A100, H100)
TPU (Tensor Processing Unit): หน่วยประมวลผลที่ออกแบบมาโดยเฉพาะสำหรับการเรียนรู้ของเครื่องโดย Google
High-performance Computing (HPC) Infrastructure: โครงสร้างพื้นฐานคอมพิวเตอร์ประสิทธิภาพสูง ที่ประกอบด้วยเซิร์ฟเวอร์, หน่วยความจำ, และระบบจัดเก็บข้อมูลขนาดใหญ่
Cloud Computing Platforms: แพลตฟอร์มคลาวด์ที่ให้บริการทรัพยากรประมวลผลและจัดเก็บข้อมูลสำหรับ AI/ML (เช่น AWS, Google Cloud, Azure)

กลับหน้าหลัก: พจนานุกรมคำศัพท์คอมพิวเตอร์ฉบับ DIY PC

LLM (Large Language Model)

หน้าที่สำคัญ:

เกร็ดน่ารู้:

คำศัพท์ที่เกี่ยวข้อง:

อุปกรณ์ที่เกี่ยวข้อง:

Last update:

Beginner's Guide: