OpenAI เปิดตัว GPT‑5.2 ประสิทธิภาพสูงสุดสำหรับการทำงานด้วยความรู้ระดับมืออาชีพ
GPT‑5.2 Thinking ถูกวางตัวเป็นโมเดลหลักสำหรับงานมืออาชีพ เช่น งานวิเคราะห์ธุรกิจ การเงิน การจัดตาราง การทำสไลด์ และแบบจำลองในสเปรดชีต โมเดลนี้เป็นรุ่นแรกของ OpenAI ที่ทำผลงานใน GDPval ได้ระดับใกล้หรือเหนือผู้เชี่ยวชาญจริงในหลายอาชีพ ครอบคลุม 44 สายงานจาก 9 อุตสาหกรรมใหญ่ (เป็นการใช้งานจากฐานข้อมูลความรู้ในสหรัฐ) ซึ่งอันนี้ผู้ใช้เองอาจจะต้องระวังการประยุกต์บางส่วนที่มีรายละเอียดขั้นตอนการทำงานในแต่ละภูมิภาคหรือแต่ละประเทศที่ต่างกันออกไป
ในชุดงานจำลองบทบาทนักวิเคราะห์ฝึกหัดสาย investment banking คะแนนเฉลี่ยของ GPT‑5.2 Thinking สูงกว่า GPT‑5.1 ราว 9.3 จุด แสดงให้เห็นว่ารุ่นใหม่สามารถรับมือโมเดลการเงินที่ซับซ้อนและมีการอ้างอิงแหล่งข้อมูลได้ดีขึ้น ตัวอย่างสเปรดชีตและสไลด์ที่ OpenAI นำมาเปรียบเทียบก็ชี้ให้เห็นว่างานจัดรูปแบบและโครงสร้างดีขึ้นอย่างชัดเจน
ความสามารถด้านโค้ดและเอเจนต์
ด้านซอฟต์แวร์ GPT‑5.2 Thinking ทำคะแนนใหม่ใน SWE‑Bench Pro ได้ 55.6% และใน SWE‑bench Verified ถึง 80% แสดงศักยภาพในงานแก้บั๊ก เติมฟีเจอร์ และรีแฟกเตอร์โค้ดในโครงการจริงหลายภาษา ไม่จำกัดแค่ Python พาร์ตเนอร์อย่าง Windsurf, Warp, JetBrains, Harvey และ Augment Code ระบุว่ารุ่นนี้ดีกว่ารุ่นก่อนอย่างมีนัยสำคัญ โดยเฉพาะงาน interactive coding, code review และการหาบัก
ในเชิง “agentic coding” GPT‑5.2 ถูกออกแบบให้ประสานงานกับเครื่องมือหลายตัวได้มีเสถียรภาพมากขึ้น ทำให้ระบบเอเจนต์ที่เคยต้องใช้หลายโมเดลและพรอมต์ซับซ้อน สามารถยุบเหลือเอเจนต์หลักตัวเดียวที่เรียกใช้เครื่องมือกว่า 20 ตัวได้อย่างเสถียร เร็วขึ้น ฉลาดขึ้น และดูแลง่ายขึ้น

Long context, Vision และการเรียกใช้เครื่องมือ
ด้าน long context, GPT‑5.2 Thinking ทำคะแนนนำในชุดทดสอบ OpenAI MRCRv2 โดยเฉพาะงานแบบงมเข็มในมหาสมุทรในเอกสารยาวถึงระดับ 256k โทเคน และสามารถตอบได้เกือบสมบูรณ์ในบางโหมด สิ่งนี้ทำให้เหมาะกับงานวิเคราะห์สัญญา รายงานวิจัย และโปรเจ็กต์หลายไฟล์ที่มีบริบทจำนวนมาก
ในด้านวิชั่น GPT‑5.2 ลดอัตราความผิดพลาดในการอ่านกราฟและ UI ลงราวครึ่งหนึ่งเมื่อเทียบกับ GPT‑5.1 ทำให้ใช้งานร่วมกับแดชบอร์ด สกรีนช็อตซอฟต์แวร์ แผนผังเทคนิค และรายงานเชิงภาพได้ดีขึ้น ในการเรียกใช้เครื่องมือ โมเดลทำคะแนน 98.7% บน Tau2‑bench Telecom ซึ่งเป็นงานบริการลูกค้าที่ต้องใช้หลายทูลในหลายเทิร์น แปลว่าพร้อมสำหรับเวิร์กโฟลว์เอเจนต์แบบ end‑to‑end มากขึ้น
ความถูกต้อง ความปลอดภัย และสุขภาพจิต
OpenAI ระบุว่า GPT‑5.2 Thinking มีอัตราการตอบผิด (hallucination) ลดลงจาก GPT‑5.1 ราว 30% จากชุดคำถามที่สุ่มมาจากการใช้งาน ChatGPT (ทั้งในโหมดที่ใช้ search และไม่ใช้ search) สำหรับผู้ใช้ระดับมืออาชีพ นั่นหมายถึงความเสี่ยงของข้อผิดพลาดนั้นลดลงไม่ว่าจะเป็นในงานวิจัย การเขียน และการตัดสิน แม้ยังจำเป็นต้องตรวจสอบซ้ำในงานที่ต้องการความถูกต้องสูง
ในด้านความปลอดภัย GPT‑5.2 ต่อยอดจากแนวคิด safe completion ของ GPT‑5 และมีการเสริมความสามารถตอบสนองในบริบทอ่อนไหว เช่น ภาวะซึมเศร้า การคิดทำร้ายตนเอง หรือการพึ่งพาทางอารมณ์กับโมเดล OpenAI ยังเริ่มทดสอบโมเดลคาดเดาอายุเพื่อเปิดใช้การป้องกันเนื้อหาสำหรับผู้ใช้อายุต่ำกว่า 18 ปีโดยอัตโนมัติ ร่วมกับระบบควบคุมโดยผู้ปกครองที่มีอยู่แล้ว
การใช้งานใน ChatGPT และ API
ใน ChatGPT โมเดล GPT‑5.2 แบ่งบทบาทชัดเจน: Instant สำหรับงานทั่วไปเร็วๆ, Thinking สำหรับงานลึกอย่างการสรุปเอกสารยาว เขียนโค้ด และวางแผน และ Pro สำหรับโจทย์ยากที่ต้องการคุณภาพสูงสุดแม้ใช้เวลานานกว่า GPT‑5.2 เริ่มทยอยเปิดให้ผู้ใช้แบบ Plus, Pro, Go, Business และ Enterprise แล้ว ขณะที่ GPT‑5.1 จะยังคงให้ใช้ในหมวด legacy อีกประมาณสามเดือนก่อนถูกถอดออกจาก ChatGPT
ใน API รุ่น Thinking ใช้ชื่อ gpt-5.2, รุ่น Instant ใช้ gpt-5.2-chat-latest ส่วนรุ่น Pro คือ gpt-5.2-pro โดยทั้ง Thinking และ Pro รองรับ reasoning effort ระดับใหม่ xhigh เพื่อเน้นคุณภาพสูงสุด ด้านราคา GPT‑5.2 อยู่ที่ 1.75 ดอลลาร์ต่อ 1M input tokens และ 14 ดอลลาร์ต่อ 1M output tokens โดยมีส่วนลด 90% สำหรับโทเคนที่ถูก cache ขณะที่ GPT‑5.2 Pro มีราคาสูงกว่าตามศักยภาพ OpenAI ระบุว่ายังไม่มีแผนเลิกให้บริการ GPT‑5.1, GPT‑5 หรือ GPT‑4.1 ใน API ในระยะใกล้ และจะประกาศล่วงหน้าหากมีการ deprecate
โครงสร้างพื้นฐานและทิศทางต่อไป
GPT‑5.2 ถูกเทรนและดีพลอยบนโครงสร้างพื้นฐานร่วมกับพันธมิตรอย่าง Microsoft และ NVIDIA โดยใช้ GPU ประสิทธิภาพสูงอย่าง H100, H200 และ GB200‑NVL72 ในศูนย์ข้อมูล Azure เพื่อเร่งกระบวนการเทรนและเปิดตัวโมเดลรุ่นใหม่ ความร่วมมือนี้ช่วยให้ OpenAI สามารถสเกล compute สำหรับโมเดลแนวหน้าได้อย่างมั่นใจและทำให้การออกฟีเจอร์ใหม่ถึงมือผู้ใช้เร็วขึ้น
OpenAI ย้ำว่า GPT‑5.2 เป็นเพียงอีกหนึ่งก้าวในเส้นทางพัฒนาโมเดล ไม่ใช่จุดสิ้นสุด และยังมีประเด็นที่ผู้ใช้คาดหวังให้ปรับปรุง เช่น การปฏิเสธคำขอเกินจำเป็น รวมถึงการยกระดับด้านความปลอดภัยและความน่าเชื่อถืออย่างต่อเนื่อง สำหรับสายงานมืออาชีพและนักพัฒนา นี่คือการอัปเกรดที่เน้น “ทำงานแทน” มากกว่าการเป็นแชตบอตสนทนาเพียงอย่างเดียว
ข้อมูล: OpenAI