OpenAI GPT 5 4
|

OpenAI เปิดตัว GPT‑5.4 รุ่นเรือธงใหม่ เน้นงานสายโปรฯ ใช้คอมฯ เองได้ เก่งโค้ด เหตุผล และค้นเว็บเชิงลึกยิ่งขึ้น

OpenAI เปิดตัว GPT-5.4 โมเดลพื้นฐานรุ่นใหม่ที่บริษัทระบุว่าเป็นโมเดลแนวหน้าเพื่อการทำงานระดับมืออาชีพที่ทั้งทรงพลังและมีประสิทธิภาพสูง โดยมีให้เลือก 3 เวอร์ชัน ได้แก่ รุ่นมาตรฐาน รุ่นเน้นการให้เหตุผล (GPT-5.4 Thinking) และรุ่นสมรรถนะสูง (GPT-5.4 Pro) การเปิดตัวครั้งนี้เกิดขึ้นท่ามกลางรายได้แบบ annualized ที่ทะลุ 25,000 ล้านดอลลาร์ต่อปี และการแข่งขันที่รุนแรงขึ้นกับ Anthropic ในตลาดองค์กร

ไฮไลต์สำคัญของ GPT‑5.4

  • เปิดให้ใช้แล้วใน ChatGPT (ภายใต้ชื่อ GPT‑5.4 Thinking), API และ Codex พร้อมรุ่น GPT‑5.4 Pro สำหรับงานระดับซับซ้อนมากเป็นพิเศษ
  • รวมจุดเด่นด้านการให้เหตุผล การเขียนโค้ด และเวิร์กโฟลว์แบบเอเจนต์เข้าในโมเดลเดียว รองรับงานเอกสาร สเปรดชีต พรีเซนเทชัน และงานออฟฟิศมืออาชีพได้แม่นขึ้น ใช้โทเคนลดลงและตอบเร็วขึ้นเมื่อเทียบกับ GPT‑5.2
  • ใน ChatGPT ผู้ใช้จะเห็น “แผนคิดล่วงหน้า” ระหว่างที่โมเดลทำงาน สามารถแทรกแก้โจทย์หรือเปลี่ยนทิศทางคำสั่งได้กลางทาง ลดการถามตอบหลายรอบ
GPT 5.4 Benchmark

ประสิทธิภาพงานสายโปรและเอกสาร

  • จากเบนช์มาร์ก GDPval ที่วัดงาน knowledge work จริงใน 44 อาชีพ GPT‑5.4 ทำคะแนนชนะหรือสูสีผู้เชี่ยวชาญในอุตสาหกรรมถึง 83% สูงกว่า GPT‑5.2 ที่ 70.9% อย่างชัดเจน
  • ในงานสายไฟแนนซ์ที่ต้องทำโมเดลในสเปรดชีต GPT‑5.4 ทำคะแนนเฉลี่ย 87.3% เทียบกับ GPT‑5.2 ที่ 68.4% ขณะที่งานพรีเซนต์สไลด์ ผู้ประเมินเลือกผลงานจาก GPT‑5.4 บ่อยกว่า GPT‑5.2 ถึง 68% เพราะภาพสวย หลากหลาย และจัดองค์ประกอบดีกว่า
  • ด้านความ “ไม่มั่ว” OpenAI ระบุว่า GPT‑5.4 ลดอัตราข้อความเท็จต่อเคลมลงราว 33% และลดโอกาสที่ทั้งคำตอบจะมีข้อผิดพลาดลง 18% เมื่อเทียบกับ GPT‑5.2
  • สตาร์ตอัพกฎหมาย Harvey เผยว่า GPT‑5.4 ทำคะแนน 91% บน BigLaw Bench เหนือรุ่นก่อน โดยเด่นในงานวิเคราะห์สัญญายาว ๆ และงาน transactional ที่ซับซ้อน

ใช้คอมพิวเตอร์เอง + มองเห็นหน้าจอ

  • GPT‑5.4 เป็นโมเดล general-purpose รุ่นแรกของ OpenAI ที่มี “computer-use” แบบเนทีฟ ให้เอเจนต์ควบคุมเมาส์ คีย์บอร์ด หรือใช้ไลบรารีอย่าง Playwright เพื่อคลิกฟอร์ม เว็บแอป และเดสก์ท็อปได้เอง
  • บน OSWorld‑Verified ซึ่งจำลองการใช้เดสก์ท็อปจริงผ่านสกรีนช็อตและแอ็กชัน GPT‑5.4 ทำสำเร็จ 75% แซง GPT‑5.2 ที่ 47.3% และยังสูงกว่าคะแนนมนุษย์ที่ 72.4% ด้วย
  • บน WebArena‑Verified และ Online‑Mind2Web สำหรับการใช้เบราว์เซอร์ GPT‑5.4 ทำอัตราสำเร็จสูงสุดถึง 92.8% เมื่อใช้ภาพหน้าจออย่างเดียว แซง Agent Mode เดิมของ ChatGPT ที่ 70.9%
  • ความเข้าใจภาพก็อัปเกรด บน MMMU‑Pro GPT‑5.4 ทำได้ 81.2% (ไม่มีการใช้เครื่องมือ) สูงกว่า GPT‑5.2 ที่ 79.5% และบน OmniDocBench ค่าคลาดเคลื่อนการอ่านเอกสารลดจาก 0.140 เหลือ 0.109 สะท้อนการอ่านเอกสารสแกนและ PDF ได้แม่นขึ้น
  • เพิ่มระดับ detail ภาพแบบ original รองรับได้ถึงราว 10.24 ล้านพิกเซล เพื่อเคสที่ต้องการความละเอียดสูง เช่น อินเทอร์เฟซแน่น ๆ หรือเอกสารที่มีตัวอักษรเล็ก

โค้ดดิ้งและเอเจนต์ใช้เครื่องมือ

  • GPT‑5.4 ยกเอาความสามารถโค้ดของ GPT‑5.3‑Codex มาใส่ รวมกับทักษะ reasoning และ computer‑use ทำให้เหมาะกับงานโค้ดที่ต้องรันเครื่องมือ ทดสอบ และดีบักยาว ๆ
  • บน SWE‑Bench Pro โมเดลใหม่ทำได้ 57.7% แซง GPT‑5.3‑Codex (56.8%) และ GPT‑5.2 (55.6%) พร้อม latency ลดลงเมื่อเปิด reasoning effort ระดับต่าง ๆ
  • ใน Codex มีโหมด /fast เพิ่มความเร็วการปล่อยโทเคนถึง 1.5 เท่า โดยใช้ GPT‑5.4 ตัวเดิม ทำให้นักพัฒนาทำงานเขียนโค้ดและดีบักได้ต่อเนื่องขึ้น
  • OpenAI ยังโชว์สกิลใหม่ “Playwright (Interactive)” ให้โมเดลใช้ Playwright ทดสอบและดีบักเว็บ/แอป Electron แบบเห็นภาพจริง เช่น สร้างเกมจำลองสวนสนุกจากพรอมต์เดียว แล้วให้เอเจนต์เล่นและทดสอบเกมเอง

Tool search, เว็บเสิร์ช และความปลอดภัย

  • GPT‑5.4 เพิ่มความสามารถ “tool search” ใน API ให้โมเดลค้นหา definition ของเครื่องมือเฉพาะตอนที่ต้องใช้ แทนการยัดสเปกเครื่องมือจำนวนมากเข้าไปในคอนเท็กซ์ทุกครั้ง ช่วยลดโทเคนได้สูง (ทดสอบกับ MCP Atlas ลดโทเคนรวมได้ 47% โดยความแม่นเท่าเดิม)
  • บนเบนช์มาร์ก Toolathlon ที่วัดการใช้งานเครื่องมือหลายขั้นตอน GPT‑5.4 ตัดสินใจเรียกใช้เครื่องมือแม่นขึ้น ใช้รอบน้อยลง และลด latency รวม
  • ด้านเว็บเสิร์ช GPT‑5.4 ทำคะแนน BrowseComp ได้ 82.7% ส่วนรุ่น Pro ขึ้นไปถึง 89.3% หมายถึงการหา “เข็มในกองฟาง” จากเว็บหลายรอบได้ดีขึ้นและสรุปคำตอบแบบมีเหตุผลมากขึ้น
  • เรื่องความปลอดภัย OpenAI จัด GPT‑5.4 อยู่ระดับ “High cyber capability” ภายใต้ Preparedness Framework พร้อมระบบมอนิเตอร์ ซ้อนชั้นการบล็อกคำขอเสี่ยงสูง และวิจัยความสามารถในการ “หลบซ่อน” chain‑of‑thought ซึ่งผลระบุว่า GPT‑5.4 Thinking ควบคุม CoT ได้ต่ำ ถือเป็นสัญญาณบวกด้านการมอนิเตอร์

การเปิดให้ใช้งานและราคา

  • GPT‑5.4 เปิดให้ใช้แล้วใน API ภายใต้ชื่อ gpt-5.4 ส่วนรุ่นประสิทธิภาพสูงสุดคือ gpt-5.4-pro
  • ใน ChatGPT โมเดล GPT‑5.4 Thinking จะมาแทน GPT‑5.2 Thinking สำหรับผู้ใช้ Plus, Team และ Pro ขณะที่ GPT‑5.2 Thinking จะถูกย้ายไปหมวด Legacy และเลิกให้ใช้ในวันที่ 5 มิถุนายน 2026; ลูกค้า Enterprise/Edu เปิดใช้ล่วงหน้าได้จากหน้าแอดมิน
  • GPT‑5.4 เป็น reasoning model หลักรุ่นแรกที่รวมความสามารถโค้ดระดับ GPT‑5.3‑Codex และจะทยอยกลายเป็นรุ่นมาตรฐานทั้งใน ChatGPT, API และ Codex โดยรองรับ context window สูงสุด 1M โทเคนใน Codex แบบทดลอง (คิดโควตาเพิ่ม 2 เท่าเมื่อเกิน 272K โทเคน)
  • ด้านราคา API: GPT‑5.2 คิด 1.75 ดอลลาร์ต่อ 1M โทเคนอินพุต และ 14 ดอลลาร์ต่อ 1M โทเคนเอาต์พุต ขณะที่ GPT‑5.4 ปรับเป็น 2.50 ดอลลาร์ต่อ 1M โทเคนอินพุต และ 15 ดอลลาร์ต่อ 1M โทเคนเอาต์พุต ส่วนรุ่น Pro อยู่ที่ 30 ดอลลาร์ต่อ 1M โทเคนอินพุต และ 180 ดอลลาร์ต่อ 1M โทเคนเอาต์พุต โดยมีราคาแบบ Batch/Flex และ Priority ให้เลือก

ข้อมูล: OpenAI