Google ได้ประกาศเปิดตัว Gemini 2.5 Pro Preview (I/O edition) เวอร์ชันอัปเดตล่วงหน้าก่อนงาน Google I/O ที่จะจัดขึ้นในเดือนนี้ การอัปเดตครั้งนี้มุ่งเน้นไปที่การเสริมสร้างความสามารถด้านการเขียนโค้ดให้แข็งแกร่งยิ่งขึ้น เพื่อให้นักพัฒนาสามารถเริ่มใช้งานได้เร็วขึ้น
ที่ผ่านมานักพัฒนาได้แสดงให้เห็นถึงความสามารถที่น่าทึ่งของ Gemini 2.5 Pro ในเวอร์ชันก่อนหน้า และการอัปเดตครั้งนี้จะนำเสนอ การปรับปรุงที่มีความหมายสำหรับการพัฒนาส่วนหน้า (front-end) และส่วนติดต่อผู้ใช้ (UI) ควบคู่ไปกับการพัฒนาความสามารถในงานเขียนโค้ดพื้นฐาน เช่น การแปลงและแก้ไขโค้ด และการสร้าง agentic workflows ที่ซับซ้อน
ประสิทธิภาพชั้นนำด้านการพัฒนาเว็บส่วนหน้า
Gemini 2.5 Pro เวอร์ชันใหม่นี้ได้รับการจัดอันดับให้เป็นอันดับ 1 บนกระดานผู้นำ WebDev Arena ซึ่งใช้วัดความพึงพอใจของผู้ใช้งานในความสามารถของโมเดลในการสร้างเว็บแอปพลิเคชันที่สวยงามน่าใช้และทำงานได้จริง ด้วยความสามารถระดับชั้นนำนี้ Gemini 2.5 Pro ได้ถูกนำไปใช้ขับเคลื่อน Code Agent ที่เป็นนวัตกรรมของ Cursor และเสริมความร่วมมือกับบริษัทต่างๆ เช่น Cognition และ Replit เพื่อผลักดันขีดจำกัดของการเขียนโปรแกรมแบบ Agentic และเปิดโอกาสใหม่ๆ สำหรับนักพัฒนา
Michele Catasta ประธานของ Replit กล่าวว่าพวกเขาพบว่า Gemini 2.5 Pro เป็น โมเดลระดับแนวหน้าที่ดีที่สุดในด้านอัตราส่วน “ความสามารถต่อความหน่วง (capability over latency)” ซึ่งเหมาะสำหรับงานที่ต้องการความหน่วงต่ำแต่ต้องมีความน่าเชื่อถือสูง
Silas Alberti จากทีมผู้ก่อตั้ง Cognition ได้กล่าวว่า Gemini 2.5 Pro เวอร์ชันอัปเดตนี้ มีประสิทธิภาพชั้นนำในการประเมินระดับนักพัฒนารุ่นเยาว์ (junior-dev evals) และเป็นโมเดลแรกที่สามารถแก้ไขหนึ่งในการประเมินที่เกี่ยวข้องกับการปรับโครงสร้าง (refactor) ส่วนแบ็คเอนด์ของการจัดการคำขอขนาดใหญ่ได้ เขายังกล่าวว่ามัน ให้ความรู้สึกเหมือนนักพัฒนารุ่นพี่ที่มีประสบการณ์ เพราะสามารถตัดสินใจได้อย่างถูกต้องและเลือก abstraction ที่ดีได้
Gemini 2.5 Pro ในการใช้งานจริง
ด้วยความเข้าใจโค้ดอย่างลึกซึ้งผนวกกับความสามารถในการใช้เหตุผลอันทรงพลัง Gemini 2.5 Pro ยังคงเป็นโมเดลหลักสำหรับนักพัฒนา ตัวอย่างการใช้งานที่น่าตื่นเต้น ได้แก่:
- วิดีโอแปลงเป็นโค้ด (Video to code): Gemini 2.5 Pro นำเสนอความสามารถในการเข้าใจวิดีโอที่ล้ำสมัย โดยได้คะแนน 84.8% บนเกณฑ์มาตรฐาน VideoMME การรวมความสามารถนี้เข้ากับการเขียนโค้ดทำให้เกิด workflow ใหม่ๆ ที่ไม่เคยมีมาก่อน ตัวอย่างเช่น “Video to Learning App” ใน Google AI Studio แสดงให้เห็นว่า Gemini 2.5 Pro สามารถสร้างแอปพลิเคชันการเรียนรู้แบบโต้ตอบจากวิดีโอ YouTube เพียงคลิปเดียวได้อย่างไร
- การพัฒนาฟีเจอร์ที่ง่ายขึ้น (Easier feature development): โมเดลนี้มีความสามารถที่แข็งแกร่งในการพัฒนาเว็บส่วนหน้า ช่วยให้ทำงานได้มากขึ้น ในอดี การเพิ่มฟีเจอร์ใหม่หมายถึงการตรวจสอบไฟล์ดีไซน์และส่วนประกอบต่างๆ เพื่อให้ตรงกับคุณสมบัติสไตล์ เช่น สี ฟอนต์ padding, margins, และ borders จากนั้นจึงเขียนโค้ด CSS ที่จำเป็นเพื่อจำลองคุณสมบัติทางสายตาเหล่านั้นอย่างแม่นยำ แต่ตอนนี้ Gemini 2.5 Pro สามารถช่วยสร้างฟีเจอร์ใหม่ๆ เช่น การเพิ่มเครื่องเล่นวิดีโอในสไตล์เดียวกับแอปอื่นๆ
- แปลงแนวคิดเป็นแอปที่ใช้งานได้รวดเร็ว (Quick concepts to working apps): การนำไอเดียมาทำให้มีชีวิตชีวาพร้อมฟังก์ชันการทำงานและ UI ที่สวยงามกลายเป็นเรื่องง่ายขึ้นด้วย Gemini 2.5 Pro แอปพลิเคชันเริ่มต้นสำหรับการเขียนตามคำบอก (dictation starter app) ที่สร้างขึ้นโดยใช้โมเดลเวอร์ชันอัปเดตนี้เป็นตัวอย่างที่ดี โมเดลนี้มีรสนิยมที่ดีในการพัฒนาเว็บที่เน้นความสวยงามโดยค่าเริ่มต้น ขณะเดียวกันก็ยังสามารถควบคุมได้ ช่วยให้นักพัฒนาสามารถเปลี่ยนแนวคิดไปสู่เว็บแอปพลิเคชันที่ใช้งานได้จริงอย่างรวดเร็ว Gemini 2.5 Pro สามารถออกแบบและเขียนโค้ดแอนิเมชัน UI ของไมโครโฟนสำหรับแอปเริ่มต้นการเขียนตามคำบอกนี้ได้
การใช้งาน Gemini 2.5 Pro
นักพัฒนาสามารถเริ่มสร้างสรรค์ผลงานด้วย Gemini 2.5 Pro ผ่าน Gemini API ใน Google AI Studio และลูกค้าองค์กรสามารถใช้ Vertex AI ได้
สำหรับนักพัฒนาที่ใช้งาน Gemini 2.5 Pro อยู่แล้ว เวอร์ชันใหม่นี้จะไม่เพียงแต่ปรับปรุงประสิทธิภาพด้านการเขียนโค้ดเท่านั้น แต่ยังจะแก้ไขปัญหาที่นักพัฒนาแจ้งเข้ามา รวมถึง การลดข้อผิดพลาดในการเรียกใช้ฟังก์ชัน (function calling) และ การปรับปรุงอัตราการเรียกใช้ฟังก์ชัน (function calling trigger rates) เวอร์ชันก่อนหน้าจะถูกเปลี่ยนเส้นทางไปยังเวอร์ชันล่าสุดโดยอัตโนมัติ ดังนั้นจึงไม่จำเป็นต้องดำเนินการใดๆ เพื่อใช้งานโมเดลที่ได้รับการปรับปรุง และยังคง ใช้งานได้ในราคาเดิม
ข้อมูล Google