เจาะลึกกราฟิกชิป Intel Arc A-Series สถาปัตยกรรม Xe-HPG (Alchemist)

ตอนนี้อินเทลได้ลงมาเป็นผู้เล่นอีกหนึ่งรายในตลาดกราฟิกชิป และกราฟิกการ์ด อย่างเต็มตัวแล้ว เริ่มด้วยการเปิดตัวกราฟิก Intel Arc A-Series ในโน้ตบุ๊กเมื่อตอนต้นปี และกราฟิกการ์ดแยกในตลาดเดสก์ท็อปที่ทะยอยเปิดตัวมาเป็นระยะ ๆ ซึ่งในบ้านเราตอนนี้ก็จะมีอยู่ด้วยกันสามรุ่นหลัก ๆ คือ Intel Arc A380 ตามมาด้วย Intel Arc A750 และ Intel Arc A770 แม้ Intel Arc จะเป็นน้องใหม่ในตลาดกราฟิกชิป แต่คุณสมบัติและความสามารถในการทำงานนั้นเรียกได้ว่าจัดมาเต็มครบทุกฟังก์ชันเลยละครับ

บทความนี้จะนำทุกท่านไปรู้จักกับความเป็นมาของกราฟิก Intel Arc และรายละเอียดในเชิงลึกนะครับว่ามีความเหมือนและแตกต่างไปจากกราฟิกอื่น ๆ ที่มีอยู่แล้วในตลาดอย่างไรบ้าง

กว่าจะเห็นเป็นกราฟิก Intel Arc A-Series 

ย้อนไปในปี 1998 อินเทลได้เปิดตัวการ์ดจอตัวแรกออกสู่ตลาดโดยมีชื่อว่า Intel 740 แต่ว่าการ์ดจอรุ่นนี้อินเทลไม่ได้เป็นคนพัฒนาเองตั้งแต่แรก แต่ว่าไปซื้อเทคโนโลยีการ์ดจอรุ่นนี้มาจากบริษัท Real3D ซึ่งเป็นบริษัทลูกของ Lockheed Martin ผู้ผลิตเครื่องบิน เหตุผลที่อินเทลต้องไปซื้อเทคโนโลยีกราฟิกมาก็เพราะว่าในช่วงนั้นตลาดกราฟิกชิปกำลังเติบโตอย่างมากมีผู้ผลิตกราฟิกชิปออกมาป้อนตลาดมากมาย ไม่ว่าจะเป็น ATI, NVIDIA, S3, Voodoo, Matrox และ PowerVR เป็นต้น

อย่างไรก็ตามหลังจากได้วางตลาด Intel 740 ไปแล้ว หลังจากนั้นอินเทลได้เปิดตัวกราฟิกออกมาอีกหนึ่งรุ่นเท่านั้นคือ Intel 752 แต่ก็แทบไม่ได้เห็นในท้องตลาด จากนั้นอินเทลก็นำเทคโนโลยีกราฟิกที่มีอยู่ไปรวมกับชิปเซตแทน และจากนั้นอินเทลก็ไม่เคยมีการ์ดจอแบบแยกออกสู่ตลาดอีกเลย

อย่างไรก็ตามแม้ว่าอินเทลจะไม่ได้ทำการ์ดจอแยก แต่ว่ากราฟิกที่รวมอยู่ในชิปเซตก็มีการพัฒนาต่อเนื่องมาเรื่อย ๆ จนในที่สุดก็นำมารวมเป็นส่วนหนึ่งในตัวซีพียูด้วยเลย และทำให้ิอินเทลครองตลาดกราฟิกระดับล่างที่ใช้งานพื้นฐาน ไปโดยปริยาย  อันนี้เป็นการนับรวมกราฟิกทั้งตลาดโดยไม่สนใจว่าเป็นกราฟิกแบบแยกหรือกราฟิกแบบรวมในตัวซีพียู

จนกระทั่งในช่วงปลายปี 2020 อินเทลก็ได้ออกการ์ดจอแยกออกมาสู่ตลาดอีกครั้งโดยใช้ชื่อว่า Intel DG1 หรือแต่ถ้าจะให้พูดถึงส่วนที่เป็นกราฟิกชิปจะเรียกชื่อเต็ม ๆ อย่างเป็นทางการว่า Intel Iris Xe MAX Graphics 

แต่ว่า Intel DG1 ก็ออกมาแบบจำกัด เช่นมีเฉพาะในจีน และใช้งานร่วมกับเมนบอร์ดได้เป็นบางรุ่นที่อินเทลกำหนดเท่านั้น โดยทำการล็อกจากไบออสของเมนบอร์ดครับ เรียกได้ว่าเป็นการทดสอบตลาดครั้งแรกในรอบเกือบ 20 ปีก็ว่าได้ 

สำหรับซีพียูอินเทลรุ่นล่าสุดอย่าง คอร์ เจนฯ 12 และ เจนฯ 13 อินเทลก็ได้ปรับเปลี่ยนมาใช้สถาปัตยกรรม Xe ที่อยู่ในระดับเดียวกันกับ Intel DG1 เพียงแต่ประสิทธิภาพอาจจะน้อยกว่าเพราะถูกจำกัดเรื่องการใช้พลังงานและต้องใช้หน่วยความจำร่วมกันกับซีพียู

Gen 9 และ Gen 11 ในภาพนี้ไม่ได้หมายถึงเจนเนอร์เรชันของซีพียู แต่หมายถึงเจนเนอร์เรชันของกราฟิก iGPU ที่อยู่ในตัวของซีพียูครับ

ในด้านของสถาปัตยกรรม Intel DG1 และ iGPU ที่อยู๋ในซีพียู คอร์ เจนฯ 12 และ 13 นั้นก็ถือว่าเป็นสถาปัตยกรรม Intel Xe เช่นกัน แต่จัดอยู่ในกลุ่ม Xe-LP, LP นี้หมายถึง Low Power ที่เน้นการใช้พลังงานต่ำ แต่ยังคงประสิทธิภาพเพียงพอสำหรับการใช้งานทั่วไปรวมถึงงานด้านตัดต่อวิดีโอ แต่ว่าทั้งหมดนี้ก็ยังไม่ใช่ Intel Xe-HPG ที่เราจะพูดถึงกันในบทความนี้ครับ

และจากนั้นในปลายปี 2021 อินเทลก็ได้ประกาศเปิดตัวกราฟิกชิปแบบแยก Intel Arc A-Series โดยจะมีทั้งกราฟิกชิปสำหรับโน้ตบุ๊กและกราฟิกชิปสำหรับตลาดเดสก์ท็อป 

Intel Arc Mobile
อินเทลเปิดตัวกราฟิกชิป Intel Arc A-Series สถาปัตยกรรม Xe-HPG (Alchemist) ลงตลาดโน้ตบุ๊กก่อน

ในที่สุดเมื่อถึงปี 2022 อินเทลก็ได้ทำตามสัญญาด้วยการส่ง Intel Arc A350M ลงสู่ตลาดครั้งแรกในโน้ตบุ๊ก เป็นการประเดิมกราฟิกแยกรุ่นแรก และก็ได้ปล่อย Arc A370M, A550M และ A730M ตามออกมา แต่ทั้งหมดก็ยังเป็นกราฟิกสำหรับโน้ตบุ๊ก  อย่างไรก็ตามกราฟิกเหล่านี้ก็ถือว่าจัดอยู่ในหมวดของ Intel Xe-HPG (High Performance Gaming) แล้ว นี่เริ่มให้ความสำคัญกับกลุ่มผู้ใช้ที่เป็นเกมเมอร์ สตรีมเมอร์ และเหล่าคอนเทนต์ครีเอเตอร์ ที่รวม ๆ แล้วคือกลุ่มผู้ใช้งานกราฟิกการ์ดในระดับที่จริงจัง คือไม่ใช่แค่เรื่องประสิทธิภาพด้านเฟรมเรตอย่างเดียว แต่ยังต้องการกราฟิกที่ตอบโจทย์เรื่องอื่น ๆ เช่น AI และ Video Codec ที่มีประสิทธิภาพสูง

Intel Arc Desktop
ข้อมูล Intel Arc A-Series สำหรับเดสก์ท้อปที่เปิดตัวมาครั้งแรกสุด แต่ว่าตอนนี้มีการเพิ่ม Arc A310 เข้ามาอีกหนึ่ง

เราต้องรอกันจนถึงปลายไตรมาสที่สองของปี 2022 เราถึงได้เห็นการ์ดจอแยกสำหรับเดสก์ท็อป Intel Arc A380 แต่ก็ยังเป็นการเปิดตัวเฉพาะประเทศจีนเช่นเดิม แม้ครั้งนี้ตัวการ์ดจอ Intel Arc A380 จะไม่ถูกจำกัดการใช้งานเหมือน Intel DG1 แต่ก็ถูกจำกัดด้วยปริมาณที่ส่งออกมาสู่ตลาด และเหตุผลหลักที่เป็นเช่นนั้นก็คือ ปัญหาเรื่องไดรเวอร์

โควิด ช่วงเวลาที่ยากลำบาก

ใช่แล้วครับไดรเวอร์มีส่วนสำคัญอย่างมากที่จะทำให้การ์ดจอแต่ละรุ่นสามารถแสดงประสิทธิภาพในการทำงานที่แท้จริงออกมาได้ 

จะว่าไปเรื่องนี้ก็น่าเห็นใจทีมงานด้านกราฟิกของอินเทลอยู่พอสมควร เพราะถ้าเราลองย้อนเวลาไป เราก็จะพบว่าอินเทลเพิ่งตั้งทีมทำโครงกราฟิก Arc อย่างเป็นทางการก่อนช่วงโควิดระบาดได้ไม่นานนัก และที่จริงต้องบอกว่าอินเทลเก่งมากที่สามารถสร้างผลิตภัณฑ์ใหม่ได้ในช่วงเวลาที่กิจกรรมทุกอย่างบนโลกแทบจะหยุดลง

ลองนึกภาพเราที่ต้องปรับตัวมา Work from Home หรือเรียนออนไลน์กันทั้งประเทศก็มีสภาพทุลักทุเลพอควร แล้วนี่คืองานสร้างกราฟิกชิป ชิปประมวลผลที่โคตรจะมีความซับซ้อน เพราะมันไม่ใช่แค่ขั้นตอนการออกแบบอยู่บนเครื่องคอมพิวเตอร์ แต่มันยังต้องมีการสร้างชิปต้นแบบ ต้องทดสอบและอื่น ๆ อีกสารพัด ซึ่งมันไม่ง่ายเลย

Intel Xe-HPG โฟกัสไปที่การทำงานร่วมกับ DirectX 12 Ultimate ที่จะเป็นเสาหลักของเกมและแอปพลิเคชันที่มีอยู่ในตอนนี้และในอนาคต รวมไปถึงงานด้าน AI อย่าง DirectML เต็มรูปแบบ

สำหรับเรื่องของไดรเวอร์นั้น ในตอนที่คุณ ๆ กำลังอ่านบนทความนี้อยู่ Intel Arc A-Series ของเดสก์ท็อปก็ออกสู่ตลาดเป็นเวลาประมาณ 6 เดือน แล้ว ไดรเวอร์ของ Intel Arc A-Series นั้นก็เริ่มเข้าที่เข้าทางแล้ว แก้ปัญหาใหญ่ ๆ อย่างเช่นเฟรมตก เมื่อเล่นเกมเก่า ๆ ที่ใช้ DirectX 9 หรือ DirectX 10 ได้เรียบร้อยแล้ว (ในไดรเวอร์ Intel Arc Graphics DCH Driver 31.0.101.3959 WHQL เป็นต้นไป ปัจจุบันมีเวอร์ชันที่ใหม่กว่านี้แล้ว) อันที่จริงก็ต้องเข้าใจด้วยว่า Intel Arc A-Series นั้น มีเป้าหมายอยู่ที่ DirectX 12 Ultimate เป็นหลัก ซึ่งเป็น API กราฟิกที่ใช้งานในปัจจุบันและจะมีบทบาทสำคัญในอนาคต ในขณะที่ DX9/DX10 กำลังจะหายไปตามกาลเวลา ดังนั้นการปรับปรุงไดรเวอร์เพียงอย่างเดียวอาจจะไม่ช่วยอะไรได้มากนัก หากไม่ได้รับความร่วมมือจากผู้พัฒนาเกม 

ผลการทดสอบไดรเวอร์ 31.0.101.3490 เทียบกับไดรเวอร์ที่ได้รับการปรับปรุงใหม่ 31.0.101.3959 WHQL

ปล. เรื่องความล่าช้าและปัญหาของไดรเวอร์มีคนเคยพูดกันบนทวิตเตอร์ด้วยว่า หนึ่งในเหตุผลก็คือการสู้รบระหว่างรัสเซียกับยูเครน เพราะโปรแกรมเมอร์มือดี ๆ ของอินเทลส่วนหนึ่งอยู่กันในละแวกนั้นนั่นแหละ

ทำความรู้จัก Intel Xe-HPG ชื่อรหัส Alchemist

แรกเริ่มเดิมทีอินเทลวางแผนไว้ว่าสถาปัตยกรรม Intel Xe นั้นจะแยกย่อยออกเป็น 5 สายด้วยกันคือ

  1.  Intel Xe-LP (Low Power) ใช้พลังงานต่ำ 
  2. Intel Xe-HP (High Performance) รุ่นประสิทธิภาพสูงสำหรับการประมวลผลทั่วไป
  3. Intel Xe-HPG (High Performance Gaming) กราฟิกประสิทธิภาพสูงสำหรับเกม
  4. Intel Xe-Pro  (Professional) กราฟิกสำหรับงานระดับมืออาชีพ เช่นพวกกราฟิกเวิร์คสเตชัน
  5. Intel Xe-DC (Data Center) สำหรับงานประมวลผลข้อมูลขนาดใหญ่บนดาต้าเซนเตอร์ 

แต่ในที่สุดแล้วเพื่อป้องกันความสับสนและเพื่อการโฟกัสที่ชัดเจน ในทายที่สุดอินเทลก็ได้ปรับแผนใหม่มาเรื่อย ๆ จนเหลือเพียง 2 สายคือ

  1. Intel Xe-HPG (High Performance Gaming)
  2. Intel Xe-HPC (High Performance Computing)

Intel DG1 ที่ออกมาก่อนหน้านี้และ iGPU ในซีพียูคอร์ เจนฯ 12/13 ก็ถือว่าเป็น Xe-LP เช่นกัน แต่ว่ายังไม่ได้ใช้สถาปัตยกรรม Xe ล่าสุดที่เป็นรหัส Alchemist ที่เพิ่มฮาร์ดแวร์ด้าน AI และ Ray tracing เข้ามา ดังนั้นทางอินเทลจึงได้ตัด Xe-LP ออกไปเพื่อป้องกันการสบับสน

สำหรับ Intel Xe-HPG ถ้ามองในภาพรวมของตลาดแล้วก็จะประกอบไปด้วยผู้ใช้ที่ใช้งานกราฟิกการ์ดในแบบมัลติฟังก์ชัน คือทั้งเพื่องานและเพื่อความบันเทิง ก็คือกลุ่มผู้ใช้งานทั่วไป เหล่าคอนเทนต์ครีเอเตอร์ และเกมเมอร์ 

สายผลิตภัณฑ์ปัจจุบันสำหรับตลาดเดสก์ท็อปพีซี นอกจากอินเทลจะมี Intel Arc A380 หรือ Intel Arc A770 รุ่นท็อปสุดออกเจาะตลาดเกมเมอร์แล้ว ตอนนี้อินเทลเองยังมีการแตกสายกราฟิกที่ใช้พื้นฐานของ Xe-HPG ออกมาเป็นกราฟิกระดับมืออาชีพด้วยเช่นกัน โดยใช้ชื่อว่า “Intel Arc Pro A-Series” เช่น และ Arc Pro A40 และ Arc Pro A50 สำหรับเดสก์ท็อปพีซี และถ้าเป็นบนโน้ตบุ๊กก็จะลงท้ายด้วยรหัส M เช่น Arc Pro A30M โดยกราฟิกรุ่น Pro จะมีไดรเวอร์และใบรับรองพิเศษที่รับประกันเรื่องของความเข้ากันได้กับซอฟต์แวร์และฮาร์ดแวร์ในระดับมืออาชีพ ที่มุ่งเน้นเรื่องของเสถียรภาพในการทำงานในระดับสูง

ส่วน Intel Xe-HPC ก็เป็นการจับกลุ่มการประมวลผลข้อมูลประสิทธิภาพสูงด้าน AI, ML/DL รวมถึงกลุ่มด้าต้าเซนเตอร์เข้ามาไว้ด้วยกัน เพื่อให้โฟกัสตลาดได้ง่ายกว่าเพราะลักษณะการใช้งานของกลุ่มนี้ส่วนใหญ่จะใช้การประมวลผลที่คล้ายคลึงกัน

เจาะลึกสถาปัตยกรรมกราฟิก Xe-HPG ในกราฟิกการ์ด Intel Arc A-Series

ในสถาปัตยกรรมกราฟิกทุกชนิดไม่ว่าจะเป็นของค่ายใดก็ตามภายในของสถาปัตยกรรมเหล่านี้จะมีการแยกออกเป็นส่วนย่อย ๆ เพื่อแบ่งหน้าที่การทำงาน ง่ายต่อการปรับปรุง และง่ายต่อการศึกษาและทำความเข้าใจการทำงานอีกด้วย ลองดูบล็อกไดอะแกรมข้างล่างนี้ รูปแบบจะเป็นของกราฟิกการ์ด Intel DG1 และ iGPU ที่อยู่ในซีพียู คอร์ เจนฯ 12/13 ส่วนรูปถัดไปจะเป็นบล็อกไดอะแกรมของ Xe-HPG ที่อยู่ในกราฟิก Intel Arc A-Series

บล็อกไดอะแกรมของ Intel DG1 และ iGPU ที่อยู่ในซีพียู คอร์ เจนฯ 12/13 | ถ้าเป็นเจนเนอร์เรชันของกราฟิก นี่ก็คือ Intel Graphics Gen12.1
บล็อกไดอะแกรมของ Xe-HPG ที่อยู่ในกราฟิกการ์ด Intel Arc A-Series ทุกรุ่น และถ้านับเป็นเจนเนอร์เรชันของกราฟิก นี่ก็คือ Intel Graphics Gen12.7 (Alchemist)

สำหรับชื่อเรียกส่วนสำคัญ ๆ ของกราฟิกสถาปัตยกรรม Xe-HPG/HPC  ที่มีการเปลี่ยนแปลงไปจากสถาปัตยกรรมกราฟิกรุ่นก่อนก็มีดังนี้ครับ

ชื่อเดิมชื่อใหม่ชื่อเรียกทั่วไปตัวย่อ
Execution Unit (EU)Xe Vector EngineVector EngineXVE
Systolic/DPAS
(เป็นส่วนหนึ่งของ EU)
Xe Matrix eXtensionMatrix EngineXMX
Sub-slice (SS)
หรือ Dual Sub-slice
Xe-core(ไม่มีการระบุ)XC
SliceRender Slice (สำหรับ Xe-HPG),
Compute Slice (สำหรับ Xe-HPC)
SliceSLC
TileStackStackSTK

ต่อไปเราก็จะมาลงลึกถึงรายละเอียดแต่ละส่วนกันครับว่ามีหน้าที่ทำอะไรกันบ้าง โดยเราจะไปเริ่มจากส่วนที่เล็กที่สุดของสถาปัตยกรรม Xe-HPG กันก่อน นั่นก็คือ “Vector Engine และ Matrix Engine”

Vector Engine (XVE) และ Matrix Engine (XMX) นี่คือส่วนที่เล็กและย่อยที่สุดของ GPU เลยก็ว่าได้ ถ้าจะเทียบกับเอ็นวิเดียก็คือ CUDA Cores และของเอเอ็มดีก็คือ Stream Processor สำหรับกราฟิกของอินเทลปกติมันควรจะมีเฉพาะส่วนที่เป็น XVE หรือของเดิมก็คือ EU เท่านั้น แต่ในสถาปัตยกรรมใหม่ของอินเทลได้ทำการเพิ่ม XMX เข้ามาประกบกับส่วนของ XVE เลยเพื่อให้มันสามารถทำงานร่วมกันได้อย่างรวดเร็วยิ่งขึ้น หรืออีกชื่อหนึ่งของหน่วยประมวลส่วนเล็กสุดของ GPU เหล่านี้ก็จะถูกเรียกว่า Shader Unit หรือถ้าเป็น GPU สมัยใหม่หน่อยบางทีก็เรียกว่า Programmable Shader เพราะส่วนนี้ในปัจจุบันไม่ได้ถูกกำหนดให้ทำงานด้านใดด้านหนึ่งในกราฟิกไปป์ไลน์เพียงอย่างเดียว แต่ยังสามารถปรับเปลี่ยนตัวเองมาประมวลผลการทำงานอื่น ๆ ได้ รวมถึงยังสามารถนำมาประมวลผลด้านอื่น ๆ อีกด้วย ซึ่งเรารู้จักกันในนาม GPGPU (General Purpose Graphics Processing Unit)

หน้าที่ของ XMX นี้นอกจากจะประมวลผลชุดคำสั่งของกราฟิกทั่วไปแล้วยังถูกออกแบบมาให้ประมวลผลชุดคำสั่งทางด้าน matrix โดยเฉพาะ ซึ่งเทียบได้กับ Tensor Core ของเอ็นวิเดียนั่นเอง และการเพิ่ม XMX เข้ามานี้ทำให้อินเทลสามารถใส่คุณสมบัติการทำงานอย่าง “Intel XeSS” (Intel Xe Super Sampling) ที่เป็นคู่แข่งของ DLSS ของเอ็นวิเดียได้ รวมไปถึงประมวลผลทางด้าน AI แบบอื่น ๆ ด้วย เดี๋ยวเราจะมาลงรายละเอียดของ XeSS กันทีหลัง

เนื่องจากทั้ง XVE และ XMX ไม่สามารถทำงานได้โดยลำพัง ดังนั้นทั้งสองจะถูกจัดกลุ่มรวมกันเพื่อให้สามารถอ่านข้อมูลเข้ามาประมวลผล และสามารถแบ่งปันข้อมูลระหว่างกันได้ จึงต้องถูกนำมาจัดกลุ่มรวมกันให้อยู่ภายใต้ Xe-Core 

Vector Engine และ Matrix Engine คือส่วนย่อยที่สุดของการประมวลผล โดยจะถูกจัดกลุ่มรวมกันให้อยู่ภายใน Xe-Core

Xe-Core: Xe-Core คือส่วนที่ใช้รวมกลุ่มของ XVE และ XMX เข้าด้วยกันเพื่อให้ทำงานร่วมกับโดยผ่าน Sub-Front end สำหรับการอ่านและเก็บข้อมูลเพื่อใช้ประมวลผล รวมถึงมีหน่วยความจำแคชคำสั่งและแคชข้อมูล เพื่อให้ XVE และXMX แต่ละนำไปประมวลผลและแชร์ข้อมูลรวมกันได้ โดยในแต่ละ Xe-Core ก็จะมีการรวมกลุ่มของ VXE 16 หน่วย และ XMX อีก 16 หน่วย

และเวลาเราจะดูสเปคของกราฟิก Intel Arc A-Series ว่ารุ่นไหนมีประสิทธิภาพสูงกว่ากันเราก็จะใช้จำนวนของ Xe-Core นี่แหละเป็นการบ่งบอกได้ในเบื้องต้น เช่น Intel Arc A380 มี Xe-Core อยู่ทั้งหมด 8 ชุด ในขณะที่ Intel Arc A750 มี Xe-Core มากถึง 28 ชุดเลยทีเดียว

แต่ว่า Xe-Core เองก็ยังไม่มีความสมบูรณ์ในตัวที่จะถูกนำมาสร้างเป็น GPU ที่มีความสมบูรณ์ได้ เพราะยังขนาดส่วนที่เป็น Fixed Function ที่จำเป็นสำหรับกราฟิกไปป์ไลน์ ดังนั้น Xe-Core เองก็จะถูกนำมาจัดกลุ่มอีกครั้งให้มาอยู่ภายใต้การทำงานของ “Render Slice”

Xe-Core จะถูกนำมาจัดกลุ่มรวมกันเพื่อให้กลายเป็น GPU มีความสมบูรณ์

แม้ว่า Xe-Core จะทำหน้าที่ในการประมวลผลข้อมูลต่าง ๆ เสร็จเรียบร้อยแล้วแต่จะทำให้เกิดเป็นภาพของเกมได้นั่นก็จำเป็นต้องพึ่งพาอาศัยการทำงานของส่วนประกอบพื้นฐานของกราฟิกไปป์ไลน์ ถ้าดูจากรูปด้านบนส่วนสำคัญเหล่านั้นก็คือ Sampler, Geometry, Rasterizer, HIZ และ Pixel Backend นอกจากนี้เพื่อการรองรับเทคโนโลยี Ray tracing ในระดับฮาร์ดแวร์ เพื่อให้เล่นเกมรุ่นใหม่ ๆ ได้อย่างลื่นไหล อินเทลจึงได้เพิ่มเติม RTU หรือ Ray Tracing Unit เพิ่มเข้าไปด้วยถึง 4 หน่วย หรือเท่ากับจำนวนของ Xe-Core ใน Render Slice นั่นเอง

สำหรับ Ray Tracing Unit ที่เพิ่มเข้ามาใน Xe-HPG จะมีอัลกอรึธึมสำคัญอยู่สามส่วนคือ 1. Ray Traversal ทำหน้าที่ดูว่าแสงเดินทางผ่านอะไรมาบ้างพื้นผิวของวัตถุที่แสงส่องผ่านมาเป็นอย่างไร ดูดซับแสง หรือสะท้่อนแสงแค่ไหน, 2. Bounding box intersection การประมวลผลเรื่องของภาพสะท้อน เพราะในโลกของ ray tracing การเกิดภาพสะท้อนนั้นเป็นปกติมาก เช่นมีกระจกที่สะท้อนวัตถุ ก็ต้องประมวลผลว่าวัตถุที่กระจกสะท้อนนั้นมีระยะห่างอยู่เท่าไร มุมมองที่จะต้องเห็นภาพสะท้อนในกระจกนั้นจะมีลักษณะเป็นอย่างไร และ 3. Triangle Intersection ซึ่งเป็นการตรวจสอบความทับซ้อนของพื้นที่สามเหลี่ยมที่เป็นรูปพื้นฐานสุด ๆ ในคอมพิวเตอร์กราฟิกนี่แหละครับ การตรวจการทับซ้่อนจะทำให้เรารู้ว่าอะไรอยู่บน อะไรอยู่ล่าง อะไรอยู่หน้า อะไรอยู่หลัง และแน่นอนพอมีเรื่อง ray tracing มาแล้วมันก็จะส่งผลต่อแสงและสิ่งที่สะท้อนแตกต่างกันออกไป

ก็ขอเล่าย่อ ๆ เกี่ยวกับ Ray Tracing Unit ใน Xe-HPG ไว้ประมาณนี้ก่อนนะครับ พอให้เห็นภาพและให้เห็นความสำคัญของการมีฮาร์ดแวร์ที่รองรับ ray tracing ว่ามีความสำคัญอย่างไร

จาก Vector Engine และ Matrix Engine ขยับมาเป็น Xe-Core และ Render Slice ก็สามารถสร้า GPU เล็ก ๆ ขึ้นมาได้หนึ่งตัวโดยมี Xe-Core อยู่ที่ 4 หน่วย แต่ถ้าเราต้องการ GPU ที่มีประสิทธิภาพสูงมากกว่านี้ อินเทลก็ได้ออกแบบไว้ให้สามารถนำ Render Slice มาเชื่อมต่อกันได้ เพื่อขยายประสิทธิภาพในการทำงาน เช่น Intel Arc A380 มี Render Slice สองชุด Intel Arc A770 มี Render Slice ถึง 8 ชุด โดยให้ Render Slice ทั้งหมดทำงานร่วมกันผ่านทาง Global Dispatch ที่ทำหน้าที่กระจายคำสั่งไปยัง Render Slice ต่าง ๆ และมีการแลกเปลี่ยนข้อมูลระหว่าง Render Slice ด้วย Memory Fabric

ภาพนี้คือการจำลองการเชื่อมต่อกันระหว่าง Render Slice จำนวน 8 ชุดเข้าด้วยกัน ทำให้มีจำนวน Xe-Core ทั้งหมด 32 หน่วย ซึ่งเหมือนกับที่ใช้อยู่ในกราฟิกชิป Intel Arc A770 นั่นเองครับ

ถ้าดูในแง่ของสถาปัตยกรรมกราฟิกจริง ๆ แล้วก็จะจบลงตรงนี้ ซึ่งเราจะเห็นได้ว่า Xe-HPG นั้นเป็นหนึ่งใน GPU ที่มีความทันสมัยมากที่สุดในโลกรุ่นหนึ่งเลยก็ว่าได้ ไม่แพ้ซีพียูของเจ้าตลาดของเอ็นวิเดียเลย เพราะอินเทลเองก็มีทั้งส่วนที่ทำหน้าที่เป็น FP, Int, Matrix และ Ray Tracing ครบถ้วนแบบเดียวกัน แต่แน่นอนว่า เรื่องของแอปพลิเคชันในการรองรับ ที่จะใช้ประโยชย์จากสิ่งที่อินเทลมีก็ต้องอาจจะใช้เวลาสักพัก

เหมือนจะจบแต่ยังไม่ยอมให้จบครับ เพราะในกราฟิก Intel Arc A-Series นี้ยังมีจุดเด่นสำคัญ ๆ อีกหลายส่วนครับ เราไปเริ่มกันที่ Intel XeSS กันก่อนเลย

Intel XeSS คู่แข่งของ DLSS อย่างเป็นทางการ

Intel XeSS

Intel XeSS (Intel Xe Super Sampling) ในทางเทคนิคแล้วมันคือการอัปสเกลของภาพที่มีความละเอียดต่ำให้มีความละเอียดสูงขึ้น โดยเรนเดอร์ภาพที่มีความละเอียดต่ำเพื่อให้ได้เฟรมเรตที่สูงแล้วจากนั้นทำการอัปสเกลขึ้นไปให้มีความละเอียดสูง ตามปกติแล้วแม้จะได้เฟรมสูงขึ้นก็จริงแต่คุณภาพของภาพที่ได้นั้นจะแย่มาก แต่ด้วย Intel XeSS ทำการอัปสเกลนั้นไม่ได้ทำแบบการขยายภาพตรง ๆ แต่เป็นการขยายความละเอียดของภาพด้วย AI ที่จะทำให้ภาพยังคงมีรายละเอียดต่าง ๆ เหมือนหรือเทียบกับกับการเรนเดอร์ด้วยความละเอียดสูงแบบปกติ

หากเทียบคุณสมบัติของ Intel XeSS ก็คงจะเทียบเคียงได้กับ DLSS ของเอ็นวิเดียที่สามารถเพิ่มความละเอียดของภาพได้ด้วย AI โดยใช้ฮาร์ดแวร์ที่ชื่อว่า Tensor Core มาช่วยในการประมวลผล ส่วน XeSS ของอินเทลนั้นก็มีการนำฮาร์ดแวร์มาช่วยการประมวลผลในส่วนนี้เช่นกันนั่นก็คือหน่วยประมวลผลเล็ก ๆ ที่ชื่อ Matrix Engine หรือ XMX ที่เราได้พูดคุยกันไปก่อนหน้านั่นเองครับ

สำหรับเทคนิคการทำงานของ Intel XeSS นั้นจะใช้วิธีนำภาพก่อนหน้ามาเป็นข้อมูลเพื่อใช้ในการวิเคราะห์ เพื่อสร้างภาพที่จะเกิดขึ้นในเฟรมต่อไปทำให้ การทำงานในลักษณะนี้สามารถใช้งานได้กับทุกเกมโดยไม่จำเป็นต้องมีการฝึกโมเดล AI เป็นการล่วงหน้าโดยเฉพาะ

Intel XeSS SDK
การทำงานของ XeSS ผ่านกราฟิกของอินเทล และการทำงานบนกราฟิกอื่น ๆ

นอกจากนี้ข้อดีอีกประการของ Intel XeSS ก็คือ กราฟิกอื่น ๆ ของอินเทลเองก็ยังสามารถที่จะใช้คุณสมบัตินี้ได้เช่นกัน แต่ว่าประสิทธิภาพในการทำงานคงไม่เทียบเท่ากับ XeSS ที่ทำงานบนกราฟิก Arc A-Series ที่มีฮาร์ดแวร์ XMX ที่รองรับชุดคำสั่งการประมวลผลด้าน AI โดยเฉพาะโดยจะอยู่ในลักษณะคำสั่งแบบ INT-8 (Advance Scaling Model) ส่วนถ้าไปทำงานบนเครื่องที่ไม่มีฮาร์ดแวร์ XMX รองรับ แต่ยังเป็น iGPU ของอินเทลอยู่ก็จะปรับมาใช้ DP4a (Standard Scaling Model) แทน และถ้าใช้กับเครื่องที่ไม่มีฮาร์ดแวร์ของอินเทลเลย XeSS ก็จะปรับมาใช้ SM 6.4 ที่เป็น Standard Scaling Model เช่นกัน แต่ว่าจะทำงานผ่านทาง DirectX 12 แทน

XMX กับงานด้าน AI/ML/DL

XMX ที่อยู่ใน Xe-Core ไม่ได้ถูกใช้แค่การอัปสเกลภาพของเกมเพียงอย่างเดียวเท่านั้นแต่ XMX ยังสามารถนำมาใช้งานการประมวลผลชุดคำสังด้าน AI เพื่อใช้งานร่วมกับแอปพลิเคชันทั่วไปได้อีกด้วย ไม่ว่าจะเป็นซอฟต์แวร์สำหรับแต่งภาพ และ ซอฟต์แวร์สำหรับติดต่อวิดีโอ หรือถ้าคุณทำงานขั้นสูงกว่านั้นคุณก็สามารถเชื่อมต่อกับ oneAPI เพื่อสร้างโมเดล AI เพิ่มเติมสำหรับการใช้งานเฉพาะทางตามความต้องการของคุณเองได้โดยผ่าน oneAPI Toolkits หรือในกรณีที่ต้องการใช้งาน DirectML ของไมโครซอฟท์โดยตรงก็สามารถทำงานได้เช่นกัน ซึ่งข้อดีก็คือราคาของ Intel Arc นั้นไม่แพงทำให้คนทั่วไปที่สนใจไม่ต้องใช้เงินกับกราฟิกการ์ดมากนัก ก็สามารถเรียกฟังก์ชันการทำงานจาก DirectML มาใช้งานได้แล้วและยังมีฮาร์ดแวร์ที่รองรับอีกด้วย ตัวอย่างจากเว็บไซต์ Christian Mills ที่ลองใช้ Intel Arc A770 กับงานด้าน Deep Learning

Xe Media Engine

ความเหนือชั้นของ Xe Media Engine ก็คือถึงจะเป็น Intel Arc A-Series รุ่นเล็ก ก็ยังคงได้รับฟังก์ชันเหล่านี้อย่างครบครัน ไม่ต้องจ่ายเงินหลักหมื่น รองรับมาตรฐานวิดีโอเหล่านี้ในระดับฮาร์ดแวร์ H.264/AVC, VP9, H.265/HEVC และ AV1

จุดขายที่สำคัญอย่างหนึ่งของกราฟิกจากอินเทลก็คือเรื่องของ Media Engine ที่มีชื่อเสียงมาอย่างยาวนานตั้งแต่ยุคของ iGPU แม้จะเป็นกราฟิกที่ไม่ได้มีพลังเรื่องการเล่นเกมมากนัก แต่สำหรับงานวิดีโอนั้นกลับไม่เป็นสองรองใครซึ่งเรารู้จักกันในนาม QuickSync นั่นเอง

และพอมาสู่ยุคของกราฟิกการ์ดแบบแยกอินเทลก็ยิ่งจัดเต็มเรื่องของฟังก์ชันให้มีความพิเศษเพิ่มยิ่งขึ้นไปอีก นั่นก็คืออินเทลได้ใส่ฮาร์ดแวร์สำหรับเข้ารหัสและถอดรหัสวิดีโอมาตรฐาน AV1 เข้ามาในตัวด้วยเลย ไม่ว่าจะเป็น Xe-HPG รุ่นเล็กหรือรุ่นใหญ่ ทั้งหมดก็จะได้รับคุณสมบัตินี้ ต่างจากกราฟิกการ์ดบางค่าย พอเป็นรุ่นเล็กหน่อยก็ตัดฮาร์ดแวร์สำหรับการเข้ารหัสวิดีโอออกไปซะอย่างนั้น

นอกจากซอฟต์แวร์เหล่านี้แล้วโปรแกรมสตรีมมิ่งยอดนิยมอย่าง OSB Studio ที่เป็นโอเพ่นซอร์ส เวอร์ชันล่าสุดก็รองรับ AV1 แล้วเช่นกัน

Intel Arc ถือว่าเป็น GPU ตัวแรกของโลกที่มีการเข้ารหัสและถอดรหัส AV1 ที่เร่งความเร็วด้วยฮาร์ดแวร์ ความสำคัญของ AV1 ก็คืเป็นฟอร์แมตวิดีโอรุ่นใหม่ที่ให้ประสิทธิภาพสูงคือไฟล์มีขนาดเล็กเมื่อเทียบกับมาตรฐานอื่น ๆ ที่เราใช้กันอยู่ในตอนนี้อย่าง H.264 และ H.256 แต่ยังคงความคมชัดของวิดีโอเอาไว้ได้ และเมื่อนำไปใช้กับงานสตรีมมิ่ง ก็ยิ่งมีประโยชน์คือ ใช้แบนด์วิดธ์น้อยลง ทำให้การสตรีมเป็นไปอย่างลื่นไหล

แต่ว่าที่ผ่านมาการถอดเข้ารหัสและถอดรหัส AV1 โดยเฉพาะการถอดรหัส AV1 จำเป็นที่จะต้องใช้พลังฮาร์ดแวร์ค่อนข้างสูงจึงยังไม่ได้รับความนิยมกันมากนัก แต่ในตอนนี้เมื่อมีฮาร์ดแวร์สำหรับการถอดรหัสออกมาและผู้คนเข้าถึงได้ง่ายก็จะทำให้มาตรฐาน AV1 นี้กลายเป็นที่ยอมรับกันมากขึ้นในระยะเวลาอันรวดเร็ว

นอกจากนี้แล้ว Xe Media Engine ล่าสุดของอินเทลนี้ยังมาพร้อมกับคุณสมบัติ Intel Deep Link ที่เป็นการทำงานร่วมกันระหว่าง iGPU กับ dGPU เช่น Intel Arc ได้ เช่นโปรแกรม Davinci Resolve Studio เราสามารถเปิดให้ iGPU ของซีพียูอินเทล คอร์ เจนฯ 12 ทำงานร่วมกับการ์ดจอ Intel Arc A380 เพื่อร่วมกันทำงานในการตัดต่อวิดีโอได้ ทั้งในระหว่างการ edit และการ render หรือในกรณีที่คุณติดตั้งการ์ดจอ Intel Arc จำนวนสองใบในเครื่องเดียวกัน ถ้าซอฟต์แวร์รองรับการทำงานแบบ Multi-GPU การ์ดจอ Intel Arc ทั้งสองก็จะร่วมกันทำงานได้เช่นกัน

ติดตั้งการ์ดจอ ASRock Arc A380 สองตัวเพื่อลองใช้ตัดต่อวิดีโอด้วยโปรแกรม Davinci Resolve Studio
Task manager แสดงการทำงานของกราฟิก Arc A380 สองตัวทำงานร่วมกันขณะ Render วิดีโอ
ตารางเปรียบเทียบคุณสมบัติ Intel QukckSync Video

ตารางด้านบนเป็นการเปรียบเทียบคุณสมบัติ Intel QukckSync Video ในการเข้ารหัสและถอดรหัสวิดีโอมาตรฐานต่าง ๆ ของ iGPU ที่อยู่ในซีพียูอินเทล คอร์ เจนฯ 10, เจนฯ 11 และ เจนฯ 12 รวมถึงกราฟิกการ์ดแยกรุ่นก่อนอย่าง Intel DG1 (Iris Xe) และ Intel Arc A-Series โดยผ่าน oneAPI Video Processing Library (oneVPL) ก็จะเห็นได้ว่า Intel Arc A-Series ที่ใช้สถาปัตยกรรม Xe-HPG นั้นจัดมาเต็มกว่ากราฟิกรุ่นอื่น ๆ ทั้งหมด

พอร์ตการเชื่อมต่อจอภาพของ Intel Arc A-Series เรียกได้ว่าทันสมัยและเหมาะสมกับ Xe Media Engine ที่ปรับปรุงมาใหม่

Intel Arc Control ซอฟต์แวร์เสริมการทำงาน

นอกจากส่วนของฮาร์ดแวร์แล้ว มารอบนี้อินเทลก็ได้เตรียมความพร้อมทางด้านซอฟต์แวร์ไว้ให้กับผู้ใช้งานด้วย เช่นกัน เรียกได้ว่ามีของมาให้ใช้ทัดเทียบกันกับผู้ผลิตกราฟิกชิปรายอื่น ๆ

สำหรับซอฟต์แวร์นี้อินเทลใช้ชือว่า Intel Arc Control หน้าที่ของซอฟต์แวร์นี้ก็จะมีหน้าที่หลัก ๆ อยู่ดังนี้ครับ 1. ตรวจสอบการอัปเดตของไดรเวอร์, 2.ทำหน้าที่เป็น Hardware Monitor คอยตรวจสอบสถานะการทำงานของกราฟิก, 3.ปรับแต่งประสิทธิภาพการทำงานของตัวฮาร์ดแวร์เอง เช่นการโอเวอร์คล็อก, 4.ปรับแต่งการตั้งค่าของเกมให้โดยอัตโมัติให้เหมาะสมกับกราฟิกที่ใช้ และ 5. Creator Studio ที่ใช้สำหรับบันทึกหน้าจอ และถ่ายทอดสดการเล่นเกมหรือการพูดคุยผ่านกล้องเว็บแคมพร้อมปรับเอฟเฟคต่าง ๆ ของกล้องได้ในตัว

สรุปส่งท้าย

จากภาพรวมทั้งหมดที่ได้เล่ามา ก็จะเห็นได้ว่าอินเทลนั้นทำการบ้านสำหรับตลาดกราฟิกออกมาได้ดีพอตัวเลยทีเดียว โครงสร้างของกราฟิกชิปเองก็ถือว่าทันสมัยมาก ๆ มีทั้งส่วนที่เป็น FP, Int, Matrix และ Ray tracing ซึ่งเป็นสิ่งที่ทุกคนกำลังมองหาจากกราฟิกรุ่นใหม่ แต่ที่อินเทลทำมากไปกว่านั้นก็คือ แม้แต่กราฟิกรุ่นเล็ก ๆ ที่ใช้สถาปัตยกรรม Xe-HPG อินเทลก็ยังใส่ฟังก์ชันการทำงานไว้ครบครันเหมือนกับกราฟิกรุ่นใหญ่ ทำให้ผู้ใช้ทุกคนสามารถสัมผัสกับฟังก์ชันและความพิเศษที่อยู่ในตัวกราฟิกชิปได้ แม้ว่าระดับความแรงที่สัมผัสได้จะมีความแตกต่างกัน แต่อย่างน้อยผู้ใช้ทั้งหมดก็ยังสามารถพูดคุยเป็นภาษาเดียวกันได้โดยที่ไม่ต้องมาแบ่งว่าเธอเป็นการ์ดรุ่นเล็กไม่มีฟังก์ชันนี้ อยากใช้เต็มต้องซื้อรุ่นใหญ่ ทั้ง ๆ ทีบางครั้งเราการแค่ฟังก์ชันนั้น ๆ เพียงอย่างเดียว ของให้รองรับให้ครบและใช้งานได้อย่างเหมาะสมนั่นก็เพียงพอแล้ว

อย่างไรก็ตามข้อมูลล่าสุดที่อินเทลประกาศออกมาตอนนี้ก็คือ เราจะได้เห็นกราฟิก Intel Arc A-Series อยู่ในตลาดระดับกลางไปจนถึงระดับเริ่มต้นเท่านั้น อินเทลยังไม่มีแผนที่จะทำกราฟิกการ์ดเล่นเกมในระดับ 4K เพราะมองว่าตลาดใหญ่ยังคงอยู่กับ 1080p และ 1440p หรือ 2K เท่านั้น และจะมุ่งตอบโจทย์ของกลุ่มนี้ให้ดีที่สุด