ย้อนไปราวเดือนสิงหาคมปี 2018 เอ็นวิเดียได้เปิดตัวกราฟิกการ์ด GeForce RTX 20 Series ซึ่งในครั้งนั้นถือว่าเป็นการพลิกโฉมหน้าของวงการกราฟิกการ์ดครั้งใหญ่ คือนอกจากจะเพิ่มประสิทธิภาพในการเล่นเกมแล้วยังมาพร้อมกับฮาร์ดแวร์ใหม่อีกสองส่วนที่ช่วยผลักดันวงการ คือ RT Cores ที่ช่วยประมวลผลด้าน Raytracing และ Tensor Cores สำหรับการประมวลผลด้าน AI
และในปีนี้ทางเอ็นวิเดียก็ได้ทำการยกระดับความแรงขึ้นไปอีกครั้งด้วยด้วยกราฟิกชิปรุ่นใหม่สถาปัตยกรรม Ampere ซึ่งถือว่าเป็น GeForce RTX เจนเนอร์เรชันที่สอง ที่นอกจากจะปรับปรุงในส่วนของ CUDA Cores แล้วยังมีการปรับปรุง RT Cores (Ray Tracing Cores) รวมถึง Tensor Cores ก็ได้รับการปรับปรุงเช่นกัน และการปรับปรุงในครั้งนี้ก็ส่งผลให้กราฟิกชิปรุ่นใหม่สามารถทำเฟรมเรตในเกมได้สูงขึ้น ให้ภาพที่มีความสวยงานเพิ่มขึ้น และการประมวลผลทางด้าน AI ที่เร็วขึ้น ซึ่งสามารถตอบสนองความต้องการของเหล่าเกมเมอร์ และบรรดาคอนเทนต์ครีเอเตอร์ทั้งหลายได้เป็นอย่างดี

กราฟิกสถาปัตยกรรม Ampere นี้ได้ถูกนำมาไว้ในกราฟิก GeForce RTX 30 Series และนี่เป็นครั้งแรกของโลกที่กราฟิกการ์ดสำหรับการเล่นเกมจะมาพร้อมกับหน่วยความจำความสูงสุดถึง 24GB ในการ์ด GeForce RTX 3090 และยังมีการใช้หน่วยความจำรุ่นใหม่ GDDR6X ที่มีความเร็วสูงที่สุดในโลก และเป็นกราฟิกชิปรุ่นแรกที่มาพร้อมกับ HDMI 2.1 สำหรับการเล่นเกม 4K ที่มีอัตรารีเฟรชเรตที่สูง และรองรับการแสดงผลของจอภาพระดับ 8K HDR และยังเป็นกราฟิกชิปแบบแยกรุ่นแรกที่รองรับการถอดรหัสวิดีโอมาตรฐาน AV1 ซึ่งคุณสมบัติเหล่านี้จะทำให้คุณสามารถรับชมคอนเทนต์สตรีมมิ่งที่มีความละเอียดสูงได้โดยใช้แบนด์วิดธ์ที่ลดลง กราฟิกการ์ดในรุ่น Founders Edition ก็ยังได้รับการออกแบบใหม่หมด ด้วยพัดลมคู่พร้อมด้วยฮีตซิงค์ระบายความร้อนที่สามารถให้อากาศไหลเวียนได้ดีกว่ารุ่นก่อน
นอกจากนี้กราฟิกชิป GeForce RTX 30 Series ยังมาพร้อมกับคุณสมบัติใหม่ที่เหมาะกับ นักกีฬาอีสปอร์ต, สตรีมเมอร์, ครีเอเตอร์ และเกมเมอร์ ได้แก่ NVIDIA Reflex ที่ช่วยลดค่าความหน่วงในการเล่นเกมทั้งระบบ, NVIDIA Broadcast ที่ช่วยเปลี่ยนห้องใด ๆ ในบ้านของคุณให้กลายเป็นสตูดิโอ โดยใช้คุณสมบัติด้าน AI มาช่วยจัดการทั้งเรื่องภาพและเสียง รวมถึงการอัปเดตคุณสมบัติ NVIDIA DLSS ให้รองรับ 8K HDR ด้วยกราฟิกการ์ด GeForce RTX 3090 และไดรเวอร์ NVIDIA Studio รุ่นใหม่ที่ปรับปรุงมาให้ทำงานร่วมกับแอปพลิเคชันในสายงานของครีเอเตอร์ได้ดียิ่งขึ้นอย่างที่ไม่เคยเป็นมาก่อน
GeForce RTX 30 Series
ในการเปิดตัวครั้งแรก (17 กันยายน) ทางเอ็นวิเดียได้ส่งกราฟิกการ์ดสามรุ่นลงสู่ตลาด ได้แก่ GeForce RTX 3090 ที่ถือว่าเป็นรุ่นสูงสุดและออกแบบมาเพื่อการเล่นเกมในระดับ 8K ส่วนในรุ่นรองลงมาก็คือ GeForce RTX 3080 และ GeForce RTX 3070 ตามลำดับ โดยกราฟิกการ์ดทั้งสามรุ่นมีคุณสมบัติทางด้านเทคนิคดังตารางต่อไปนี้

เจาะลึกฮาร์ดแวร์ของ GeForce RTX 30 Series
ตั้งแต่ GeForce RTX 20 Series เป็นต้นมา กราฟิกชิปจะแบ่งฮาร์ดแวร์การประมวลผลออกเป็นสามส่วนหลัก ๆ ได้แก่ CUDA Cores ที่ใช้สำหรับประมวลผลชุดคำสั่งด้านกราฟิกสามมิติและการประมวลผลทั่วไป, RT-Cores หรือ Ray Tracing Cores ที่ใช้ประมวลผลเรื่องแสงและเงาของ Raytracing และส่วนสุดท้ายคือ Tensor Cores มีหน้าที่ในการประมวลผลชุดคำสั่งทางด้าน AI โดยเฉพาะ ในกราฟิก GeForce RTX 30 Series ทางเอ็นวิเดียก็ได้ปรับปรุงชุดใหญ่ให้กับฮาร์ดแวร์ทั้งสามส่วนนี้ไปพร้อม ๆ กัน และทางเอ็นวิเดียก็เรียกการเปลี่ยนแปลงครั้งนี้ว่าเป็น RTX เจนเนอร์เรชันที่ 2 เราจะมาดูว่าเอ็นวิเดียได้ปรับปรุงอะไรบ้างที่ทำให้ RTX 30 Series มีประสิทธิภาพสูงกว่า RTX 20 Series ถึง 1.9 เท่า เมื่อเทียบกับการใช้พลังงานที่เท่ากัน

รูปที่ 1 กราฟิกสถาปัตยกรรม Turing หรือ RTX เจนเนอร์เรชัน 1 เป็นกราฟิกรุ่นแรกที่มีหน่วยประมวลผลสามรูปแบบที่ทำงานร่วมกับ

รูปที่ 2 ภาพรวมของสถาปัตยกรรม Ampere หรือ RTX เจนเนอร์เรชันที่ 2 ที่มีการปรับปรุงสิทธิภาพการทำงานให้กับทุกส่วนของการประมวลผล CUDA Cores ให้ประสิทธิภาพดีกว่า 2.7 เท่า, RT-Cores ให้ประสิทธิภาพดีกว่า 1.7 เท่า และ Tensor Cores ให้ประสิทธิภาพดีกว่า 3.7 เท่า เมื่อเทียบกับการใช้พลังานที่เท่ากัน
สถาปัตยกรรม NVIDIA Ampere
ภาพรวมของสถาปัตยกรรมกราฟิก NVIDIA Ampere นั้นจะมีส่วนประมวลผลหลัก ๆ อยู่ด้วยกันสามส่วนคือ 1. Programable Shader Unit (หรือส่วนของ CUDA Cores) ที่ทำหน้าที่ในการประมวลผลข้อมูลทั่วไปของกราฟิก, 2. Ray Tracing Cores (RT Cores) ทำหน้าที่ประมวลผลข้อมูลเรื่องแสงและเงา, 3. Tensor Cores ทำหน้าที่ประมวลผลข้อมูลที่เกี่ยวกับ AI โดยส่วนประมวลผลหลักทั้งสามส่วนนี้จะถูกจัดกลุ่มรวมกันแล้วเรียกว่า Streaming Multiprocessor (SM) ในกราฟิกชิปแต่ละรุ่นก็จะมีจำนวน SM ที่มากน้อยแตกต่างกันออกไปตามระดับของประสิทธิภาพ จากนั้น SM ก็จะถูกจับไปรวมกลุ่มกันอีกครั้งเรียกว่า Graphics Processing Clusters (GPC)
สถาปัตยกรรม Ampere โดยปกติแล้วในแต่ละ GPC ก็จะมี SM อยู่ 12 หน่วย ดังตัวอย่างภาพด้านล่างนี้เป็นบล็อกไดอะแกรมของ RTX 3080 ที่มี GPC ทั้งหมด 7 ชุด (*จำนวนของ SM และ GPC ขึ้นอยู่กับกราฟิกแต่ละรุ่นด้วย)

รูปที่ 3 บล็อกไดอะแกรมของ RTX 3080 ที่มี GPC จำนวน 6 ชุด, GPC ที่มี SM 12 หน่วย 4 ชุด และ GPC ที่มี SM 10 หน่วย อีก 2 ชุด (ในแต่ละ SM จะมี CUDA Cores จำนวน 128 คอร์)
ก่อนจะไปลงลึกถึงสถาปัตยกรรม Ampere เรามาไล่เรียงลำดับการพัฒนาของสถาปัตยกรรมกราฟิกรุ่นใหม่ของทางเอ็นวิเดียกันก่อนสักนิดเพื่อที่จะได้เห็นภาพการเปลี่ยนแปลงที่เกิดขึ้น (ไม่นับส่วนของ CUDA Cores ที่มีอยู่ในกราฟิกโปรเซสเซอร์ทุกรุ่นอยู่แล้ว) เริ่มจาก Volta เป็นสถาปัตยกรรมแรกที่มาพร้อมกับ Tensor Cores แต่ตัวกราฟิก Volta นี้ไม่ได้ถูกนำมาใช้งานในตลาดเกม แต่ไปอยู่ในตลาดกราฟิกระดับมืออาชีพเป็นหลัก, ส่วนกราฟิก Turing (RTX 20) เป็นสถาปัตยกรรมกราฟิกรุ่นแรกของเอ็นวิเดียที่มี RT Cores เป็นฮาร์ดแวร์เฉพาะสำหรับการทำงานด้าน Raytracing โดยเฉพาะ และ Turing ก็ยังมีส่วนของ Tensor Cores อยู่เช่นเดิม แต่ว่าเป็น Tensor Cores รุ่นที่สองที่ปรับปรุงให้มีประสิทธิภาพเพิ่มขึ้น

รูปที่ 4 ในสถาปัตยกรรม Volta และ Turing ทางเอ็นวิเดียได้ใส่ ตัวดำเดินการแบบ FP32 และเพิ่ม INT32 เข้ามาทำให้กราฟิกทั้งสองรุ่นสามารถประมวลผลชุดคำสั่งที่เป็น FP และ INT ได้พร้อม ๆ กัน ลดเวลาในการประมวลผลลงไปได้มาก ส่วนใน Ampere ก็มีการปรังปรุงให้มีประสิทธิภาพดีขึ้น
และถ้าย้อนกลับมาดูในส่วนที่เป็น CUDA Cores เราก็จะพบว่านวัตกรรมอีกอย่างที่มีอยู่ใน Turing และ Volta คือเป็นสถาปัตยกรรมกราฟิกที่มีตัวดำเนินการ (Operation) ทั้งแบบ FP32 และ INT32 ที่ทำให้สามารถประมวลผลชุดคำสั่ง FP32 และ INT32 ไปพร้อมกันได้ (Concurrent Execution) ซึ่งกราฟิกสถาปัตยกรรมรุ่นก่อน ๆ เช่นใน Pascal (GTX 10) การประมวลผลชุดคำสั่ง FP32 และ INT32 จะต้องเลือกประมวลผลชุดคำสั่งแบบใดแบบหนึ่งให้เสร็จก่อนหรือต้องสลับกันเท่านั้นไม่สามารถทำงานในเวลาเดียวกันได้ และในสถาปัตยกรรม Ampere ก็ยังคงไว้ซึ่งตัวดำเนินการ FP32 และ INT32 ด้วยเช่นกัน แต่มีการเพิ่มคุณสมบัติใหม่ที่มีประสิทธิภาพมากมายเข้าไปด้วย

รูปที่ 5 เปรียบเทียบบล็อกไดอะแกรมของ Turing และ Ampere
เช่นเดียวกับ GPU รุ่นก่อนหน้า Ampere แบ่ง SM แบ่งการประมวลผลออกเป็นสี่บล็อก (หรือสี่พาร์ติชัน) แต่ละบล็อกมี Register ขนาด 64 KB, มีแคชคำสั่ง L0, ตัวกำหนดตารางเวลาหนึ่งหน่วย, ตัวปล่อยคำสั่งหนึ่งหน่วย และชุดคณิตศาสตร์และหน่วยอื่น ๆ บล็อกประมวลผลทั้ง 4 จะมีการใช้หน่วยความจำแคชข้อมูล L1 ที่มีขนาด 128KB (Turing มี L1 ขนาด 96KB) ที่ทำหน้าที่เป็นพื้นที่ของหน่วยความจำย่อยเพื่อใช้เก็บข้อมูลรวมกัน ที่สามารถปรับเปลี่ยนขนาดได้ดังนี้
● 128 KB L1 + 0 KB Shared Memory*
● 120 KB L1 + 8 KB Shared Memory**
● 112 KB L1 + 16 KB Shared Memory
● 96 KB L1 + 32 KB Shared Memory
● 64 KB L1 + 64 KB Shared Memory
● 28 KB L1 + 100 KB Shared Memory
(ตัวอย่าง *ทำหน้าที่เป็นแคช L1 เต็มพื้นที่ / **ทำหน้าที่เป็นแคช L1 120KB แบ่ง 8KB มาใช้เก็บข้อมูลรวมกัน)
การปรับเปลี่ยขนาดของพื้นที่ได้ในลักษณะนี้ก็จะช่วยให้การทำงานภายในระบบมีประสิทธิภาพสูงขึ้นเพราะไม่จำเป็นต้องออกไปค้นหาข้อมูลนอกพื้นที่ เว้นแต่ถ้ามีข้อมูลในแคชคำสั่งเป็นจำนวนมากจนเต็มพื้นที่จึงจะไปใช้พื้นที่ของแคช L2 แทน (พื้นที่ของ L2 ดูในรูป 3 ส่วนที่เป็นสีฟ้า)
จากรูปที่ 5 เราอาจจะเห็นว่า Turing กับ Ampere ไม่ได้มีอะไรแตกต่างกันมานัก แต่ถ้าลงรายละเอียดเราก็จะพบว่า ใน Ampere ทางเอ็นวิเดียได้ปรับปรุงให้ส่วนของ INT32 สามารถทำงานเป็น FP32 ได้ด้วย นั่นหมายความว่าใน Ampere จะสามารถให้ประสิทธิภาพในด้าน FP32 มากกว่าใน Turing เป็นเท่าตัว ซึ่งต้องบอกว่าเกมสมัยใหม่จำนวนมากในตอนนี้กำลังต้องการประสิทธิภาพของ FP32 มากขึ้น โดยชุดคำสั่งในลักษณะนี้ก็เช่น FFMA, floating point additions (FADD) หรือ floating-point multiplications (FMUL) เป็นต้น
Ray Tracing Cores เจนเนอร์เรชันที่ 2
Turing เป็นกราฟิกรุ่นแรกที่มีฮาร์ดแวร์ RT Core ที่ช่วยประมวลผลด้าน Raytracing โดยเฉพาะ ซึ่งทำให้เรื่องของ Raytracing ที่เคยมีอยู่เฉพาะในโลกของภาพยนตร์ ได้ถูกนำมาใช้กับเกมเพื่อเพิ่มประสบการณ์ในการเล่นเกมให้ดียิ่งขึ้น และในช่วงเวลาที่ผ่านมาทางวิศวกรของเอ็นวิเดียได้ทำงานอย่างหนักและใกล้ชิดอย่างมากกับไมโครซอฟท์ในเรื่องของ DirectX Ray Tracing (DXR) รวมไปถึงทำงานใกล้ชิดกับ Khronos Group ในส่วนของ Raytracing บน Vulkan API ด้วยเช่นกัน

รูปที่ 6 ฮาร์ดแวร์ Raytracing ที่ถูกนำมาใช้งานในกราฟิก Turing (RTX 20) เป็นครั้งแรก
ใน Ampere นั้นประสิทธิภาพของ RT Core มีมากขึ้นสามารถให้ค่า ray/triangle เพิ่มเป็นสองเท่า โดยเอ็นวิเดียออกแบบให้ RT Core นั้นสามารถทำงานร่วมกับ SM ได้ยืดหยุ่นมากขึ้นโดยใช้เทคนิค Simultaneous Compute and Graphics (SCG) หรือที่เรารู้จักกันในชื่อ Async Compute นั่นเอง ซึ่งเป็นการทำงานที่ทำให้ SM สามารถประมวลข้อมูลทั่วไป (ในที่นี้คือข้อมูลที่เกี่ยวกับ Raytracing เช่น denoising) และข้อมูลทางด้านกราฟิกได้พร้อม ๆ การทำเช่นนี้เป็นการแยกเวิร์คโหลดออกมาให้แต่ละส่วนประมวลผลได้ช่วยกันทำงาน ทำให้กระบวนการสร้าง Raytracing มีประสิทธิภาพเพิ่มขึ้น

รูปที่ 7 ในกราฟิก Ampere ฮาร์ดแวร์ของ RT Core ได้เพิ่มส่วนที่รองรับการทำ Raytracing พร้อม ๆ กับการเกิดภาพแบบ motion blur ซึ่งจะทำให้บรรยากาศในเกมมีความสมจริงจนถึงขีดสุด

รูปที่ 8 สาเหตุที่ต้องมีการเพิ่มฮาร์ดแวร์เข้าไปใน RT Core ก็เพราะว่าข้อมูลที่เกิดขึ้นในระหว่างการเรนเดอร์ภาพ motion blur ไปพร้อม ๆ กับการทำ Ray นั้นมันมีข้อมูลเพิ่มขึ้นเป็นจำนวนมหาศาล
นอกจากจะปรับรูปแบบการทำงานแล้วในตัวของ RT Core เองก็ยังได้รับการเพิ่มเติมฮาร์ดแวร์ใหม่เข้าไปเรื่องของรับ Raytracing ที่มีความซับซ้อนเช่นการสร้าง Raytracing ไปพร้อมกับตอนที่กำลังเกิดภาพแบบ motion blur ซึ่งในการร้าง Raytracing ไปพร้อม ๆ กับการเกิด motion blur นั้นจำเป็นที่จะต้องใช้พลังการประมวลผลจำนวนมหาศาล เพราะข้อมูลของ Ray ที่เกิดขึ้นได้เกิดจากตำแหน่งเดียวแล้วนั่นเอง
Tensor Cores เจนเนอร์เรชันที่ 3
หลายคนอาจจะงงว่า GeForce RTX เพิ่งจะออกมาสองซีรีส์คือ RTX 20 และ RTX 30 แต่ทำไม Tensor Cores ถึงเป็นเจนเนอร์เรชันที่ 3 ได้ เหตุผลก็คือ Tensor Cores เจนเนอร์เรชันแรกนั้นอยู่ในกราฟิก NVIDIA Volta ที่จัดเป็นกราฟิกในระดับเวิร์คสเตชัน, Tensor Cores เจนฯ 1 ที่อยู่ใน NVIDIA Volta และ Tensor Cores เจนฯ 2 ที่อยู่ใน RTX 20 นั้นไม่ได้มีความแตกต่างกันมากนัก

รูปที่ 9 ขนาดของ Tensor Cores ที่อยู่ใน Ampere มีการเพิ่มขนาดให้ใหญ่เป็นสองเท่าจาก Turing เพื่อรองรับชนิดของข้อมูลที่มากกว่าและรองรับข้อมูลได้มากกว่า
Tensor Cores รุ่นแรกที่อยู่ใน Volta นั้นมีความสามารถในการรองรับชุดข้อมูลเฉพาะ FP16 จากนั้นใน Turing ก็ได้เพิ่ม INT8 และ INT4 เพิ่มเข้าไป แต่ขนาดของตัวฮาร์ดแวร์นั้นยังคงเท่ากันไม่ได้รับการขยายเพิ่มเติม จนมาถึง Tensor Core ของ Ampere ทางเอ็นวิเดียก็ได้เพิ่มการรับข้อมูล TF32 และ BF16 เพิ่มเข้าไปอีก ซึ่งเป็นหนึ่งในคุณสมบัติเดียวกันกับ NVIDIA A100 GPU สำหรับดาต้าเซนเตอร์เลยทีเดียว แต่ว่าใน NVIDIA A100 GPU จะรองรับ FP64 เพิ่มด้วย ในขณะที่ Tensor Core ของ Ampere (RTX 30) ไม่รองรับ แต่ก็เข้าใจได้ว่าระดับของงานที่รองรับก็ไม่เท่ากันด้วย เมื่อมีการเพิ่มชนิดของข้อมูลที่รองรับและมีขนาดของข้อมูลที่รองรับมากขึ้น ทางเอ็นวิเดียจึงได้ขยายขนาดของ Tensor Core ใน Ampere เพิ่มขึ้นมาอีกเกือบเท่าตัว ดูในรูปที่ 9 ที่เห็นความแตกต่างของขนาด Tensor Core ได้อย่างชัดเจน

รูปที่ 10 Fine-Grained Structured Sparsity อัลกอริทึมสำหรับการเรียนรู้แบบเดียวกันกับใน NVIDIA A100 GPU ที่อยู่กลุ่ม Datacenter
นอกจากนี้ NVIDIA ยังได้ใส่อัลกอรึทึม Fine-Grained Structured Sparsity เป็นกระบวนการการเรียนรู้เพื่อกำจัดค่าน้ำหนักที่มีความซ้ำซ้อน (ที่มีค่าใกล้เคียงกับศูนย์) ออก เพื่อให้เกิดความรวดเร็วและแม่นยำในการเรียนรู้มากยิ่งขึ้น เป็นการกระจายโครงข่ายประสาทเทียมแบบลึกสำหรับการอนุมานโดยใช้รูปแบบการกระจัดกระจายแบบโครงสร้าง 2:4 เมื่อโครงข่ายได้รับการฝึกฝนครั้งแรกโดยใช้น้ำหนักที่หนาแน่นจากนั้นจึงใช้การปรับแต่งกิ่งที่มีโครงสร้างละเอียดและสุดท้ายน้ำหนักที่ไม่เป็นศูนย์ที่เหลือจะได้รับการปรับแต่งขั้นตอนการฝึกอบรมเพิ่มเติม วิธีนี้ส่งผลให้แทบไม่สูญเสียความแม่นยำในการอ้างอิง ซึ่งกระบวนการนี้เหมาะมากสำหรับการฝึกอบรมโครงข่ายที่เกี่ยวกับการตรวจจับวัตถุ และการสร้างแบบจำลองของภาษา และการแปลภาษา เป็นต้น
NVIDIA DLSS 8K
ก่อนหน้านี้ NVIDIA ได้เปิดตัว DLSS 2.0 และได้แสดงให้เห็นว่ามีประสิทธิภาพในการทำงานสูงขึ้นเป็นสองเท่าแม้ว่าจะยังคงใช้งานอยู่บนฮาร์ดแวร์เดิมอย่าง RTX 20 Series ก็ตาม และพอมาถึงกราฟิกชิปรุ่นใหม่อย่าง RTX 30 Series ที่มาพร้อมกับฮาร์ดแวร์ใหม่ไม่ว่าจะเป็น CUDA Core ใหม่, RT Cores ใหม่ และ Tensor Cores รุ่นใหม่ ก็ยิ่งทำให้ประสิทธิภาพของ DLSS ที่มาใช้งานร่วมกับ RTX 30 Series ยิ่งเพิ่มสูงขึ้นไปอีกจนสามารถใช้ขับเคลื่อนเกมที่มีความละเอียดสูงในระดับ 8K ได้อย่างสบาย ๆ แต่ว่าก็จำเป็นต้องใช้กราฟิกการ์ดรุ่นท็อปอย่าง RTX 3090 ร่วมด้วยเนื่องจากความละเอียดสูงขึ้นก็จำเป็นต้องใช้หน่วยความจำหลักเพิ่มเติมมากขึ้นตามไปด้วย

รูปที่ 11 ตัวอย่างการเรนเดอร์เฟรม 1 เฟรม ที่สร้างด้วยเงื่อนไขแบบต่าง ๆ และในขั้นตอนสุดท้ายจะเห็นได้ว่าการใช้ฮาร์ดแวร์ใหม่ทั้งหมดทั้งสามส่วนร่วมกันไม่เพียงแต่จะทำให้ได้ภาพกราฟิกที่สวยงาม แต่ยังสามารถลดค่าความหน่วงในระบบลงได้อย่างมากอีกด้วย ทำให้เกมมีเฟรมเรตที่สูง เล่นเกมได้อย่างลื่นไหลไม่สะดุด

รูปที่ 12 ภาพเปรียบเทียบขนาดความละเอียด Full HD กับความละเอียดในระดับ 8K คือมีขนาดภาพที่ใหญ่กว่าถึง 16 เท่า

รูปที่ 13 การใช้ภาพความละเอียดในระดับ 8K จำเป็นต้องใช้กราฟิกการ์ดระดับสูงอย่าง RTX 3090 ที่มาพร้อมกับหน่วยความจำขนาด 24GB และใช้การเชื่อมต่อภาพพอร์ต HDMI 2.1 ที่สามารถรองรับการแสดงผลระดับ 8K ที่อัตรารีเฟรชเรตในระดับ 60Hz ขึ้นไปได้ และรองรับ HDR

รูปที่ 14 รูปแสดงคุณสมบัติการทำงานของ NVIDIA DLSS 8K ที่ได้จากกราฟิกการ์ด RTX 3090
ในส่วนของการแสดงผลกราฟิกการ์ด RTX 30 Series ทั้งหมดจะรองรับ HDMI 2.1 ที่สามารถต่อกับจอภาพความละเอียดสูง รีเฟรชเรตสูง ได้ด้วยใช้สายสัญญาณเพียงเส้นเดียว และยังให้แบนด์วิดธ์ที่สูงกว่า DisplayPort นอกจากนี้แล้ว RTX 30 Series ยังรองรับการถอดรหัสวิดีโอตามมาตรฐาน AV1 ในระดับฮาร์ดแวร์ ทำให้คุณสามารถรับชมคอนเทนต์ความละเอียดสูงได้โดยไม่ไปรบกวนการทำงานของฮาร์ดแวร์ส่วนอื่น ๆ เช่น ซีพียู เป็นต้น
GDDR6X หน่วยความจำสำหรับกราฟิกที่เร็วที่สุดในโลก
GDDR6X เป็นผลจากความร่วมมือกันในการพัฒนาระหว่าง NVIDIA และ Micron Technology เพื่อนำมาใช้งานร่วมกับกราฟิก RTX 30 Series โดยเฉพาะ สำหรับ GDDR6X นั้นเป็นการพัฒนาต่อยอดมาจาก GDDR6 ตามมาตรฐานของ JEDEC แล้วทำการเพิ่มสัญญาณ PAM4 (Pulse Amplitude Modulation 4) เข้าไปจากสัญญาณปกติทำให้สัญญาณรูปแบบเดิมที่มีเพียงแค่ 0 และ 1 ให้มีรูปฐานของสัญญาณใหม่จนสามารถใส่ข้อมูลแบบ 0 และ 1 ซ้อนลงไปบนตำแหน่งอื่น ๆ ที่เพิ่มขึ้นมาได้ ทำให้สามารถรับส่งข้อมูลได้เร็วขึ้นแม้ว่าจะใช้ Clock Speed ที่เท่าเดิมก็ตาม แต่ว่าในการออกแบบฮาร์ดแวร์ก็จำเป็นต้องมีส่วนที่ใช้ในการถอดรหัสสัญญาณของหน่วยความจำแบบ GDDR6X โดยเฉพาะอีกด้วย

รูปที่ 15 แสดงรูปแบบของสัญญาณที่ใช้ใน GDDR6X เทียบกับ GDDR6 มาตรฐาน
และด้วยเทคนิคดังกล่าวทำให้ GDDR6X ถือได้ว่าเป็นหน่วยความจำสำหรับกราฟิกการ์ดที่ทันสมัยและเร็วที่สุดของโลกในตอนนี้ และ RTX 30 Series ของ NVIDIA ก็ได้นำ GDDR6X นี้มาใช้งานเป็นรายแรกของโลกด้วยเช่นกัน โดยหน่วยความจำ GDDR6X นี้จะติดตั้งมาพร้อมกับกราฟิกการ์ด RTX 3090 และ RTX 3080 ส่วน RTX 3070 ที่เปิดตัวมาพร้อมกันยังคงใช้ GDDR6 แบบมาตรฐาน
GeForce RTX 30 Series Founders Edition ที่มาพร้อมกับดีไซน์ใหม่
กราฟิกการ์ด GeForce ในรุ่น Founders Edition มักจะเป็นที่พูดถึงเสมอเมื่อมีการเปิดตัวกราฟิกการ์ดรุ่นใหม่ และในครั้งนี้การ์ดในรุ่น Founders Edition ก็ได้รับการพูดถึงมากเป็นพิเศษ เพราะมาพร้อมกับดีไซน์ใหม่ที่ฉีกแนวไปจากการ์ด Founders Edition รุ่นก่อน ๆ อย่างชัดเจน

รูปที่ 16 ภาพของแผงวงจรหรือ PCB ของกราฟิกการ์ดรุ่นก่อน ๆ เทียบกับ กราฟิกการ์ด RTX 30 Series ที่มีขนาดเล็กลงอย่างมากและมีการเว้นตำแหน่งเป็นรูปตัว V เพื่อให้เป็นช่องทางการไหลของอากาศ
กราฟิกการ์ด Founders Edition มีการคิดคอนเซปต์ใหม่ตั้งแต่แผงวงจร ไปจนถึงชุดระบายความร้อน ซึ่งการออกแบบใหม่ทั้งหมดนี้ทำมาเพื่อจุดประสงค์ใหญ่คือ เพิ่มประสิทธิภาพในการระบายความร้อนทั้งตัวกราฟิกการ์ด และเพิ่มอัตราการไหลเวียนของอากาศภายในเคสอีกด้วย

รูปที่ 17 แสดงทิศทางการไหลเวียนของอากาศเมื่อติดตั้ง RTX 30 ในรุ่น Founders Edition ลงในเคสแบบปกติ

รูปที่ 18 ภาพโครงสร้างภายใน RTX 30 Founders Edition
ที่สุดของกราฟิกการ์ดเพื่อการเล่นเกมและทำงาน
ด้วยคุณสมบัติที่โดดเด่นมากมายของ RTX 30 Series ทำให้เราเห็นได้ว่า NVIDIA นั้นได้ให้ความสำคัญกับในทุก ๆ รายละเอียด ตั้งแต่ฮาร์ดแวร์ภายในที่ได้รับการปรับปรุงใหม่ จนไปถึงรูปร่างหน้าตาของกราฟิกการ์ดที่ดูทันสมัย และตอบสนองการใช้งานได้ดียิ่งขึ้นกว่าเดิม โดยเฉพาะเรื่องการกำจัดความร้อน ที่ทำออกมาได้อย่างเหนือความคาดหมาย

ประสิทธิภาพของ RTX 30 Series นั้นเหมาะอย่างมากสำหรับเกมรุ่นใหม่ที่รองรับคุณสมบัติ Raytracing เช่น Cyberpunk 2077, Fortnite with RTX, Call of Duty: Black Ops Cold War, Watch Dogs: Legion, และ Minecraft RTX for Windows 10 รวมไปถึงผู้ที่ต้องการเล่นเกมด้วยความละเอียดสูง และต้องการค่าความหน่วงต่ำ (Low latency)
นอกจากเกมแล้วฮาร์ดแวร์ใหม่ของ RTX 30 Series ยังเหมาะสำหรับกลุ่มนักสร้างคอนเทนต์ไม่ว่าจะเป็นงานด้านกราฟิก 2D/3D และโปรแกรมตัดต่อวิดีโอในระดับมืออาชีพก็รองรับได้ดีเช่นกันไม่ว่าจะเป็น Davinci Resolve, Blender และ Adobe Premiere Pro โดยใช้ไดรเวอร์พิเศษ NVIDIA STUDIO ที่ออกแบบมาเพื่อรองรับกับแอปพลิเคชันระดับมืออาชีพโดยเฉพาะ
ข้อมูลเพิ่มเติม: nvidia.com
บทความอื่นที่น่าสนใจ