Kiến trúc Pascal vs Volta vs Turing trên GPU của VGA

Kiến trúc của mỗi GPU sẽ quyết định hiệu suất và cách thức hoạt động của của card đồ họa nói riêng và của toàn bộ hệ thống nói chung. GPU của NVIDIA, AMD hay các hãng khác nhau sẽ có kiến trúc khác nhau. Thậm chí, trong cùng 1 hãng, như NVIDIA chẳng hạn, các dòng card khác nhau cũng được dựa trên các nền tảng kiến trúc khác nhau.

Mỗi nhà sản xuất GPU thiết kế kiến trúc GPU của riêng mình và kiến trúc GPU của VGA từ Nvidia và AMD hoàn toàn khác nhau về cách làm việc, vận hành hay thậm chí là cách đặt tên. Ví dụ, kiến trúc GPU của Nvidia là Fermi, Kepler, Pascal, Volta, Turing trong khi GPU của AMD là GCN (1.0, 2.0, 3.0), Polaris (GCN 4.0) và Vega.

Bài viết này so sánh 3 kiến trúc GPU hiện đại nhất của Nvidia, đó là Pascal, Volta và Turing dựa trên đặc điểm kỹ thuật, hiệu suất, cách sử dụng và ứng dụng của chúng trong ngành công nghiệp đồ họa, bao gồm cả các ứng dụng cho AI, Deep learning và Machine Learning.

 

Kiến trúc NVIDIA Pascal GPU

Pascal có thể nói là một trong những kiến trúc GPU phổ biến nhất của Nvidia, được kế thừa từ kiến trúc GPU Maxwell trước đó. Các dòng card đồ họa GeForce 10 series và Quadro P được xây dựng trên kiến trúc GPU Pascal.

GPU Pascal được thiết kế trên công nghệ 16nm và sử dụng CUDA Cores làm công nghệ chính trong việc xử lý pixel và Rasterization. Tuy nhiên các bạn phải để ý là GeForce GTX 1050, GTX 1050 Ti và GT 1030 được xây dựng trên công nghệ Finnm 14nm nhằm giảm tối đa mức điện năng tiêu thụ nhưng vaanc có hiệu năng cao trong khi các kiến trúc của dòng GPU khác được xây dựng trên quy trình công nghệ 16nm.

Kiến trúc GPU Pascal mang lại những cải tiến đáng kể so với các kiến trúc cũ hơn về hiệu năng, mức tiêu thụ điện năng và phát sinh nhiệt. Kiến trúc GPU Pascal hỗ trợ bộ nhớ GDDR5, GDDR5X và HBM2.

Trong đó, chỉ có card đồ họa workstation cao cấp nhất là Nvidia Quadro GP100 là có bộ nhớ HBM2 băng thông cao. Kiến trúc GPU của Nvidia Pascal hỗ trợ DirectX 12, OpenGL 4.6, Vulkan, OpenCL, SLI , NVLink, NVENC, G-Sync, GPU Boost 3.0, DisplayPort 1.4, HDMI 2.0b, CUDA Compute Capability 6.0 / 6.1 và VR Ready.

 

Kiến trúc NVIDIA Volta GPU

Volta kế thừa kiến trúc GPU Pascal dựa trên công nghệ 12nm. Đương nhiên nó sẽ hỗ trợ bộ nhớ HBM2 tốc độ cao và băng thông cao. Kiến trúc Volta được thiết kế để phục vụ nhu cầu của các chuyên gia và trung tâm dữ liệu.

Kiến trúc GPU này được cung cấp bởi CUDA Cores và Tensor Cores. Tensor Cores được sử dụng cho trí tuệ nhân tạo (AI), Deep Learning, Machine Learning, các tính toán số học phức tạp với hiệu suất tăng hơn 5 lần so với kiến trúc Nvidia Pascal.

Các dòng card đồ họa sử dụng kiến trúc Volta GPU bao gồm Nvidia Titan V, Tesla V100 và Nvidia Quadro GV100. Kiến trúc Volta hỗ trợ công nghệ NVLink 2.0 nhanh hơn nhiều so với NVLink trước đó và cho phép tốc độ truyền dữ liệu cao hơn nhiều là 25 Gbit/s cho mỗi luồng dữ liệu.

 

Kiến trúc NVIDIA Turing GPU

Turing là sự kế thừa của kiến trúc GPU Volta. Đây là một trong những kiến trúc GPU tiên tiến nhất và mới nhất tính đến hiện nay. Turing GPU được xây dựng trên công nghệ FinFET 12nm và hỗ trợ bộ nhớ GDDR6 hoạt động ở tốc độ rất cao, có thể đạt được băng thông cao hơn nhiều so với các bộ nhớ GDDR5X và GDDR5 trước đó.

Kiến trúc GPU tiên tiến này đi kèm với CUDA Cores, Tensor Cores và RT Cores. Turing là kiến trúc GPU đầu tiên hỗ trợ Real Time Ray Tracing để tạo ra ánh sáng, bóng, phản xạ, khúc xạ và các hiệu ứng ánh sáng tiên tiến khác.

Ray theo dõi thời gian thực được xử lý bởi RT Cores và hiệu suất của nó được đánh giá bằng thông số mới là Giga Rays/s. Tensor Cores trong Turing GPU được thiết kế đặc biệt cho Artificial Intelligence (AI) và Deep Learning để thực hiện các loại tính toán phức tạp khác nhau liên quan đến ma trận và dữ liệu lớn. Nó cũng được sử dụng cho một kỹ thuật được gọi là Deep Learning Super Sampling (DLSS) hoặc (Deep learning anti-aliasing) để làm mịn các đường viền trong games, giảm nhiễu và cho độ phân giải cao.

CUDA được sử dụng cho các nhiệm vụ xử lý dựa trên Pixel chuẩn hoặc Rasterization, nhưng trong Turing chúng có một kiến trúc đa xử lý trực tuyến mới (Streaming Multiprocessor – SM) hỗ trợ tới 16 nghìn tỷ phép toán điểm động song song với 16 nghìn tỷ phép tính nguyên trong mỗi giây. Điều này bây giờ có thể cho phép các nhà phát triển tạo ra các mô phỏng phức tạp, chẳng hạn như các hạt hoặc chất lỏng chuyển động trong các thí nghiệm mô phỏng, môi trường ảo và các hiệu ứng đặc biệt.

Theo Nvidia, Turing GPU cung cấp hiệu năng lên đến 6X so với GPU dựa trên Pascal. Nvidia còn sản xuất cả card đồ họa workstation dựa trên kiến trúc GPU Turing. Card đồ họa Turing Workstation bao gồm các dòng Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000 và Quadro RTX 4000.

Còn Gaming Graphics Cards có GeForce RTX 20 series bao gồm GeForce RTX 2080 Ti, RTX 2080 và RTX 2070. Turing hỗ trợ thiết lập đa GPU cho cả Quadro RTX và GeForce RTX sử dụng NVLink để tăng gấp đôi hoặc gấp ba lần hiệu suất tính toán của chúng.

Card đồ họa GeForce RTX cũng hỗ trợ kết nối VirtualLink qua đầu nối USB Type-C để kết nối tai nghe VR trên cổng USB Type-C để có trải nghiệm thực tế ảo tuyệt vời. Mặt khác, Quadro RTX GPU có khả năng xử lý video 8K trong thời gian thực cho thấy sức mạnh của kiến trúc mới này.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

   
icon zalo
messenger facebook