グラフィックス
NVIDIA¶
Turingコア¶
2018年登場。VR対応としてVirtualLink対応(USB Type-CでPCとVRデバイスを接続するI/F)。
レイトレーシングのリアルタイム演算機能を持つ。
項目 | 2080 Ti | 2080 | 2070 | 2060 |
---|---|---|---|---|
GPUコア | TU102 | TU104 | TU106 | TU106 |
CUDAコア | 4352基 | 2944基 | 2304基 | 1920基 |
RTコア | 68基 | 46基 | 36基 | 30基 |
Tensorコア | 544基 | 368基 | 288基 | 240基 |
定格クロック | 1350MHz | 1515MHz | 1410MHz | 1365MHz |
レイトレーシング | 10G Ray/s | 8G Ray/s | 6G Ray/s | 5G Ray/s |
メモリ I/F | GDDR6 | |||
メモリバス幅 | 352bit | 256bit | 256bit | 192bit |
TDP | 250W | 215W | 185W | 160W |
補助電源 | 8pin+8pin | 8pin+6pin | 8pin | 8pin |
性能はざっくりと
RTX 2080 > GTX 1080 Ti > RTX 2070 > GTX 1080 > RTX 2060 > GTX 1070 > GTX 1660 > GTX 1060 > GTX 1650 > GTX 770 > GTX 1050 Ti > GTX 960 > GTX 950 > GTX 760 > GTX 1050
価格は、2080⇒9万円、2070⇒6万円、2060⇒4万円
Turingコア(リアルタイムレイトレーシング機能などを削除)¶
項目 | 1660Ti | 1660 | 1650 |
---|---|---|---|
GPUコア | TU116 | TU117 | |
CUDAコア | 1536基 | 1408基 | 896基 |
定格クロック | 1500MHz | 1530MHz | 1485MHz |
メモリ I/F | GDDR6 | GDDR5 | |
メモリバス幅 | 192bit | 128bit | |
TDP | 120W | 120W | 75W |
補助電源 | 8pin | 6pin |
Pascalコア¶
項目 | 1080Ti | 1080 | 1070Ti | 1070 | 1060 6G |
---|---|---|---|---|---|
GPUコア | GP102 | GP104 | GP104/106 | ||
CUDAコア | 3584基 | 2560基 | 2432基 | 1920基 | |
定格クロック | 1480MHz | 1607MHz | 1607MHz | 1506MHz | |
メモリ I/F | GDDR5X | GDDR5 | GDDR5X | ||
メモリバス幅 | 352bit | 256bit | 192bit | ||
TDP | 250W | 180W | 150W | ||
補助電源 | 8+6pin | 8pin | 6pin |
返答 (2)
NVIDIA GTXとRTXシリーズの違い(2023) - 高橋 徹 さんが約2年前に追加
GTXシリーズは、OpenGL、DirectXなどのポリゴン3Dグラフィックス描画処理を担うハードウェアで、頂点演算、サーフェイス(テクスチャマップ)を加速することが主目的。
RTXシリーズは、レイトレーシング3Dグラフィックス描画処理を担うハードウェア(RTコア)と、フレームレートを向上するDLSS(TensorコアとAI処理)が追加された。RTX 40シリーズは、Ada Lovelaceアーキテクチャです。
項目 | RTX4090 | RTX4080 | RTX4070 Ti | RTX4070 | RTX4060 Ti | RTX4060 | 備考 |
---|---|---|---|---|---|---|---|
GPUコア | AD102 | AD103 | AD104 | AD106 | |||
ベースクロック | 2,235MHz | 2,210MHz | 2,310MHz | 1,920MHz | 2,310MHz | 1,830MHz | |
Boostクロック | 2,520MHz | 2,510MHz | 2,610MHz | 2,480MHz | 2,535MHz | 2,460MHz | |
メモリ | 24GB DDR6X | 16GB DDR6X | 12GB GDDR6X | 8/16GB GDDR6 | 8GB GDDR6 | ||
メモリ帯域 | 1,018GB/s | 716GB/s | 504GB/s | 18Gbps | |||
メモリバス幅 | 384bit | 256bit | 192bit | 128bit | |||
L2キャッシュ | 48MB | 36MB | 32MB | 24MB | |||
CUDAコア | 16,384 | 9,728 | 7,680 | 5,888 | 4,352 | 3,072 | |
RTコア | 128 | 76 | 60 | 48 | 34 | 24 | |
Tensorコア | 512 | 304 | 240 | 184 | 136 | 96 | 第4世代 |
NVENC | |||||||
消費電力(max) | 450W | 320W | 285W | 200W | 160W | 115W | |
補助電源 | 12+4pin | 8pinx2 | 8pin | 8pin | |||
PCIバス | PCIe4.0x16 | ||||||
価格帯 | 30万円 | 20万円 | 13万円 | 9万円 | 7万円 |
- RTコア
レイトレーシングの処理に適したコア。スクリーンの各ピクセルから光線(レイ)を飛ばして、物体に衝突すると色を計算するレイトレーシングにおいて、レイと物体の衝突判定をハードウェアで実行する演算ユニット。 - Tensorコア
行列演算(行列の積和)を高速化する専用の演算ユニット、FP16(16bit浮動小数点), TF32(TensorFloat-32)対応 - TF32
符号1bit、指数8bit、仮数10bitで構成する浮動小数点数表現。FP16と同じ仮数、FP32と同じ指数となる
https://blogs.nvidia.co.jp/blog/tensorfloat-32-precision-format/ - CUDAコア
同じ命令を複数の値に対して同時に実行する演算ユニット(SIMD:Single Instruction, Multiple Data)。
RTX Adaシリーズ¶
旧 Quadroシリーズの後継シリーズで、Ada Lovelaceアーキテクチャの製品群です。
項目 | RTX 6000 Ada | RTX 5000 Ada | RTX 4500 Ada | RTX 4000 Ada | RTX 2000 Ada |
---|---|---|---|---|---|
ベースクロック | |||||
Boostクロック | |||||
メモリ | 48GB GDDR6 | 32GB GDDR6 | 24GB GDDR6 | 20GB GDDR6 | 16GB GDDR6 |
メモリバス幅 | 384bit | 256bit | 192bit | 160bit | 128bit |
CUDAコア数 | 18,176 | 12,800 | 7,680 | 6,144 | 2,816 |
FP32 TFLOPS | 91.1 | 65.3 | 39.6 | 26.7 | 12.0 |
Tensorコア | 568 | 400 | 240 | 192 | 88 |
Tensor性能 | 1,457.0 | 1,044.4 | 634.0 | 327.6 | 191.9 |
RTコア | 142 | 100 | 60 | 48 | 22 |
RTコア TFLOPS | 210.6 | 151.0 | 91.6 | 61.8 | 27.7 |
TDP | 300W | 250W | 210W | 130W | 70W |
価格帯 | 150万 | 90万 | 50万 | 30万 |
2025年 NVIDIA - 高橋 徹 さんが10日前に追加
2025年発売、Blackwellアーキテクチャ。DLSS 4(マルチフレーム生成でゲームのフレームレート向上)、Tensorコア第5世代でFP4対応、PCI Express 5.0対応。RTX 40シリーズから1割程度の性能向上、メモリ速度は3割程度向上。
コンシューマー向け RTX 50シリーズ¶
項目 | RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | RTX 5060 Ti | RTX 5060 |
---|---|---|---|---|---|---|
ベースクロック | 2,017MHz | 2,295MHz | 2,295MHz | 2,325MHz | 2,407MHz | 2,280MHz |
Boostクロック | 2,407MHz | 2,617MHz | 2,610MHz | 2,510MHz | ||
メモリ | 32GB GDDR7 | 16GB GDDR7 | 16GB GDDR7 | 12GB GDDR7 | 8/16GB GDDR7 | 8GB GDDR7 |
メモリバス幅 | 512bit | 256bit | 256bit | 192bit | 128bit | 128bit |
CUDAコア数 | 21,760 | 10,752 | 8,960 | 6,144 | 4,608 | 3,840 |
処理性能 TFLOPS | 104.8 | 56.3 | 44.4 | 30.8 | ||
RTコア | 170 | 84 | 70 | 48 | ||
Tensorコア AI TOPS | 3,352 | 1,801 | 1,406 | 988 | ||
TDP | 575W | 360W | 300W | 250W | 180W | 145W |
RTX PRO シリーズ¶
従来のQuadraシリーズに似た位置づけのBlackwellアーキテクチャーのシリーズ。前アーキテクチャAda Lovelaceでは、RTX6000 Adaのように命名、
項目 | RTX PRO 6000 | RTX PRO 5000 | RTX PRO 4500 | RTX PRO 4000 | 備考 |
---|---|---|---|---|---|
ベースクロック | 1,590 MHz | 1,590 MHz | 1,590 MHz | 1,590 MHz | |
Boostクロック | 2,598 MHz | 2,617 MHz | 2,617 MHz | 2,617 MHz | |
メモリ | 96GB GDDR7 ECC | 48GB GDDR7 ECC | 32GB GDDR7 ECC | 24GB GDDR7 ECC | |
メモリバス幅 | 512bit | 384bit | 256bit | 192bit | |
CUDAコア数 | 24,064 | 14,080 | 10,496 | 8,960 | |
FP32 TFLOPS | 125 | 74 | 55 | 47 | |
RTコア | 188 | 100 | 82 | 70 | 第4世代 |
Tensorコア | 752 | 400 | 328 | 280 | 第5世代 |
Tensorコア AI TOPS | 4,000 | ||||
TDP | 600W | 300W | 200W | 140W | |
価格帯 | 160万 | 100万 | 50万 | 30万 |