StableDiffusionを使うならどのグラフィックボードがおすすめ?

Recommended Graphics Cards.

ここではStableDiffusionを利用する上でお勧めできるグラフィックカードの紹介をするにゃ。
予算に合わせて決めてほしいにゃ。

高いにゃ~。
でも直接的な値段もそうだけど消費電力も考えないと電気代ぎゃ~。

性能とコストが予算的に見合うところを探すのにゃ。
以降の内容は2023年7月時点での評価ですにゃ。
またLora学習などを見据えるともっとも重要な項目のVRAMの容量は最低12Gはほしいですにゃ。

How-To Guides

StableDiffusionで画像を生成するために必要なGPUの性能とは?

種類や世代、コア数やクロック速度、メモリ容量やバス幅の影響を解説

  • GPUの種類や世代
    • GPUには、NVIDIAやAMDなどのメーカーが製造するものがあります。
    • GPUには、GeForce RTX 40シリーズやRadeon RX 6000シリーズなどの世代があります。
    • GPUの種類や世代によって、性能や機能が異なります。
    • 一般的に、新しい世代のGPUは、古い世代のGPUよりも性能が高くなります。
  • GPUのメモリ容量やバス幅
    • GPUのメモリ容量は、GPUが一度に保存できるデータの量を表します。
    • GPUのバス幅は、GPUとメモリの間でやり取りできるデータの幅を表します。
    • 一般的に、メモリ容量やバス幅が大きいGPUは、小さいGPUよりも性能が高くなります。
  • GPUのコア数やクロック速度
    • GPUには、コアと呼ばれる小さな計算部分が多数存在します。
    • GPUのコア数は、GPUが同時に処理できるデータの量を表します。
    • GPUのクロック速度は、GPUが1秒間に処理できるデータの回数を表します。
    • 一般的に、コア数やクロック速度が高いGPUは、低いGPUよりも性能が高くなります。


StableDiffusionは、テキストを入力するだけで自動で画像を生成するAIです。
しかし、画像生成には高い計算能力が必要で、グラフィックボードの性能によって生成時間や品質が変わってきます。
そこで、今回はRTX 4090、RTX 4080、RTX 4070 Ti、RTX 4070の4つのグラフィックボードの性能と価格を比較し、StableDiffusionを使うために最適なグラフィックボードを選定してみました。

またStableDiffusionを利用するにあたり次のコアも重要になります。

Tensor Core:NVIDIA社が開発した深層学習に特化した演算回路で、1回のクロックで複数の演算を同時に実行することで、演算の高速化を実現します。また、Tensor Coreは、機械学習をより効果的に実践するための演算能力をGPUに与えています。

RT core:NVIDIA社が開発したレイトレーシングに特化した演算回路で、光線の追跡を大きく、以下の3つのステップで行います。
・レイジェネレーション:光線を生成します
・トラバーサル:光線とオブジェクトの交差を検出します
・シェーディング:交差点での色や明るさを計算します
RTコアは、レイトレーシングによって、よりリアルな映像表現を実現するために必要な演算能力をGPUに与えています。

1: RTX 4090

・GPU:Ada Lovelace
・CUDAコア数: 16384基
・Tensorコア数:512
・RTコア数: 128
・メモリタイプ: 24GB GDDR6X
・ブーストクロック:2.52 GHz
・メモリバス幅: 384-bit
・インターフェース: PCI-E 4.0 X16
・最大消費電力: 450W
・発売日: 2022年10月12日
RTX 4090は、非常に強力なグラフィックボードであり、高いCUDAコア数と大容量の高速メモリを備えています。これにより、高解像度の画像や大規模なモデルの処理において優れたパフォーマンスを発揮します。また、PCI-E 4.0 X16インターフェースを使用しており、データ転送速度が高速です。ただし、最大消費電力が高いため、十分な電力供給が必要です。

DLSS 3.0やレイトレーシングに対応し、4Kゲーミングにおいて平均100FPS以上を実現する最強のグラフィックカードなのにゃ。
吾輩には値段が高すぎて手が出ないにゃ。
最大消費電力も電子レンジ並みでフル回転させてたら電気代もすごいことになりそうにゃ。


2: RTX 4080

・GPU:Ada Lovelace
・CUDAコア数: 9728
・Tensorコア数:304
・RTコア数: 76
・メモリタイプ: 16GB GDDR6X
・ブーストクロック: 2.51 GHz
・メモリバス幅: 256-bit
・インターフェース: PCI-E 4.0 X16
・最大消費電力: 320W
・発売日: 2022年11月16日
・価格: 20万円前後
RTX 4080は、高いCUDAコア数と大容量の高速メモリを備えた高性能なグラフィックボードです。処理能力が高く、多くの画像処理タスクや機械学習のモデルを効率的に処理できます。また、PCI-E 4.0 X16インターフェースを使用しており、データ転送速度も速いです。

レイトレーシングやNVIDIA DLSSに対応、RTX 4090の78%の性能で75%の価格、RTX 3080 Tiよりも38%高速なのにゃ
これもなかなか値段が高すぎて手が出ないにゃ。
16GのVRAMは魅力的なのにゃ。


3: RTX 4070Ti

・GPU:Ada Lovelace
・CUDAコア数: 7680
・Tensorコア数:240
・RTコア数: 60
・メモリタイプ: 12GB GDDR6X
・ブーストクロック: 2.61 GHz
・メモリバス幅: 192-bit
・インターフェース: PCI-E 4.0 X16
・最大消費電力: 285W
・発売日: 2023年1月5日
RTX 4070 Tiは、優れたパフォーマンスと高速なメモリを備えた中級のグラフィックボードです。多くの一般的な画像処理タスクや機械学習のモデルをスムーズに処理するのに十分な性能を提供します。PCI-E 4.0 X16インターフェースをサポートしているため、高速なデータ転送も可能です。

レイトレーシングやNVIDIA DLSSに対応、RTX 4070の約1.8倍の性能、RTX 3090 Tiに近い性能で半額以下の価格なのにゃ。
コストパフォーマンス的には一番おすすめにゃ。
12GのVRAMがあれば困ることはないにゃ。


4: RTX 4070

・GPU:Ada Lovelace
・CUDAコア数: 5888
・Tensorコア数:184
・RTコア数: 46
・メモリタイプ: 12GB GDDR6X
・ブーストクロック: 2.48 GHz
・メモリバス幅: 192-bit
・インターフェース: PCI-E 4.0 X16
・最大消費電力: 200W
RTX 4070は、手頃な価格帯のグラフィックボードでありながら、十分な性能を提供します。一般的な画像処理やディープラーニングのタスクにおいて優れたパフォーマンスを発揮します。PCI-E 4.0 X16インターフェースをサポートしているため、高速なデータ転送が可能です。

Tiに比べると処理速度が遅いにゃ。
消費電力も低いし12GのVRAMがあるから困ることはないにゃ。差額を見て予算と相談にゃ。

グラフィックボードの性能比較

グラフィックボード GPU CUDAコア ブーストクロック メモリ容量 バス幅 消費電力
RTX 4090 Ada Lovelace 16384基 2.52 GHz 24GB GDDR6X 384ビット 450W
RTX 4080 Ada Lovelace 9728基 2.51 GHz 16GB GDDR6X 256ビット 320W
RTX 4070 Ti Ada Lovelace 7680基 2.61 GHz 12GB GDDR6X 192ビット 285W
RTX 4070 Ada Lovelace 5888基 2.48 GHz 12GB GDDR6X 192ビット 200W

ここからわかることは、RTX 4090が最も高性能であることです。CUDAコアの数やメモリ容量が他のグラフィックボードよりも圧倒的に多く、ブーストクロックも高いです。これは、StableDiffusionで画像を生成する際に、より多くのデータを処理できることを意味します。つまり、RTX 4090はStableDiffusionで最も高品質な画像を最も早く生成できるグラフィックボードと言えます。

しかし、高性能なだけではありません。RTX 4090は消費電力も最も高く、450Wという大きな電力を必要とします。これは、電気代や冷却システムにも影響することに注意しなければなりません。また、RTX 4090は価格も最も高額な値段です。これは一般的なゲーミングPCの価格よりも高いです。

では、他のグラフィックボードはどうでしょうか?RTX 4080はRTX 4090の78%の性能で75%の価格というコスパの高いグラフィックボードです。レイトレーシングやNVIDIA DLSSにも対応しており、RTX 3080 Tiよりも38%高速です。StableDiffusionで画像を生成する際にも、RTX 4090には及ばないものの、十分な品質と速度を得られるでしょう。消費電力も320WとRTX 4090よりも低いです。

RTX 4070 Tiは、RTX 4070の約1.8倍の性能を持つグラフィックボードです。RTX 3090 Tiに近い性能で半額以下の価格という驚異的なコスパを誇ります。レイトレーシングやNVIDIA DLSSにも対応しており、StableDiffusionで画像を生成する際にも優れた品質と速度を提供します。消費電力は285Wとやや高めです。

StableDiffusionで画像を生成することが主な目的であれば、RTX 4090が最適ですにゃ。
しかし、予算が限られている場合や他の用途にも使う場合は、RTX 4080やRTX 4070 Tiがおすすめですにゃ。 ここでは扱わなかったけど、RTX 4060 Ti 8G版はStableDiffusionで画像を生成することがあまり目的ではなく、他の用途に重点を置く場合や予算が非常に限られている場合に選ぶべきですにゃ。

VRAM容量が重要になってくるから8G版はちょっと性能が足りないかも知れないにゃ。
以上が、StableDiffusionを使うならおすすめグラフィックボードの話でしたにゃ。
StableDiffusionは非常に魅力的な画像生成AIですが、それを快適に使うためには、グラフィックボードの性能や価格を考慮する必要がありますにゃ。

自分のニーズに合ったグラフィックボードを選ぶことで、StableDiffusionの魅力を最大限に引き出すことができるにゃ。
いかがでしたかにゃ?StableDiffusionに興味がある方は、ぜひ試してみてくださいにゃ~。 グラフィックボードの選定に関しても、参考になれば幸いですにゃ。