Stable Diffusionという、画期的な技術が世に出現し、それがCGイラストを描く上での既存の認識を大幅に変えてしまいました。
しかし、Stable Diffusionに興味はあるけど…
- 「今の自分のパソコンでは動作が遅すぎて使いづらい」
- 「一体、Stable Diffusionを使うためにはどんな性能を持ったパソコンが必要なのか」
- 「快適な使用感を得るためにはどの程度の投資が必要なのだろうか」
このような疑問を持っていませんか?
この記事では、
- Stable Diffusionを始める為に必要な環境
- Stable Diffusionを始める為に必要なパソコンスペック
- CPUやGPUやメモリなど快適に使う場合の必要条件
これらについて解説をします。
このブログ記事「検証結果」の執筆者
Stable Diffusion 利用歴2年以上
画像生成AIは、
Stable Diffusionの他にも、
https://www.midjourney.com/account
https://openai.com/dall-e-3
これらのサービスも活用してAI画像生成を研究しています。
東京都にある、パソコンショップAIでの勤務履歴も
有りますので、パーツなども詳しいです。
なぜStable Diffusionが人気を浴びているのか?
Stable Diffusionが人気の理由は、何といっても利用者が簡単な指示文、一種のプロンプトを入力すれば、AIがそれに応じたイラストを自主的に生成することが可能になったからです。
「簡単でしかも無料で画像生成できるから」です。
これは当然の事だと思います。
しかしデメリットがある事も事実です。
思わず目を疑う程に美麗なグラフィックを描き出すことができるのですが、その分パソコンの処理能力にはそこそこ負荷がかかります。
特にグラフィックボード、通称グラボの性能が問われることとなります。
高性能のグラボを搭載すればするほど、AIによるイラスト生成が短時間で完成します。
エラーの発生を防ぐためにも、適切なグラボは非常に重要な要素となります。
そんなStable Diffusionを快適に利用するために、ローカル環境で使えるパソコンの必須スペックと、使用する上で私がおすすめするパソコンについてご紹介してみたいと思います。
AIイラスト自動生成のための安定なPC環境の構築について
Stable Diffusionを使えばこのぐらいの画像は簡単に作る事が可能です。
AIイラスト自動生成に欠かせないStable Diffusionの使用には、Stable Diffusion WebUIを自身のパソコン環境にインストールすることが必要です。
月額料金は発生せず、無料でStable Diffusion WebUIが手に入りますが、その条件として十分なパソコンのパフォーマンスが求められます。
特に、多重にもわたる画像処理を担うグラフィックボード(略してグラボ)の能力は極めて重要視されます。
一般的にStable Diffusionを快適に動かすために求められるパソコンの仕様は、次のようになります。
- CPU:あまり必要とされてはいません
- メモリ:16GB以上
- グラボ:最も重要な要素で、VRAMは8GB以上が必要
- ストレージ:個人の好みによりますが、500GB以上が望ましいです。
ここからは、それぞれのパーツの役割とその最低限必要なスペック、そして推奨されるスペックについて説明していきます。
まずはCPUです。
Stable Diffusionで必要なCPU
CPUはパソコンの一番中心的な部品で、各種の制御や計算処理を行いますが、画像処理という目的においてはあまり重要ではない部品です。
なぜなら、AIイラストの自動生成を行うStable Diffusionにおいては、画像の処理作業は大部分がグラボが担当しているからです。
だからこそ、CPUの性能にはそこまでこだわる必要はなく、グラボの性能が良ければ良いほどStable Diffusionの動作がスムーズになるのです。
CPUの選択に際しては、Intel社製の「Core i」シリーズか、AMD社製の「Ryzen」シリーズが選択肢となるでしょう。
どちらかといえば、同じ価格帯であればどちらでも機能面で大差はありません。
ただし、低性能で知られている「Atom」、「Celeron」、「Pentium」などは避けるべきです。
少しRyzenの方がビデオカードの容量も多くてお得感を感じますが 多用途で考慮すると「Core i」シリーズが最も理想です。
ツールやソフトによっては、「Ryzen」ではイマイチと言うケースもあります。
一先ず関係ないですが最新のモデルが推薦です。
Stable Diffusionに求められるCPUの種類と推薦CPU
Stable Diffusionとは、CPUの性能がそれほど必須ではないプログラムです。
しかし、それはあくまでCPUの性能が低過ぎない場合に限った話で、低すぎるパフォーマンスのCPUだと、Stable Diffusionの操作に支障が生じる可能性があります。
また、現実的には、Stable Diffusionだけのためにパソコンを購入するという方は少ないと考えられます。
そのため、他の用途でパソコンを使用する際もCPUの性能が低すぎると問題となるでしょう。
さらに、CPUの性能が極めて低い一方で、高性能なグラフィックボードを搭載したパソコンというのは、ほとんど存在しませんから、特に自作パソコンを計画している方は、この点をよく考えてコンポーネントを選ぶ必要があります。
CPUの具体的な選択肢についてみていきましょう。
CPUの選択肢
CPUの中でも、以下の一覧がStable Diffusionにおいてパフォーマンスが問題となる可能性のあるものになります。
- Atom: 非推薦
- Celeron: 非推薦
- Pentium: 非推薦
- Core i3 - Ryzen3:許容範囲内
- Core i5以上 理想的
- Ryzen5以上:理想的
このような感じです。
次にメモリの要件について述べます。
Stable Diffusionメモリについて
Stable Diffusionを快適に使用するためには、メモリ容量は16GB以上が推奨されています。
公式サイトからの情報によりますと、プログラムをスムーズに実行するためには、直接アクセス可能な16GBのRAMが必要となります。
しかし、8GBのメモリしか持っていない場合でも、8GBのページファイルやスワップファイルを作成することで、ある程度対処が可能です。
(なお、ГPUのVRAM容量がRAMよりも大きい場合に限ります) 8GBのメモリでもStable Diffusionの動作自体は可能ですが、快適な操作を期待するのは難しいと言えます。
メモリが不足してくると、イラストを生成する際にエラーが発生する可能性があります。
生成する画像の大きさや解像度を高く設定すると、エラーが発生する確率は更に上がります。
また、生成されたイラストが完了するまでに、相当な時間が必要とされます。
特に、特定のキャラクターの画像を学び、そのキャラクターにポーズをとらせて画像を生成する「Lora学習」など、Stable Diffusionでも特に高負荷となる作業を行いたい場合は、32GB以上のメモリを搭載していることが望ましいです。
Stable DiffusionでLora学習のような高度な学習機能を使用する際には、32GBのメモリ容量が必要となる事もあり、快適な作業環境を保つ事ができます。
次に、グラフィックボード(グラボ)の話に移りたいと思います。
Stable Diffusionには、グラフィックモードが超重要
グラボとは、パソコンの画像表示を担う部品で、特にAIイラスト自動生成などの高負荷な作業を行う際に、その性能が試されます。
具体的には、Stable Diffusion社の製品などが該当しますが、ここではグラボの性能やその選び方について深く掘り下げてみたいと思います。
グラボの中心的な役割を果たすのは、グラフィック処理を専門的に行うGPUとVRAMというメモリで、常に高いパフォーマンスを発揮しております。
また、その効率的な動作を支えるためには、冷却用のファンや基盤という部品が必要不可欠となります。
市場に出回っているグラボのメーカーとしては、主にNVIDIA社とAMD社が挙げられますが、両者の中ではNVIDIA社の製品が圧倒的にパフォーマンスが良いとされています。
AMD社の製品は、その性能がNVIDIA社の製品に比べて大きく劣るため、その使用には注意が必要となります。
この差は、Stable Diffusion社の製品がNVIDIA社のグラボを前提に開発されているため、その最適化が進んでいるからです。
しかし、時間と共にAMD社の製品について最適化が進めば、それ自体の性能も向上し、選択肢の一つとなる可能性もあります。
その可能性を大いに期待して、これからもパソコンスペックについて各要素を深く検証していきたいと思います。
NVIDIA社のGeForceシリーズの優れた性能とは
GPUは、グラフィックカードとも呼ばれ、その性能によっては、AIイラストの生成やゲーム、映像編集などの画質やパフォーマンスに大きな影響を及ぼします。
その中でもNVIDIA社のGeForceシリーズは、その性能や安定性から多くのユーザーから評価されています。
GPUの性能を示すデータの一つに「GPU性能値」というものがありましてね、これは、数字が大きいほど、生成速度が速く、また画質も高く出力することが可能となります。
参考までにこちらです。
https://www.dospara.co.jp/5shopping/shp_vga_def_parts.html
例えば、先程挙げた「GeForce RTX 3060」の「3060」の数字は「30(世代)60(性能)」を表わしていて、世代・性能ともに数字が大きいほど高性能であることを示しております。
次に、考えられるデータとして「VRAM(ビデオメモリ)容量」があります。
これはグラフィックボードが使用する専用のメモリで、大きければ大きいほど高画質・大サイズなAIイラストを生成することが可能です。
また、PCゲームや動画編集などでは、このVRAMが大きく消費されるため、これらの用途を主とするユーザーの方は、VRAMの容量が大きいものを選択すると良いでしょう。
なお、VRAM容量が大きいにも関わらず、GPU性能値が極端に低いグラボというのは存在しておらず、安心して選ぶことが出来ます。
以上のように、NVIDIA社のGeForceのGPUは、その高い性能と安定性から多くのユーザーに推奨されており、各々の利用シーンに合わせて選ぶことで、よりパフォーマンスを活かした利用が可能となります。
これらを踏まえた上で、各自の利用目的に応じたGPUを選択していただければと思います。
AIイラスト生成に求められるグラフィックボードの性能と選択基準
AIイラストを生成するためには、一般的に言って高い性能のグラフィックボードが必要とされます。
ですが、一方でそれぞれのグラフィックボードの性能を示す指標であるGPU性能は、AIイラストの生成速度に大きく影響します。
すなわち、高いGPU性能を持つほど、AIイラストの生成速度が早いということになります。
しかし、グラフィックボードの選択基準としては、上記のGPU性能よりもむしろVRAM容量を重視する傾向があります。
現在最も優れているグラボはこちらです↓
VRAMとは?
VRAMとは、グラフィックボードのバージョンによって異なるメモリのことを指し、その容量が少ないとメモリ不足エラーが生じ、結果的にAIイラストの生成自体が難しくなる可能性があるからです。
先ほど紹介した、
この場合なら VRAM容量 は24GBです。
具体的には、公式ウェブサイトによれば、VRAMの容量が4GB以下のビデオカードでの実行はメモリ不足エラーが発生しやすいとされています。
この問題は、一部の最適化を有効にすることで対処できますが、その結果としてVRAMの使用量を減らすことはできますが、代わりに速度を犠牲にする必要があります。
逆に言えば、GPUの性能が低くても、時間をかければ高画質で大きなAIイラストは生成できるのですが、VRAMのメモリが少なければ、そもそもAIイラストの生成自体ができないというわけです。
そのため、VRAMの容量が少ない状態での実行は、エラー発生のリスクがあると共に、イラストの大きさや解像度を上げるとエラーがより頻繁に発生しやすくなるため、一般的には最低でも8GB以上のVRAM容量が求められます。
更に、日常的にAIイラストの自動生成を行いたいのであれば、12GB以上の容量を持つVRAMを搭載したグラフィックボードを選ぶことがお勧めされています。
各種グラフィックボードの性能と容量、そしてお勧めのVRAM容量について
それでは、VRAM容量について具体的な例を紹介します。
- 4GBのものについては、「使用が困難」
- 6GBのものは「厳しい」
- 8GBのVRAM容量をならとりあえず基準を満たせていると言えます。
- 12GBのものであれば、「多少時間が必要ですが、高画質な作業やポーズの指定なども可能」です。
- 16GB以上のVRAM容量を持つものについては、「複雑で大量のデータを扱う作業も短時間で可能」となります。
次に、Stable Diffusionの生成目安という視点から見てみましょう。
グラフィックボードの性能により、Stable Diffusionで生成できるAIイラストの画質や大きさ、生成速度は大きく変わります。
NVIDIA社のGeForceを例に挙げると、GeForce RTX 3060の場合、512×512(一辺が約14cm)のAIイラスト作成には4~5秒程度を要し、その画質は非常に綺麗です。
RTXとは、リアルタイムレイトレーシングを指し、これは現実に近いCGを作成するということを意味します。
なお、「GeForce RTX 4000」シリーズは最新世代であり、効率性に優れています。
グラボの見分け方
グラボの種類は豊富なのですが、型番が色々あって分からない人も多い筈です。
実はこのグラボの型番はルールに沿った番号となっています。
RTX4090の場合、最初の2桁が世代数 であり 最後の2桁が性能です。
つまりRTX4090の場合は 40世代で性能は90と言う事になります。
いずれにしてもStable Diffusionでは GPUの性能が高くVRAMが大きい程が有利に使えると思ってください。
たとえば512×512の画像の場合ならRTX4090のグラボで1秒ぐらいで生成します。
RTXの3060の場合だと6秒ちょっとかかります。
40世代で性能は90⇒1秒
30世代で60の場合=6秒ちょっと。
このようなイメージです。
ただこれは、Stable Diffusion の前バージョンで現在の最新のSDXLだと少し話が変わります。
Stable Diffusion XL(SDXL)だと話は変わる。
Stable DiffusionXLの場合は、画像サイズがデフォルトで最少1024×1024になっています。
つまり画像生成にそれなりに時間を要する形になっています。
RTX 4090(VRAM24GB) 5秒 40世代で性能は90 =5秒ほど。
RTXの3060の場合 45秒 30世代で60の場合=45秒ほど。
こうなってくると少しグラボの性能が必要になる事が分かりますね^^
Stable Diffusionのストレージはどのぐらい必要?
ストレージはデータを保存する領域です。
Stable Diffusionのインストール先は絶対にSSDにするべき。
HDDは容量当たりの値段が安いですがSSDと比較すると処理速度が遅いです。
SSDはHDDに比べると値段が高いですが処理速度が速いです。
HDDよりも、SSDを導入しましょう。外付けのハードディスクでも構いません。
ちなみに、
Stable Diffusion本体が6GBほどで、モデルファイルは1つ30GB~5GBほど。
OSのWindowsもしくはMacで30GBほど使用するので、Stable Diffusionのみの使用でも40GBほどを環境のみで使用します。
これがStable Diffusionに適したパソコン環境です。
パソコンを買う場合には、とくにグラボの性能の確認をしておきましょう。
- ストレージはSSDにする
- SSDの容量は、Stable Diffusionだけでも40GBは必要
- グラボは性能の良いものを選ぶ 個人的にはRTX4070ぐらいが理想です。
- メモリはi7のものとかで大丈夫。
このような感じですが 是非チャレンジしてみて下さい。
Stable Diffusionは無料ですが、ある程度のパソコンスペックが求められるので できるだけ性能の良いパソコンで取り組む事が推薦です。
参考になりましたか?
実は最近では、音楽生成AIも人気を浴びています。
画像生成AIでも様々な副業が可能ですが音楽生成AIも稼げますよ。