朝比奈幸太郎 プロフィール 空音開発 INSTAGRAM

AI動画生成を諦めない ― 「GPUをレンタルする」という選択肢

2026-05-19 | Python, WEB技術

朝比奈幸太郎リリース:音のアプリ使い放題プラットフォーム『空音開発』

先日、無検閲オープンソース動画生成AI「Sulphur 2」が公開されたというニュースを目にして、「あっ、触ってみたい」と思いました。
別に無検閲だからというわけではないですが、やはりAIの動向は追っておかないと時代に取り残される恐怖を感じませんか?しかも、無料で使えるんです、、、GPUコストはかかりますよ?今日はそんなお話です。

Sulphur 2 が無料である理由

Sulphur 2 は Hugging Face で公開されているオープンウェイトモデルで、vantagewithai/Sulphur-2-Base-Split リポジトリからモデルファイル (重みデータ) を誰でも無料でダウンロードできます。

ライセンスはベースモデルである Lightricks LTX 2.3 のライセンスを継承しており、商用利用を含めて広く許諾されています (利用前に最新ライセンス条文の確認は必須)。

つまり料金が発生する箇所は GPU レンタル代だけ で、モデルの利用料・API 料金・ライセンス料は一切かかりません。
これがオープンウェイトモデルの最大の利点で、Runway や Kling のような商用 SaaS との決定的な違いとなります。

ただし、Sulphur 2 のモデルファイルは量子化版でも数 GB、フル版だと 20 GB を超えます。
GPU インスタンスを起動した状態で Hugging Face からダウンロードすると、回線速度にもよりますが 5〜15 分かかります。

RTX 4090 を $0.34/h で借りていれば、ダウンロードだけで約 $0.03〜0.08 (約 5〜12 円) かかる計算になります。
RunPod や Vast.ai では「Network Volume (永続ストレージ)」に 1 度ダウンロードしておけば次回以降は不要ですが、ストレージ自体に月額数百円程度かかります。

また、ComfyUI のワークフロー構築、依存ライブラリのバージョン衝突解決、VRAM 不足エラーへの対応など、最初の 1 本を生成するまでに 2〜4 時間 GPU を起動しっぱなしになることが普通です。
これだけで $0.7〜1.4 (約 100〜200 円) は飛びます。
慣れれば次回以降は数分で起動できます。

プロンプトの微調整、シード値のガチャ、解像度や長さの試行で、満足する 1 本ができるまでに 5〜20 本生成することが普通。

「1 本 4 円」は理論値で、実用上は「満足する 1 本あたり 20〜80 円」が現実的な感覚値です。
それでも商用 SaaS の数百円〜千円より圧倒的に安いです。


さて、お値段の話を先にしておきました。

筆者の現在の手元のマシンはM1 MacBook Air(16GB / 1TB)。
もう2026年時点で6年選手。
メモリを16Gにしておいたおかげであと2年はなんとか使いたい。

音楽制作にclaudecode、簡単な動画編集にカラグレ、Pythonの軽いライブラリくらいの普段作業には特に不便は感じませんが、いざ動画生成AIを動かそうとすると、これが全く歯が立たないわけです。

Sulphur 2の推奨環境は「NVIDIA GPU、VRAM 12GB以上」。
Apple SiliconのユニファイドメモリではGPUクラスのモデルを載せ切れず、仮に動いたとしても10秒の動画生成に数十分かかる、というのが現実となります。

そこで出てくる選択肢が「GPUをレンタルする」というアプローチ。
これは恥ずかしながら筆者も最近まで知らなかった世界でした。
調べてみると驚くほど成熟したエコシステムが既に存在していたんです。
本記事では、初めてこの概念に触れる人向けに、GPUレンタルの仕組み、主要サービスのラインナップ、実際の使い方を整理していきます。

「GPUをレンタルする」とは何か?!

クラウド上のデータセンターに置かれた高性能GPU(NVIDIA RTX 4090、A100、H100など、1枚で数十万〜数百万円する代物)を、1時間単位、場合によっては1分単位で時間借りできる仕組みのことを指します。

借りたGPUにはインターネット経由でアクセスでき、ブラウザのターミナルやJupyter Notebook、SSHなどから自分の作業環境のように使えるというわけです。

仕組みとしては、サービス事業者がデータセンターに大量のGPUサーバーを並べ、それを仮想化技術(コンテナやVM)で細切れにしてユーザーに提供。

ユーザーは必要なときだけGPUに接続し、使い終わったらインスタンスを停止して課金を止める、という使い捨て感覚のモデルとなっています。

「電気・水道のように、必要なときだけ蛇口をひねる」というクラウドコンピューティングの本質を、GPUに適用したものと言えます。

なぜこれが成り立つかというと、AI研究やレンダリング、動画生成といった用途はGPUを「常時」ではなく「集中的に短時間」使うケースが多いからなんですね。

例えば、RTX 4090を50万円で買って自宅に置いておいても、稼働率が1日2時間程度なら極めて非効率であるといえます。
それなら1時間あたり数十円〜数百円で借りて、必要な時間だけ動かす方が圧倒的に合理的、というのがGPUレンタル市場が拡大している背景であり、この需要にマッチする人は結構多いんじゃないでしょうか?

主要サービスのラインナップ

GPUレンタルサービスは大きく「マネージド型(簡単だが少し割高)」と「マーケットプレイス型(安いが自己解決力が必要)」、そして「ノートブック型(学習用途に特化)」の3系統に分けて理解すると整理しやすいです。

Google Colab ― 入門に最適なノートブック型

おそらくGPUのレンタルを探している多くの人が最初に出会うサービスです。
Jupyter Notebookをブラウザで開き、その実行バックエンドとしてGoogleのGPUを使えるというもので、料金体系は以下のような構成になっています。

無料枠ではT4 GPU(VRAM 16GB)が一定時間使えますが、混雑時は割り当てられなかったり、長時間使うと切断されたりします。

Colab Pro(月額9.99ドル)に入ると、より優先的にGPUが割り当てられ、A100やL4といった高性能GPUにもアクセスでき、「コンピューティングユニット」が100単位付与されます。

さらに使いたい場合はPay As You Goで100ユニットを9.99ドルで追加購入できる、という仕組みになっています。

メリットはセットアップが圧倒的に楽ということ。

ブラウザを開けばすぐに環境が立ち上がり、!pip installコマンドでライブラリを入れて、その場でPythonコードを実行できます。

Hugging Faceのモデルページには「Open in Colab」のリンクが用意されていることも多く、ほぼワンクリックで試せます。

デメリットは、セッションが切れるとデータが消えること(Google Driveをマウントする工夫で回避可能)、長時間の動画生成バッチには向かないこと、そしてComfyUIのようなGUIアプリケーションを動かすには工夫が必要なこと。
「とりあえずAIモデルを動かしてみたい」という入門用途には最適、というのが筆者の感覚だ。

Colabはもともと機械学習のために作られた

これは重たい機械学習のライブラリを動かせるのでは?と思ったあなた!
筆者も思いましたよ。
Google Colabは2017年にGoogleが公開したサービスで、「ブラウザだけでTensorFlowやPyTorchを動かせる環境を無料で提供する」ことが当初からの目的でした。

Google自身がTensorFlowの開発元なので、TensorFlowを世の中に普及させるためのショーケース的な位置付けでもあったわけです。

実際、Colabの環境には最初からTensorFlow、PyTorch、Keras、scikit-learn、NumPy、Pandasといった主要な機械学習ライブラリがプリインストールされています。
!pip installで追加するのは、それ以外の特殊なライブラリ(diffusersの最新版、特定のモデル用ツールなど)だけ、というのが実情です。

つまり、ノートブックを新規作成して、いきなり次のようなコードを書いて実行できます。

Copyimport tensorflow as tf
print(tf.config.list_physical_devices('GPU'))
# → [PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')]

# その場でモデルを定義して学習を始められる
model = tf.keras.Sequential([...])
model.compile(...)
model.fit(x_train, y_train, epochs=10)

GPUが割り当てられていれば、TensorFlowは自動的にGPUを使って学習してくれます。

ここが大事なポイントで、「重たい」にも段階があります。

個人〜研究レベルの学習(数百万〜数千万パラメータのモデル、画像分類、自然言語処理のファインチューニングなど) であれば、Colabは余裕でこなせます。
MNIST分類のような入門的なタスクから、BERTやResNetのファインチューニング、Stable Diffusionで画像を1枚生成するといった用途まで、無料枠のT4 GPU(VRAM 16GB)で十分動きます。
実際、世界中の大学の機械学習講義で教材として使われていて、Kaggleのコンペでも多くの参加者がColabを使っています。

中規模のモデル(数十億パラメータ、たとえば7B〜13BのLLMの推論や、Stable Diffusion XLの学習、動画生成モデルの実行) になると、無料枠では厳しくなり、Colab ProでA100(VRAM 40GB)を借りる必要が出てきます。
Sulphur 2を動かすのもこのクラスです。

大規模学習(数百億〜数千億パラメータのモデルをゼロから事前学習する) となると、Colabでは現実的でなくなります。
複数GPUを長時間連続で使う必要があり、Colabは1セッション最大24時間(Pro+でも)という制約があるためです。
この領域ではLambda LabsやRunPod、AWSなどでマルチGPUインスタンスを長時間借りるのが定石です。

Colabの「重たい処理」での落とし穴

実際に重い処理を回すときに知っておくと良いことが3点あります。

まずは、セッションのタイムアウト
無料枠は最大12時間、Pro/Pro+でも最大24時間でセッションが切れます。
さらにブラウザを閉じて90分操作しないと「アイドル切断」されることがあります。
長時間学習を回すなら、こまめにチェックポイント(学習途中のモデル)をGoogle Driveに保存する習慣が必須です。

また、ストレージが揮発性であること。
セッションが切れると、/content配下のファイルは全部消えます。
データセットやモデルの重みは、Google Driveをマウントして永続化するか、毎回ダウンロードし直す前提でコードを書きます。

そして、コンピューティングユニットの消費速度
Colab Proの100ユニットは、T4なら約50時間使えますが、A100だと約13時間で枯渇します。
重いモデルを長時間回すと、思ったより早く追加課金が必要になる、というのは皆が一度は通る道です。

RunPod ― バランスの良い中堅マネージド型

近年急速にシェアを伸ばしているサービス。
Dockerコンテナベースで、用途別のテンプレート(PyTorch、ComfyUI、Stable Diffusion WebUIなど)が豊富に用意されており、数クリックでGPU付きの環境が立ち上がります。

料金は時間課金制で、執筆時点でRTX 4090が1時間あたり0.34ドル前後、A100 80GBが1.5〜2ドル前後、最新のH100やB200も借りられる。「Secure Cloud(信頼性の高いTier 3+データセンター)」と「Community Cloud(個人提供のGPU、安いが信頼性は劣る)」の2系統があり、後者だと同じスペックが半額近くで借りられる。

実際の使い方の流れは、アカウント登録 → クレジットチャージ(最低10ドル程度から) → 「Deploy」画面でGPUとテンプレートを選択 → 数十秒で起動 → ブラウザからJupyterLabやWeb UIにアクセス、という極めてシンプルなものだ。

特筆すべきはNetwork Storageという機能で、インスタンスを停止してもデータを残せる永続ストレージが提供されています。
これにより、毎回モデルをダウンロードし直す手間が省ける(Sulphur 2のような数GB〜数十GBのモデルファイルを扱う場合、これは重要)。

ComfyUIテンプレートを使えば、Sulphur 2のような動画生成モデルをローカルマシンと同じ感覚で動かせるわけです。

動画生成系の用途では、現状最もバランスが取れた選択肢だと感じています。

Vast.ai ― 最安値を狙えるマーケットプレイス型

Vast.aiは少し毛色が違うのですが、個人や企業が余っているGPUを貸し出し、借り手が入札のように借りる、いわばGPU版Airbnbのような仕組みになっています。

料金は出品者次第で大きく変動し、RTX 4090が1時間あたり0.3ドル前後、古いGPUなら0.04ドルから借りられるケースもあります。

Interruptible(中断可能、入札制でさらに安い)とOn-Demand(保証付き)の2モードがあり、用途で使い分ける仕組みです。

デメリットは、ホストごとに環境やネットワーク品質にばらつきがあること、トラブル時の対応が自己解決になりがちなこと。
SSHや基本的なLinux操作に慣れている人向きで、初学者がいきなり手を出すには少しハードルが高い点が挙げられます。
とはいえ「コストを徹底的に抑えたい」「長時間バッチを回したい」という用途では一番強い選択肢になりますね。

Lambda Labs ― AI研究者御用達のプロフェッショナル向け

ディープラーニング研究者の間で定評のあるサービス。
最新のNVIDIA GPU(H100、B200など)を比較的安価に提供しており、特に大規模学習用途で重宝されています。
A100 80GBが1.29ドル/時、H100で約2.5ドル/時前後と、同スペック帯では業界最安級。

ただし需要が高く「在庫切れ」になっていることも多いです。
動画生成1本のような小規模用途より、本格的にモデルを学習させるような中〜大規模用途に向いています。

Paperspace(DigitalOcean傘下) ― マネージドの王道

「Gradient」という名のノートブック環境を持ち、Colabに近い使い勝手で、より柔軟な構成が可能。
月額固定プラン(Pro: 8ドル/月、Growth: 39ドル/月)と従量課金が組み合わさっていて、軽い用途なら定額で済む点が魅力です。
チームでの利用やMLOpsまわりの機能が充実している。

このほか、Hugging Face自身が提供するInference Endpoints(モデルをAPI化してデプロイできる)や、Replicate(モデルをAPI経由で呼び出すサービス、自分でGPUを管理する必要がない)など、「GPUそのものではなく、その上で動くAIモデルをサービスとして借りる」タイプの選択肢もあります。
Sulphur 2のような特殊なモデルでも、Replicateに誰かが公開していれば、APIキー一つで叩けることもある。

実際に使い始める ― RunPodで動画生成環境を立ち上げる流れ

ここでは具体例として、Sulphur 2のような動画生成モデルを動かす想定で、RunPodを使った典型的な手順を示しておきましょう。

まずRunPodでアカウントを作り、クレジットカードで最低額(10ドル程度)をチャージ。
続いて「Deploy」画面に進み、GPUを選ぶ。Sulphur 2であればRTX 4090(VRAM 24GB)かA40(48GB)あたりが価格と性能のバランスが良いでしょう。
次にテンプレートを選択。

「ComfyUI」や「PyTorch 2.x」のテンプレートが用意されているので、ComfyUIテンプレートを選ぶと、すでに必要なツールが一通り入った環境が立ち上がります。

「Deploy On-Demand」ボタンを押すと、30秒〜1分でインスタンスが起動。
ブラウザの管理画面に「Connect」ボタンが出るので、そこからJupyterLabやComfyUIのWeb UIにアクセスできます。

あとはHugging FaceからSulphur 2のモデルファイルをダウンロード(huggingface-cli downloadコマンドなど)し、ComfyUIのモデルフォルダに配置すれば、ローカルで動かすのと同じ感覚で動画生成が始められます。

作業が終わったら忘れずに「Stop」または「Terminate」を実行。
これが最重要で、稼働させたままだと寝ている間に課金が積み上がってしまうわけです。

Network Storageを別途契約してモデルファイルを保存しておけば、次回起動時はモデルダウンロードをスキップでき、立ち上げから生成開始まで数分で済むようになります。

コスト感覚を掴むためのざっくり試算

例えば動画生成AIという使い方でいくと、10秒の動画を1本生成するのに5分かかるとして、RTX 4090を1時間借りれば12本生成できる計算になります。
1時間あたり0.34ドル(約50円)なら、1本あたり約4円で動画が生成できる計算になります。

商用の動画生成サービス(RunwayやKlingなど)が1本数百円する世界観であることを考えると、自前で動かす方が圧倒的に安いことがわかります。

ただし、これはあくまで「生成時間だけ」の試算で、実際にはモデルのダウンロード、ワークフローの調整、失敗作の作り直しといった時間も課金されるので、慣れないうちは「生成時間の3〜5倍」を見ておくのが安全ですね。

月10〜30ドル程度の予算感で、かなり遊べるはず、というのが感覚値。

おわりに

「自分のPCのスペックが足りないからAIで遊べない」と諦めるのは、もはや古い時代の発想になりつつあります。
月数千円〜1万円の範囲で、データセンター級のGPUを必要な時だけ借りられる時代に。
Apple SiliconのMacは普段使いには最高のマシンですが、AI実験用途では潔く「クラウドのGPUを借りる」と割り切り、Macは制御端末として使うのが現実解だと思います。

Sulphur 2のような無検閲モデルを扱う場合は、生成物の取り扱いに法的・倫理的な注意が必要なのは当然のことですが、技術的なハードルとしての「GPUがない問題」は、レンタルという選択肢で解消できるわけです。
まずはGoogle Colabの無料枠か、Colab Proに10ドル課金して触ってみる、というところから始めるのがおすすめです。