オープンソース動画 AI 入門 — Sulphur 2・LTX-2.3・10Eros の使い分けと法的リスク
朝比奈幸太郎リリース:音のアプリ使い放題プラットフォーム『空音開発』
前回の記事では、無検閲オープンソース動画生成 AI「Sulphur 2」を題材に、ローカル PC で動かせない重い AI モデルを GPU レンタルで動かす方法を紹介しました。
執筆後、複数の読者から「結局どのモデルを選べばいいの?」「無料って書いてあるけど、本当に商用で使って大丈夫?」というご質問をいただきました。
今回はその問いに正面から答える続編として、現在オープンソース界隈で話題の動画生成 AI 3 モデル — Sulphur 2 / LTX-2.3 (公式) / LTX2.3-10Eros — の使い分け、法的リスク、コスト試算を整理します。
特に 個人の趣味利用と商用利用で何が変わるのか、Cloudflare や Stripe を使うビジネスでは何に気をつけるべきか を実務的に解説します。
前回記事と合わせて読むと、オープンソース動画 AI の全体像が掴めるはずです。
なぜ「モデル選び」が重要なのか
動画生成 AI は ChatGPT のような単一サービスと違い、用途・ライセンス・検閲レベルが異なる複数のモデルが並存しています。
間違ったモデルを選ぶと、以下のような問題が起きます。
1 つ目は法的トラブル。
NSFW 特化モデルで作った動画を商用サービスにアップロードしたら、決済プロバイダのアカウントが凍結された、というケースが実際に報告されています。
2 つ目は機能の過不足。
本格 CM 用に 4K で出したいのに、軽量モデルしか使えず低解像度になった、逆に SNS リール用なのに重いモデルを使ってコストが膨らんだ、等。
3 つ目はブランド毀損。
「無料だから」と無検閲モデルを使い、生成物の一部がブランドイメージを損なうという事例。
これらを避けるには、各モデルの特性を理解した上で自分の用途に最適なものを選ぶことが不可欠です。
3 モデルの基本情報
Sulphur 2
配布元: vantagewithai (Hugging Face で活動する個人/小規模団体)。
ベース: Lightricks の LTX 2.3 を約 9 億パラメータでファインチューニング。
特徴: 無検閲、軽量 (VRAM 8〜12GB で動作)、10 秒・24fps の動画生成。
検閲レベル: 安全層が外されている。
立ち位置としては「軽量で扱いやすい無検閲版」。
話題性が高く、SNS で「すごい」と拡散されているのはこのモデル。
一方、配布元の素性が完全には明らかでなく、長期メンテナンスの保証もない。
LTX-2.3 (Lightricks 公式)
今回筆者が採用するのがこちらです。
配布元: Lightricks (イスラエル発の上場 AI 企業、Facetune・Videoleap で著名)。
規模: 22B (220 億) パラメータの DiT (Diffusion Transformer) ベース。
ライセンス: Apache 2.0 (一部条件付きの可能性、後述)。
特徴: 4K・50FPS 対応、動画と音声の同期生成、Distilled 版で軽量化も可能。
検閲レベル: 適度な安全層が組み込まれた標準的な状態。
立ち位置は「プロ向けの本格モデル」。
商用利用を前提に設計されており、ライセンスがクリーンで、企業による長期メンテナンスが期待できる。
SNS でのバズり度は Sulphur 2 より地味だが、実務で使うなら間違いなくこれ。
LTX2.3-10Eros
配布元: vantagewithai (Sulphur 2 と同じ)。
ベース: LTX-2.3 (22B) を GGUF で量子化し、NSFW 用途にファインチューニング。
特徴: 名前の “Eros” が示す通り、アダルト・NSFW コンテンツ生成に特化。
検閲レベル: 完全に NSFW 用途向け。
立ち位置は「特定用途特化の派生モデル」。
技術的には興味深い存在だが、筆者のような一般向けビジネスでは絶対に使ってはならないカテゴリのモデルです。
本記事では「比較対象として紹介はするが、推奨はしない」スタンスで扱います。
ライセンス徹底比較 — ここが最重要
Apache 2.0 (LTX-2.3 公式) とは
Apache 2.0 はオープンソース界で最も自由度が高いライセンスの 1 つで、以下が許諾されています。
商用利用が完全に合法、改変と再配布が自由、特許権の明示的許諾を含むため後から特許訴訟されるリスクがない、義務は実質的に「Lightricks のクレジット表記」と「ライセンス本文の同梱」程度。
Stable Diffusion などで使われる OpenRAIL-M ライセンス (用途制限が細かく付く) と比べても、Apache 2.0 は圧倒的にビジネスフレンドリーです。
LTX-2.3 ライセンスの注意点
ただし完全な「素の Apache 2.0」ではなく、追加条項がある可能性があります。
LTX-2 系列の過去のライセンスを見ると、年間売上が一定額 (例: 1,000 万ドル) を超える大企業は別途商用契約が必要、という条項が付くケースがありました。
ほとんどの個人・中小企業にとっては実質無制限ですが、年商15億を超えそうな場合は、利用前に Hugging Face の Lightricks/LTX-2.3 ページの LICENSE ファイルを必ず一読してください。
Sulphur 2 と 10Eros のライセンス
両モデルともベースモデルである LTX-2.3 のライセンスを継承する形になっています。
つまり技術的には Apache 2.0 系統だが、(1) ファインチューニングの内容が公式と無関係、(2) 配布元の素性が完全に確認できない、(3) 生成物の責任所在が曖昧、という追加リスクが乗ります。
特に Sulphur 2 と 10Eros は「無検閲化」「NSFW 特化」というファインチューニング行為自体が、元の Lightricks の意図と乖離している可能性があり、将来 Lightricks が「これは LTX-2.3 のライセンス範囲外」と表明する余地が法的にゼロではない。
派生モデルは常に元モデルより法的リスクが高い、と覚えておくべきです。
検閲レベル別の法的リスク
ここからが本記事の核心です。
3 モデルの検閲レベルと、それに伴う法的リスクを整理します。
LTX-2.3 公式 — リスク最小
適度な安全層が組み込まれており、児童ポルノ・実在人物のディープフェイク・極端な暴力描写などは構造的に出力されにくい設計です。
商用利用において最も安全な選択肢。
万が一不適切な出力が出た場合でも、「公式の安全層を回避しようとしていない」という事実が、法的トラブル時の防御材料になります。
ただし商用利用といっても、GPU代や、決済の手数料、また、24時間GPU稼働することのコストを考えると慎重に組まなければいけません。
Sulphur 2 — グレーゾーン
無検閲化されているため、ユーザーのプロンプト次第で問題のある映像が生成可能。
個人の自己責任での利用は可能だが、商用サービスへの組み込みは推奨されない。
特に注意すべきは「意図せず問題のある出力が混入するリスク」。
風景を生成しているつもりが、人物が映り込み、その人物が問題のある描写になる、というケースが起こり得ます。
10Eros — 高リスク
NSFW 用途に特化してファインチューニングされているため、モデル自体が問題のあるコンテンツを生成する方向に最適化されています。
健全な出力を意図しても、訓練データの偏りで意図せず際どい映像が混入する可能性が高い。
商用利用は絶対に避けるべきカテゴリです。
個人利用であっても、後述する Cloudflare・Stripe・AWS 等のクラウドサービスの利用規約に抵触するため、保存・配信インフラの選択肢が極端に狭まる。
商用利用で絶対に注意すべき 4 つの規約
オープンソース動画 AI をビジネスで使う場合、モデルのライセンスだけでなく、利用するインフラサービスの規約も確認が必要です。
これを見落とすと、ある日突然サービスが止まる、という事態が起きます。
Stripe の利用規約
Stripe は「アダルトコンテンツに関連する事業」を禁止カテゴリとして明示しています。
AI 生成のアダルト動画を販売・配信する事業はもちろん、自社サービス内で AI 生成 NSFW コンテンツを扱っていること自体が違反になる可能性があります。
違反が判明すると、警告なしにアカウントが凍結され、未払い金が保留される事例が報告されています。
Stripe で決済している全事業が同時に停止する、という事業全体のリスクとなります。
決済サービスに関しては、アダルトの他に、宗教やスピリチュアル関係の団体の決済も禁止していることがありますので、規約をしっかり確認しなければいけません。
いぜんスピリチュアル関係の団体が、決済サービス突然停止したというのを聞いたことがあります。
Cloudflare の AUP (Acceptable Use Policy)
Cloudflare の AUP は「成人向けコンテンツ」を厳しく制限しています。
R2 ストレージに NSFW コンテンツを保存していることが発覚すると、アカウント全体が停止されます。
特に注意すべきは「R2 バケットを分けても全アカウント停止」というポリシー設計です。
「マイク販売用のバケットは安全だが、別バケットに NSFW がある」という状況でも、全バケットへのアクセスが止まる可能性があります。
AWS / Google Cloud の規約
両社とも生成 AI 関連のコンテンツポリシーを強化しており、特に Google Cloud は 2025 年以降、AI 生成 NSFW コンテンツへの審査を厳格化しています。
Vertex AI などのマネージドサービスで NSFW モデルを動かすこと自体が禁止されている領域もあります。
Hugging Face / Replicate の規約
ホスティング元の Hugging Face と、API サービスの Replicate もコンテンツポリシーを持っています。Replicate 経由で NSFW モデルを呼び出す行為は規約違反に該当することがあり、API キーが停止される事例があります。
実務的な結論
これらを総合すると、現代の主要クラウドサービスは NSFW 系生成 AI と相容れない、と理解しておくべきです。
10Eros のような NSFW 特化モデルを商用で使おうとすると、保存・配信・決済のあらゆる主要インフラが選択肢から外れることになり、事実上ビジネスとして成立しません。
「無料だから」「面白そうだから」と気軽に手を出すモデルではない、ということです。
モデル比較表 (実務観点)
| 項目 | LTX-2.3 公式 | Sulphur 2 | 10Eros |
|---|---|---|---|
| ライセンス明確性 | ◎ Apache 2.0 | △ 派生で曖昧 | △ 派生で曖昧 |
| 商用利用適性 | ◎ 完全合法 | △ 用途限定でグレー | × ほぼ不可 |
| ブランドリスク | ◎ ほぼなし | △ あり | × 致命的 |
| パラメータ規模 | 22B (フル) | 約 9 億 | 22B 量子化 |
| 推奨 VRAM | 24〜40GB | 8〜12GB | 16〜24GB |
| 解像度上限 | 4K | 標準 | 標準 |
| FPS 上限 | 50 | 24 | 24 |
| 音声同期生成 | ◎ 可能 | × 不可 | × 不可 |
| 配布元の信頼性 | ◎ 上場企業 | △ 個人 | △ 個人 |
| 長期メンテ期待 | ◎ 高 | △ 不透明 | △ 不透明 |
| SNS の話題性 | ○ 中程度 | ◎ 高い | △ 限定的 |
| 総合推奨度 | ★★★★★ | ★★☆☆☆ | ☆☆☆☆☆ |
用途別の推奨モデル
個人の学習・実験
Sulphur 2 か LTX-2.3 Distilled、どちらでも OK。
趣味で技術を学ぶフェーズなら、SNS で話題の Sulphur 2 を触ってみるのも経験として有益。
ただしローカル PC や自分専用の RunPod で完結させ、外部公開はしないこと。
SNS 用の短尺動画 (Reels/TikTok)
LTX-2.3 Distilled (GGUF 量子化版) 一択。商用利用が完全合法で、音声同期生成が SNS コンテンツに極めて有利。
RTX 4090 で動作し、1 本あたり数十円で量産可能。
本格 CM・PV 制作
LTX-2.3 フル版。
4K・50FPS の高品質出力が必要な場合、Distilled では物足りない。
RunPod の A100 40GB ($1.19/h) または A6000 48GB ($0.49/h) で動かす。
コスト試算 — モデル別の現実的予算感
前回記事で Sulphur 2 のコストを試算しましたが、3 モデルの現実的な月コストを比較します。
前提は「SNS 用 25 秒動画を月 30 本制作」、GPU は RunPod、慣れた後の運用ベース。
Sulphur 2 (RTX 4090・$0.34/h)
軽量モデルで生成が速い (1 本 5 分)。3 クリップ × 3 ガチャ × 5 分 = 45 分/本。月 30 本で約 1,500 円。
LTX-2.3 Distilled GGUF (RTX 4090・$0.34/h)
22B 量子化版で Sulphur 2 より少し重い (1 本 6〜7 分)。3 クリップ × 3 ガチャ × 6 分 = 54 分/本。月 30 本で約 1,800 円。Sulphur 2 比で +300 円。
LTX-2.3 フル版 (A100 40GB・$1.19/h)
フル版は重いが、4K 50FPS と音声同期の品質が圧倒的。3 クリップ × 3 ガチャ × 4 分 = 36 分/本 (A100 は高速)。月 30 本で約 4,300 円。
Sulphur 2 と LTX-2.3 Distilled の差は月 300 円程度しかありません。
にもかかわらず、商用利用適性・ブランド安全性・将来の拡張性で圧倒的に LTX-2.3 が優位です。
「月 300 円ケチって法的リスクを抱える」という選択は、ビジネスとしては合理的ではない、というのが結論。
商用 SaaS との比較
参考に、同等の月 30 本を商用サービスで作る場合のコストを並べます。
| サービス | 月 30 本コスト |
|---|---|
| Runway Gen-3 Standard | 約 14,000 円 |
| Kling AI Pro | 約 10,500 円 |
| LTX-2.3 Distilled + RunPod | 約 1,800 円 |
| Sulphur 2 + RunPod | 約 1,500 円 (※非推奨) |
商用 SaaS の 約 1/6〜1/8 のコストで運用でき、圧倒的な差を実感できます。
隠れコストと初期投資
前回記事でも触れましたが、再掲します。
初回セットアップ: RunPod 登録、Network Volume 作成、ComfyUI 起動、モデルダウンロード、最初のワークフロー構築に2〜4 時間。
慣れていない場合の試行錯誤 GPU 課金で 約 300〜500 円 が初回限定で乗ります。
Network Volume: 50GB 永続ストレージで月 525 円。
これにモデルを保存すれば 2 回目以降のダウンロード時間がゼロになる。
学習時間: コードや設定ファイルの理解、プロンプト作成のコツ、編集ソフトの使い方など、金額換算しない投資が初月 10〜20 時間は必要。
ただし 2 ヶ月目以降は固定の運用コストに収束します。
まとめ
オープンソース動画生成 AI は、商用 SaaS の 1/6〜1/8 のコストで高品質な動画を量産できる革命的な技術です。
ただし、モデル選びを間違えると、コスト削減のメリットを遥かに上回るリスクを負うことになります。
3 モデルを総括すると以下になります。
LTX-2.3 公式 は Apache 2.0 ライセンスで商用利用が完全合法、4K 50FPS と音声同期という他にない強みを持ち、配布元が上場企業で長期メンテナンスが期待できる、実務での第一選択肢。
Sulphur 2 は SNS で話題性が高く、軽量で扱いやすいが、派生モデル特有のライセンスの曖昧さと無検閲ゆえのブランドリスクがあり、個人の学習用途に限定すべき。
10Eros は NSFW 特化モデルで、技術的興味の対象としては理解できるが、主要クラウドサービスの規約と全面的に衝突するため、商用利用は事実上不可能。
「無料だから」「話題だから」で選ぶのではなく、自分の用途と将来の事業展開を見据えて、ライセンスがクリーンな公式モデルを選ぶ。これがオープンソース動画 AI を実務で使うための鉄則です。
前回記事で紹介した GPU レンタル (RunPod) の選択肢と組み合わせれば、月 2,000 円程度で SNS 動画制作の完全内製体制が構築できます。
M1 MacBook Air などの古いPCを使っているユーザーでも、本格的な動画 AI 運用は十分に可能な時代になりました。