Genspark音楽生成の教科書｜おすすめモデル比較とジャンル別プロンプト例

Contents

Gensparkで音楽を生成する方法：モデル別の使い分けから実践プロンプトまで
Gensparkで音楽を生成する基本手順（最短ルート）
Gensparkで使える音楽生成AIモデル一覧（画像内のモデル）
ジャンル別：どのモデルを選ぶと最適か（実務の使い分け）
すぐ使える：モデル別プロンプトテンプレ（超実践）
具体的な使用例（すぐ役に立つ）
CTA：まずはGensparkで「複数モデル比較」を一度やってみてください
- 同じ条件で3モデル試すだけで、“当たりモデル”が見つかります
CTA：Speakly（ボイススピーキー）で“音声→企画→制作”の速度を上げる（30日無料）
- 音楽プロンプト作りは、実は「話した方が速い」ことが多いです

Genspark 音楽生成AI｜複数モデルを試して“最短で理想の1曲”へ

Gensparkで音楽を生成する方法：モデル別の使い分けから実践プロンプトまで

「BGMが欲しい」「歌入りのデモ曲をすぐ作りたい」「効果音まで揃えたい」——目的によって最適な音楽生成AIは変わります。 Gensparkなら、複数の音楽/音声系モデルを同じ導線で試せるので、制作の速度が一気に上がります。

この記事の結論：
①まずは目的（歌あり/インスト/長尺BGM/効果音）を決める → ②モデルを選ぶ → ③プロンプトをテンプレに沿って書く → ④3本出して比較 → ⑤必要ならステム分離や再生成で詰める。

注意（大事）：
生成音源の利用条件（商用可否、権利、クレジット表記、禁止事項）はサービスやモデルで変わり得ます。公開・販売・配信に使う場合は、必ずGenspark側の最新の利用条件を確認してください（本記事は法律助言ではありません）。

Gensparkで音楽を生成する基本手順（最短ルート）

音楽生成（Music）のモデル一覧から、目的に合うモデルを選択
尺（duration）と構成（intro/verse/chorus/bridge/outro）を決める
ジャンル＋ムード＋テンポ(BPM)＋楽器＋参照曲のニュアンスを1つの文章にまとめる
まず3パターン生成（A/B/C）。良い要素だけ残して再生成
必要ならステム分離・ループ最適化・音量/空間系を調整して完成

時短のコツ：最初から完璧を狙わず、A/B/Cで「ドラムはA」「コード感はB」「メロの方向性はC」を選び、次の生成で合体させると早いです。

Gensparkで使える音楽生成AIモデル一覧（画像内のモデル）

下記は、提示いただいた画面に表示されているモデル群です（名称・仕様はアップデートで変わる可能性があります）。色は「一般的な傾向としての能力/コスト感」の目安：赤=高／青=中／緑=低（高速・軽量）。

高：難度高め・仕上げ向き中：バランス型・普段使い低：高速・量産向き

目安	モデル	できること	向く用途	注意点
中	ElevenLabs Music 長尺インスト	最大1時間のインストゥルメンタル音楽（ジャンル幅広め）	配信用BGM、作業用、長尺ループ素材	歌詞・カスタム歌詞は非対応
高	MiniMax Music v2 歌あり構成タグ	歌詞＋ボーカル付き楽曲。`[Verse]` `[Chorus]` `[Bridge]`等のマーカー対応	歌入りデモ、SNS用短尺ソング、CM風	歌詞の書き方で品質が大きく変わる
高	Mureka Song 歌あり最大3分ステム	最大3分のボーカル付きフル楽曲。歌詞生成、ステム分離に対応	完成形に近い歌もの、ミックス前提の制作	尺・構成を先に決めないと迷子になりやすい
中	Lyria2 Music Generator インスト効果音寄りにも	インスト音楽＆効果音用途の生成（Google Lyria 2）。歌詞は非対応	映像BGM、抽象アンビ、雰囲気作り	ボーカル要素を避ける指示が有効
低	ElevenLabs Sound Effects SFX環境音	プロ向け効果音・環境音・オーディオテクスチャ	SE、ルームトーン、UI音、動画の音作り	音の距離/素材/反響の指定が重要
低	CassetteAI 長尺BGM	長時間のバックグラウンドミュージック（様々なスタイル）	配信、店舗BGM、作業用プレイリスト	主旋律より“空気感”の指定が効く
中	Mureka Instrumental インスト最大3分参照ベース	最大3分のインスト。スタイルプロンプト＋リファレンスベース。ボーカルなし	ジングル、短尺BGM、映像の尺合わせ	ループ前提なら“終止感”の制御が必要

まず迷ったら：
歌あり→ Mureka Song / MiniMax Music v2 ／インスト短尺→ Mureka Instrumental ／長尺BGM→ ElevenLabs Music / CassetteAI ／ SE→ ElevenLabs Sound Effects

ジャンル別：どのモデルを選ぶと最適か（実務の使い分け）

1) YouTube・配信・店舗：長時間BGM（主張しすぎない）

最適：ElevenLabs Music / CassetteAI
狙い：“聴かせる”より“邪魔しない”。反復に耐えるコード進行・控えめなリード
プロンプトの鍵：「ループ感」「密度低め」「リード控えめ」「中低域を厚く」

2) 映像BGM：短尺・尺合わせ・展開が欲しい

最適：Mureka Instrumental（最大3分の尺で作りやすい） / Lyria2（雰囲気特化）
狙い：0:00〜0:15導入 → 0:15〜盛り上げ → 0:45以降で引き算、など編集しやすい段差
プロンプトの鍵：「秒単位の展開指定」「最後はフェード用に余白」「打楽器の入りを後ろに」

3) 歌入りデモ：SNS/CM/企画のたたき台

最適：MiniMax Music v2（構成マーカーで制御） / Mureka Song（ステム分離で後工程が強い）
狙い：歌詞の情報量を減らして“耳に残るフック”に寄せる
プロンプトの鍵：「サビの母音」「語尾の統一」「1行あたりの音節（短め）」

4) 効果音・環境音：映像の説得力を上げる

最適：ElevenLabs Sound Effects
狙い：距離感・素材感・反響で“映像の空間”を作る
プロンプトの鍵：「場所」「時間帯」「マイク距離」「反響」「一発音 or 連続」

すぐ使える：モデル別プロンプトテンプレ（超実践）

下のテンプレをコピペして、角括弧の中だけ埋めればOKです。最初は細かく書きすぎず、3本生成→良い要素を拾うのが最短です。

A) インストBGM（汎用テンプレ）

目的：［動画BGM/配信BGM/作業用］
尺：［30秒/60秒/2分/10分/1時間］
ジャンル：［lofi hip hop / ambient / cinematic / house / jazz］
ムード：［落ち着く/爽やか/緊張感/切ない/高揚］
テンポ：［BPM 72/90/120/140］
キー（任意）：［A minor / C major］
楽器：［rhodes, warm pad, soft drums, sub bass］
構成：［intro 0:00-0:10 → main 0:10-0:50 → variation 0:50-1:10 → outro 1:10-1:20］
ミックス：［リード控えめ、ボーカルなし、耳に刺さる高域なし、ループしやすい終わり方］
避けたい要素：［歌、掛け声、過度なシンバル、急な転調］

B) Mureka Instrumental（短尺・尺合わせ向け）

3分以内のインストを作ってください（ボーカルなし）。
ジャンル：［シネマティック/EDM/アコースティック/和風］
用途：［YouTubeオープニング/商品紹介/ゲーム配信の転換］
BPM：［128］
展開：［0:00-0:12 控えめ → 0:12-0:45 盛り上げ → 0:45-1:10 間を作る → 1:10-1:40 もう一段上げる → 1:40-2:00 フェード用に引き算］
音色：［tight kick, punchy bass, bright pluck, airy pad］
仕上がり：［ラウドすぎない、編集しやすい、終わりはフェード前提］

C) ElevenLabs Music / CassetteAI（長尺BGMのコツ）

長時間のバックグラウンドBGMを作成。
スタイル：［lofi / chillhop / ambient / cafe jazz］
特徴：［主張しすぎない、反復に耐える、メロディは控えめ、コードで雰囲気を作る］
テンポ：［BPM 80］
質感：［暖かい、ノイズ少なめ、耳に刺さらない高域］
避けたい：［ボーカル、派手なリード、急なブレイク］
ループ：［自然に繋がる感じ］

D) MiniMax Music v2（歌入り・構成マーカー活用）

ジャンル：［J-POP / city pop / pop punk / synthwave］
ボーカル：［女性/男性］、言語：［日本語］、ムード：［前向きで爽やか］
テンポ：［BPM 120］
テーマ：［新しい挑戦、朝、軽い不安と期待］

[Verse]
（短めの情景描写。1行は短く、言葉を詰め込みすぎない）

[Chorus]
（フック重視。語尾や母音を揃えて“歌いやすさ”を優先）

[Bridge]
（1回だけ視点を変える／言葉を削って余白を作る）

要望：メロディが覚えやすい／サビで一段上がる／過度な転調はしない

E) Mureka Song（歌あり＋ステム分離を活かす）

最大3分のボーカル曲を作ってください。
ジャンル：［modern pop］ ムード：［切なさ→解放］ BPM：［100］
構成：Intro → Verse → Pre-chorus → Chorus → Verse → Chorus → Outro
歌詞：日本語、比喩は少なめ、日常語で刺さるフレーズを1つ作る
ミックス：ボーカルは前、キックは重すぎない、サビで広がる

可能ならステム分離しやすいアレンジ（楽器の役割が明確）で。

F) ElevenLabs Sound Effects（SFX/環境音の勝ちパターン）

効果音を生成してください。
シーン：［深夜のオフィスでドアがゆっくり閉まる］
場所：［小さめの会議室］ 反響：［少しだけ］
距離：［マイクから1.5m］ 方向：［右奥から］
素材感：［重めの木製ドア＋金属ラッチ］
尺：［2秒］
避けたい：［過度なリバーブ、ホワイトノイズ、過剰な音圧］

品質を一段上げるチェック項目：
①目的に対して“主張しすぎないか” ②尺の中に編集点（間）があるか ③ボーカル/高域が刺さらないか ④ループやフェードで破綻しないか

具体的な使用例（すぐ役に立つ）

使用例1：YouTubeのトーク動画（10分）に“邪魔しないBGM”を作る

モデル：ElevenLabs Music または CassetteAI
狙い：中域を空ける（声の帯域を邪魔しない）／主旋律を薄く
手順：10分×3本→最も自然な1本を採用→必要なら数分ごとに差し替え

使用例2：15秒広告（商品紹介）に“上がるジングル”を作る

モデル：Mureka Instrumental
狙い：0:00〜0:03で掴む／0:12前後で“決め”／最後はフェードでも成立
手順：BPM固定→A/B/C→良いフレーズを残して再生成

使用例3：歌入りデモ曲（企画提出用）を最短で作る

モデル：MiniMax Music v2（構成管理）→必要ならMureka Song（ステム分離で後加工）
狙い：歌詞は“説明”より“フック”。サビの言葉を短く
手順：テーマ→サビ1行→Verseは情景→Bridgeは視点変更

使用例4：動画の“音が寂しい”を一発で解決（環境音＋SE）

モデル：ElevenLabs Sound Effects
狙い：場所の空気を作る（室内の反響、街の遠音、機械音など）
手順：環境音（長め）→必要な瞬間だけSE（短め）を重ねる

CTA：まずはGensparkで「複数モデル比較」を一度やってみてください

同じ条件で3モデル試すだけで、“当たりモデル”が見つかります

音楽生成は「モデル選択」と「プロンプトの型」で勝負が決まります。まずは同じ条件（ジャンル/BPM/尺/ムード）で、歌あり・インスト・長尺など別モデルを横並びにして、出音の傾向を掴むのが最短です。

※「使い放題」や「クレジット消費なし」等の条件はプランや時期で変わる可能性があります。登録画面・料金ページの最新表示をご確認ください。

Gensparkに登録して音楽生成を試す

CTA：Speakly（ボイススピーキー）で“音声→企画→制作”の速度を上げる（30日無料）

音楽プロンプト作りは、実は「話した方が速い」ことが多いです

「言葉が出てこない」「雰囲気を説明しづらい」時ほど、音声で要件を固めるのが強いです。 Speaklyで話しながらイメージを整理して、そのままGensparkの音楽生成プロンプトに落とし込むと、制作スピードが上がります。

体験コメント：
「Genspark Speakly を使ってみたら、とてもスムーズで、仕事の効率が2倍になりました！おすすめです！」

登録すると、お互いに無料メンバーシップがもらえるとのこと。まずは30日無料で試して、音声で仕事が進む感覚を掴んでみてください。

Speaklyを30日無料で試す（招待リンク）

免責：本記事は一般的な使い方の解説です。モデル仕様・料金・出力の利用条件は変更される可能性があります。公開/商用利用の前に、必ず公式の最新情報をご確認ください。