Contents
Gensparkで音楽を生成する方法:モデル別の使い分けから実践プロンプトまで
「BGMが欲しい」「歌入りのデモ曲をすぐ作りたい」「効果音まで揃えたい」——目的によって最適な音楽生成AIは変わります。 Gensparkなら、複数の音楽/音声系モデルを同じ導線で試せるので、制作の速度が一気に上がります。
この記事の結論:
①まずは目的(歌あり/インスト/長尺BGM/効果音)を決める → ②モデルを選ぶ → ③プロンプトをテンプレに沿って書く → ④3本出して比較 → ⑤必要ならステム分離や再生成で詰める。
注意(大事):
生成音源の利用条件(商用可否、権利、クレジット表記、禁止事項)はサービスやモデルで変わり得ます。公開・販売・配信に使う場合は、必ずGenspark側の最新の利用条件を確認してください(本記事は法律助言ではありません)。
Gensparkで音楽を生成する基本手順(最短ルート)
- 音楽生成(Music)のモデル一覧から、目的に合うモデルを選択
- 尺(duration)と構成(intro/verse/chorus/bridge/outro)を決める
- ジャンル+ムード+テンポ(BPM)+楽器+参照曲のニュアンスを1つの文章にまとめる
- まず3パターン生成(A/B/C)。良い要素だけ残して再生成
- 必要ならステム分離・ループ最適化・音量/空間系を調整して完成
時短のコツ:最初から完璧を狙わず、A/B/Cで「ドラムはA」「コード感はB」「メロの方向性はC」を選び、次の生成で合体させると早いです。
Gensparkで使える音楽生成AIモデル一覧(画像内のモデル)
下記は、提示いただいた画面に表示されているモデル群です(名称・仕様はアップデートで変わる可能性があります)。 色は「一般的な傾向としての能力/コスト感」の目安:赤=高/青=中/緑=低(高速・軽量)。
| 目安 | モデル | できること | 向く用途 | 注意点 |
|---|---|---|---|---|
| 中 | ElevenLabs Music | 最大1時間のインストゥルメンタル音楽(ジャンル幅広め) | 配信用BGM、作業用、長尺ループ素材 | 歌詞・カスタム歌詞は非対応 |
| 高 | MiniMax Music v2 | 歌詞+ボーカル付き楽曲。[Verse] [Chorus] [Bridge]等のマーカー対応 |
歌入りデモ、SNS用短尺ソング、CM風 | 歌詞の書き方で品質が大きく変わる |
| 高 | Mureka Song | 最大3分のボーカル付きフル楽曲。歌詞生成、ステム分離に対応 | 完成形に近い歌もの、ミックス前提の制作 | 尺・構成を先に決めないと迷子になりやすい |
| 中 | Lyria2 Music Generator | インスト音楽&効果音用途の生成(Google Lyria 2)。歌詞は非対応 | 映像BGM、抽象アンビ、雰囲気作り | ボーカル要素を避ける指示が有効 |
| 低 | ElevenLabs Sound Effects | プロ向け効果音・環境音・オーディオテクスチャ | SE、ルームトーン、UI音、動画の音作り | 音の距離/素材/反響の指定が重要 |
| 低 | CassetteAI | 長時間のバックグラウンドミュージック(様々なスタイル) | 配信、店舗BGM、作業用プレイリスト | 主旋律より“空気感”の指定が効く |
| 中 | Mureka Instrumental | 最大3分のインスト。スタイルプロンプト+リファレンスベース。ボーカルなし | ジングル、短尺BGM、映像の尺合わせ | ループ前提なら“終止感”の制御が必要 |
まず迷ったら:
歌あり→ Mureka Song / MiniMax Music v2 / インスト短尺→ Mureka Instrumental / 長尺BGM→ ElevenLabs Music / CassetteAI / SE→ ElevenLabs Sound Effects
ジャンル別:どのモデルを選ぶと最適か(実務の使い分け)
1) YouTube・配信・店舗:長時間BGM(主張しすぎない)
- 最適:ElevenLabs Music / CassetteAI
- 狙い:“聴かせる”より“邪魔しない”。反復に耐えるコード進行・控えめなリード
- プロンプトの鍵:「ループ感」「密度低め」「リード控えめ」「中低域を厚く」
2) 映像BGM:短尺・尺合わせ・展開が欲しい
- 最適:Mureka Instrumental(最大3分の尺で作りやすい) / Lyria2(雰囲気特化)
- 狙い:0:00〜0:15導入 → 0:15〜盛り上げ → 0:45以降で引き算、など編集しやすい段差
- プロンプトの鍵:「秒単位の展開指定」「最後はフェード用に余白」「打楽器の入りを後ろに」
3) 歌入りデモ:SNS/CM/企画のたたき台
- 最適:MiniMax Music v2(構成マーカーで制御) / Mureka Song(ステム分離で後工程が強い)
- 狙い:歌詞の情報量を減らして“耳に残るフック”に寄せる
- プロンプトの鍵:「サビの母音」「語尾の統一」「1行あたりの音節(短め)」
4) 効果音・環境音:映像の説得力を上げる
- 最適:ElevenLabs Sound Effects
- 狙い:距離感・素材感・反響で“映像の空間”を作る
- プロンプトの鍵:「場所」「時間帯」「マイク距離」「反響」「一発音 or 連続」
すぐ使える:モデル別プロンプトテンプレ(超実践)
下のテンプレをコピペして、角括弧の中だけ埋めればOKです。最初は細かく書きすぎず、3本生成→良い要素を拾うのが最短です。
A) インストBGM(汎用テンプレ)
目的:[動画BGM/配信BGM/作業用]
尺:[30秒/60秒/2分/10分/1時間]
ジャンル:[lofi hip hop / ambient / cinematic / house / jazz]
ムード:[落ち着く/爽やか/緊張感/切ない/高揚]
テンポ:[BPM 72/90/120/140]
キー(任意):[A minor / C major]
楽器:[rhodes, warm pad, soft drums, sub bass]
構成:[intro 0:00-0:10 → main 0:10-0:50 → variation 0:50-1:10 → outro 1:10-1:20]
ミックス:[リード控えめ、ボーカルなし、耳に刺さる高域なし、ループしやすい終わり方]
避けたい要素:[歌、掛け声、過度なシンバル、急な転調]
B) Mureka Instrumental(短尺・尺合わせ向け)
3分以内のインストを作ってください(ボーカルなし)。
ジャンル:[シネマティック/EDM/アコースティック/和風]
用途:[YouTubeオープニング/商品紹介/ゲーム配信の転換]
BPM:[128]
展開:[0:00-0:12 控えめ → 0:12-0:45 盛り上げ → 0:45-1:10 間を作る → 1:10-1:40 もう一段上げる → 1:40-2:00 フェード用に引き算]
音色:[tight kick, punchy bass, bright pluck, airy pad]
仕上がり:[ラウドすぎない、編集しやすい、終わりはフェード前提]
C) ElevenLabs Music / CassetteAI(長尺BGMのコツ)
長時間のバックグラウンドBGMを作成。
スタイル:[lofi / chillhop / ambient / cafe jazz]
特徴:[主張しすぎない、反復に耐える、メロディは控えめ、コードで雰囲気を作る]
テンポ:[BPM 80]
質感:[暖かい、ノイズ少なめ、耳に刺さらない高域]
避けたい:[ボーカル、派手なリード、急なブレイク]
ループ:[自然に繋がる感じ]
D) MiniMax Music v2(歌入り・構成マーカー活用)
ジャンル:[J-POP / city pop / pop punk / synthwave]
ボーカル:[女性/男性]、言語:[日本語]、ムード:[前向きで爽やか]
テンポ:[BPM 120]
テーマ:[新しい挑戦、朝、軽い不安と期待]
[Verse]
(短めの情景描写。1行は短く、言葉を詰め込みすぎない)
[Chorus]
(フック重視。語尾や母音を揃えて“歌いやすさ”を優先)
[Bridge]
(1回だけ視点を変える/言葉を削って余白を作る)
要望:メロディが覚えやすい/サビで一段上がる/過度な転調はしない
E) Mureka Song(歌あり+ステム分離を活かす)
最大3分のボーカル曲を作ってください。
ジャンル:[modern pop] ムード:[切なさ→解放] BPM:[100]
構成:Intro → Verse → Pre-chorus → Chorus → Verse → Chorus → Outro
歌詞:日本語、比喩は少なめ、日常語で刺さるフレーズを1つ作る
ミックス:ボーカルは前、キックは重すぎない、サビで広がる
可能ならステム分離しやすいアレンジ(楽器の役割が明確)で。
F) ElevenLabs Sound Effects(SFX/環境音の勝ちパターン)
効果音を生成してください。
シーン:[深夜のオフィスでドアがゆっくり閉まる]
場所:[小さめの会議室] 反響:[少しだけ]
距離:[マイクから1.5m] 方向:[右奥から]
素材感:[重めの木製ドア+金属ラッチ]
尺:[2秒]
避けたい:[過度なリバーブ、ホワイトノイズ、過剰な音圧]
品質を一段上げるチェック項目:
①目的に対して“主張しすぎないか” ②尺の中に編集点(間)があるか ③ボーカル/高域が刺さらないか ④ループやフェードで破綻しないか
具体的な使用例(すぐ役に立つ)
使用例1:YouTubeのトーク動画(10分)に“邪魔しないBGM”を作る
- モデル:ElevenLabs Music または CassetteAI
- 狙い:中域を空ける(声の帯域を邪魔しない)/主旋律を薄く
- 手順:10分×3本→最も自然な1本を採用→必要なら数分ごとに差し替え
使用例2:15秒広告(商品紹介)に“上がるジングル”を作る
- モデル:Mureka Instrumental
- 狙い:0:00〜0:03で掴む/0:12前後で“決め”/最後はフェードでも成立
- 手順:BPM固定→A/B/C→良いフレーズを残して再生成
使用例3:歌入りデモ曲(企画提出用)を最短で作る
- モデル:MiniMax Music v2(構成管理)→必要ならMureka Song(ステム分離で後加工)
- 狙い:歌詞は“説明”より“フック”。サビの言葉を短く
- 手順:テーマ→サビ1行→Verseは情景→Bridgeは視点変更
使用例4:動画の“音が寂しい”を一発で解決(環境音+SE)
- モデル:ElevenLabs Sound Effects
- 狙い:場所の空気を作る(室内の反響、街の遠音、機械音など)
- 手順:環境音(長め)→必要な瞬間だけSE(短め)を重ねる
CTA:まずはGensparkで「複数モデル比較」を一度やってみてください
同じ条件で3モデル試すだけで、“当たりモデル”が見つかります
音楽生成は「モデル選択」と「プロンプトの型」で勝負が決まります。 まずは同じ条件(ジャンル/BPM/尺/ムード)で、歌あり・インスト・長尺など別モデルを横並びにして、出音の傾向を掴むのが最短です。
※「使い放題」や「クレジット消費なし」等の条件はプランや時期で変わる可能性があります。登録画面・料金ページの最新表示をご確認ください。
CTA:Speakly(ボイススピーキー)で“音声→企画→制作”の速度を上げる(30日無料)
音楽プロンプト作りは、実は「話した方が速い」ことが多いです
「言葉が出てこない」「雰囲気を説明しづらい」時ほど、音声で要件を固めるのが強いです。 Speaklyで話しながらイメージを整理して、そのままGensparkの音楽生成プロンプトに落とし込むと、制作スピードが上がります。
体験コメント:
「Genspark Speakly を使ってみたら、とてもスムーズで、仕事の効率が2倍になりました!おすすめです!」
登録すると、お互いに無料メンバーシップがもらえるとのこと。まずは30日無料で試して、音声で仕事が進む感覚を掴んでみてください。
免責:本記事は一般的な使い方の解説です。モデル仕様・料金・出力の利用条件は変更される可能性があります。公開/商用利用の前に、必ず公式の最新情報をご確認ください。