Genspark音楽生成の教科書|おすすめモデル比較とジャンル別プロンプト例

Genspark音楽生成の教科書|おすすめモデル比較とジャンル別プロンプト例 Thumbnail

Contents

Genspark 音楽生成AI|複数モデルを試して“最短で理想の1曲”へ

Gensparkで音楽を生成する方法:モデル別の使い分けから実践プロンプトまで

「BGMが欲しい」「歌入りのデモ曲をすぐ作りたい」「効果音まで揃えたい」——目的によって最適な音楽生成AIは変わります。 Gensparkなら、複数の音楽/音声系モデルを同じ導線で試せるので、制作の速度が一気に上がります。

この記事の結論:
①まずは目的(歌あり/インスト/長尺BGM/効果音)を決める → ②モデルを選ぶ → ③プロンプトをテンプレに沿って書く → ④3本出して比較 → ⑤必要ならステム分離や再生成で詰める。

注意(大事):
生成音源の利用条件(商用可否、権利、クレジット表記、禁止事項)はサービスやモデルで変わり得ます。公開・販売・配信に使う場合は、必ずGenspark側の最新の利用条件を確認してください(本記事は法律助言ではありません)。

Gensparkで音楽を生成する基本手順(最短ルート)

  1. 音楽生成(Music)のモデル一覧から、目的に合うモデルを選択
  2. 尺(duration)構成(intro/verse/chorus/bridge/outro)を決める
  3. ジャンルムードテンポ(BPM)楽器参照曲のニュアンスを1つの文章にまとめる
  4. まず3パターン生成(A/B/C)。良い要素だけ残して再生成
  5. 必要ならステム分離ループ最適化音量/空間系を調整して完成

時短のコツ:最初から完璧を狙わず、A/B/Cで「ドラムはA」「コード感はB」「メロの方向性はC」を選び、次の生成で合体させると早いです。

Gensparkで使える音楽生成AIモデル一覧(画像内のモデル)

下記は、提示いただいた画面に表示されているモデル群です(名称・仕様はアップデートで変わる可能性があります)。 色は「一般的な傾向としての能力/コスト感」の目安:赤=高青=中緑=低(高速・軽量)。

:難度高め・仕上げ向き :バランス型・普段使い :高速・量産向き
目安 モデル できること 向く用途 注意点
ElevenLabs Music
長尺インスト
最大1時間のインストゥルメンタル音楽(ジャンル幅広め) 配信用BGM、作業用、長尺ループ素材 歌詞・カスタム歌詞は非対応
MiniMax Music v2
歌あり構成タグ
歌詞+ボーカル付き楽曲。[Verse] [Chorus] [Bridge]等のマーカー対応 歌入りデモ、SNS用短尺ソング、CM風 歌詞の書き方で品質が大きく変わる
Mureka Song
歌あり最大3分ステム
最大3分のボーカル付きフル楽曲。歌詞生成、ステム分離に対応 完成形に近い歌もの、ミックス前提の制作 尺・構成を先に決めないと迷子になりやすい
Lyria2 Music Generator
インスト効果音寄りにも
インスト音楽&効果音用途の生成(Google Lyria 2)。歌詞は非対応 映像BGM、抽象アンビ、雰囲気作り ボーカル要素を避ける指示が有効
ElevenLabs Sound Effects
SFX環境音
プロ向け効果音・環境音・オーディオテクスチャ SE、ルームトーン、UI音、動画の音作り 音の距離/素材/反響の指定が重要
CassetteAI
長尺BGM
長時間のバックグラウンドミュージック(様々なスタイル) 配信、店舗BGM、作業用プレイリスト 主旋律より“空気感”の指定が効く
Mureka Instrumental
インスト最大3分参照ベース
最大3分のインスト。スタイルプロンプト+リファレンスベース。ボーカルなし ジングル、短尺BGM、映像の尺合わせ ループ前提なら“終止感”の制御が必要

まず迷ったら:
歌あり→ Mureka Song / MiniMax Music v2 / インスト短尺→ Mureka Instrumental / 長尺BGM→ ElevenLabs Music / CassetteAI / SE→ ElevenLabs Sound Effects

ジャンル別:どのモデルを選ぶと最適か(実務の使い分け)

1) YouTube・配信・店舗:長時間BGM(主張しすぎない)

  • 最適:ElevenLabs Music / CassetteAI
  • 狙い:“聴かせる”より“邪魔しない”。反復に耐えるコード進行・控えめなリード
  • プロンプトの鍵:「ループ感」「密度低め」「リード控えめ」「中低域を厚く」

2) 映像BGM:短尺・尺合わせ・展開が欲しい

  • 最適:Mureka Instrumental(最大3分の尺で作りやすい) / Lyria2(雰囲気特化)
  • 狙い:0:00〜0:15導入 → 0:15〜盛り上げ → 0:45以降で引き算、など編集しやすい段差
  • プロンプトの鍵:「秒単位の展開指定」「最後はフェード用に余白」「打楽器の入りを後ろに」

3) 歌入りデモ:SNS/CM/企画のたたき台

  • 最適:MiniMax Music v2(構成マーカーで制御) / Mureka Song(ステム分離で後工程が強い)
  • 狙い:歌詞の情報量を減らして“耳に残るフック”に寄せる
  • プロンプトの鍵:「サビの母音」「語尾の統一」「1行あたりの音節(短め)」

4) 効果音・環境音:映像の説得力を上げる

  • 最適:ElevenLabs Sound Effects
  • 狙い:距離感・素材感・反響で“映像の空間”を作る
  • プロンプトの鍵:「場所」「時間帯」「マイク距離」「反響」「一発音 or 連続」

すぐ使える:モデル別プロンプトテンプレ(超実践)

下のテンプレをコピペして、角括弧の中だけ埋めればOKです。最初は細かく書きすぎず、3本生成→良い要素を拾うのが最短です。

A) インストBGM(汎用テンプレ)

目的:[動画BGM/配信BGM/作業用]
尺:[30秒/60秒/2分/10分/1時間]
ジャンル:[lofi hip hop / ambient / cinematic / house / jazz]
ムード:[落ち着く/爽やか/緊張感/切ない/高揚]
テンポ:[BPM 72/90/120/140]
キー(任意):[A minor / C major]
楽器:[rhodes, warm pad, soft drums, sub bass]
構成:[intro 0:00-0:10 → main 0:10-0:50 → variation 0:50-1:10 → outro 1:10-1:20]
ミックス:[リード控えめ、ボーカルなし、耳に刺さる高域なし、ループしやすい終わり方]
避けたい要素:[歌、掛け声、過度なシンバル、急な転調]

B) Mureka Instrumental(短尺・尺合わせ向け)

3分以内のインストを作ってください(ボーカルなし)。
ジャンル:[シネマティック/EDM/アコースティック/和風]
用途:[YouTubeオープニング/商品紹介/ゲーム配信の転換]
BPM:[128]
展開:[0:00-0:12 控えめ → 0:12-0:45 盛り上げ → 0:45-1:10 間を作る → 1:10-1:40 もう一段上げる → 1:40-2:00 フェード用に引き算]
音色:[tight kick, punchy bass, bright pluck, airy pad]
仕上がり:[ラウドすぎない、編集しやすい、終わりはフェード前提]

C) ElevenLabs Music / CassetteAI(長尺BGMのコツ)

長時間のバックグラウンドBGMを作成。
スタイル:[lofi / chillhop / ambient / cafe jazz]
特徴:[主張しすぎない、反復に耐える、メロディは控えめ、コードで雰囲気を作る]
テンポ:[BPM 80]
質感:[暖かい、ノイズ少なめ、耳に刺さらない高域]
避けたい:[ボーカル、派手なリード、急なブレイク]
ループ:[自然に繋がる感じ]

D) MiniMax Music v2(歌入り・構成マーカー活用)

ジャンル:[J-POP / city pop / pop punk / synthwave]
ボーカル:[女性/男性]、言語:[日本語]、ムード:[前向きで爽やか]
テンポ:[BPM 120]
テーマ:[新しい挑戦、朝、軽い不安と期待]

[Verse]
(短めの情景描写。1行は短く、言葉を詰め込みすぎない)

[Chorus]
(フック重視。語尾や母音を揃えて“歌いやすさ”を優先)

[Bridge]
(1回だけ視点を変える/言葉を削って余白を作る)

要望:メロディが覚えやすい/サビで一段上がる/過度な転調はしない

E) Mureka Song(歌あり+ステム分離を活かす)

最大3分のボーカル曲を作ってください。
ジャンル:[modern pop] ムード:[切なさ→解放] BPM:[100]
構成:Intro → Verse → Pre-chorus → Chorus → Verse → Chorus → Outro
歌詞:日本語、比喩は少なめ、日常語で刺さるフレーズを1つ作る
ミックス:ボーカルは前、キックは重すぎない、サビで広がる

可能ならステム分離しやすいアレンジ(楽器の役割が明確)で。

F) ElevenLabs Sound Effects(SFX/環境音の勝ちパターン)

効果音を生成してください。
シーン:[深夜のオフィスでドアがゆっくり閉まる]
場所:[小さめの会議室] 反響:[少しだけ]
距離:[マイクから1.5m] 方向:[右奥から]
素材感:[重めの木製ドア+金属ラッチ]
尺:[2秒]
避けたい:[過度なリバーブ、ホワイトノイズ、過剰な音圧]

品質を一段上げるチェック項目:
①目的に対して“主張しすぎないか” ②尺の中に編集点(間)があるか ③ボーカル/高域が刺さらないか ④ループやフェードで破綻しないか

具体的な使用例(すぐ役に立つ)

使用例1:YouTubeのトーク動画(10分)に“邪魔しないBGM”を作る

  • モデル:ElevenLabs Music または CassetteAI
  • 狙い:中域を空ける(声の帯域を邪魔しない)/主旋律を薄く
  • 手順:10分×3本→最も自然な1本を採用→必要なら数分ごとに差し替え

使用例2:15秒広告(商品紹介)に“上がるジングル”を作る

  • モデル:Mureka Instrumental
  • 狙い:0:00〜0:03で掴む/0:12前後で“決め”/最後はフェードでも成立
  • 手順:BPM固定→A/B/C→良いフレーズを残して再生成

使用例3:歌入りデモ曲(企画提出用)を最短で作る

  • モデル:MiniMax Music v2(構成管理)→必要ならMureka Song(ステム分離で後加工)
  • 狙い:歌詞は“説明”より“フック”。サビの言葉を短く
  • 手順:テーマ→サビ1行→Verseは情景→Bridgeは視点変更

使用例4:動画の“音が寂しい”を一発で解決(環境音+SE)

  • モデル:ElevenLabs Sound Effects
  • 狙い:場所の空気を作る(室内の反響、街の遠音、機械音など)
  • 手順:環境音(長め)→必要な瞬間だけSE(短め)を重ねる

CTA:まずはGensparkで「複数モデル比較」を一度やってみてください

同じ条件で3モデル試すだけで、“当たりモデル”が見つかります

音楽生成は「モデル選択」と「プロンプトの型」で勝負が決まります。 まずは同じ条件(ジャンル/BPM/尺/ムード)で、歌あり・インスト・長尺など別モデルを横並びにして、出音の傾向を掴むのが最短です。

※「使い放題」や「クレジット消費なし」等の条件はプランや時期で変わる可能性があります。登録画面・料金ページの最新表示をご確認ください。

CTA:Speakly(ボイススピーキー)で“音声→企画→制作”の速度を上げる(30日無料)

音楽プロンプト作りは、実は「話した方が速い」ことが多いです

「言葉が出てこない」「雰囲気を説明しづらい」時ほど、音声で要件を固めるのが強いです。 Speaklyで話しながらイメージを整理して、そのままGensparkの音楽生成プロンプトに落とし込むと、制作スピードが上がります。

体験コメント:
「Genspark Speakly を使ってみたら、とてもスムーズで、仕事の効率が2倍になりました!おすすめです!」

登録すると、お互いに無料メンバーシップがもらえるとのこと。まずは30日無料で試して、音声で仕事が進む感覚を掴んでみてください。

免責:本記事は一般的な使い方の解説です。モデル仕様・料金・出力の利用条件は変更される可能性があります。公開/商用利用の前に、必ず公式の最新情報をご確認ください。

Previous