2026年3月25日、Google DeepMindが「Lyria 3 Pro」を公開しました。30秒クリップ生成が中心だったLyria 3の登場から1か月ちょっとでのお目見えです。そして、翌26日には音楽生成AIの定番「Suno」も最新モデルとなるv5.5をリリースしています。すでに先行してUdioも独自の編集機能で制作体験を磨き続けており、テキストを打ち込むだけで高音質な楽曲が数十秒で生まれる環境が整いました。→過去の「柳谷智宣のAIトレンドインサイト」の回はこちらを参照。
今回は、最新の音楽生成AIの定番サービスやプロンプトの作り方について解説します。実際に楽曲を生成してみたので、聴いてみてください。
各サービスの設計思想と得意分野から見える使い分け
テキストから音楽を作り出すという根本的な技術は共通していますが、3つのサービスが想定しているユーザー層とプロダクトの設計思想は異なります。
Sunoは誰でも手軽に曲が作れる体験を最優先に掲げる市場の最大手です。2023年12月の登場以来、またたく間にユーザー数を伸ばし続け、有料会員はすでに200万人を突破しました。2025年11月にはシリーズCで2億5000万ドルの資金調達を完了し、評価額は24.5億ドル規模になっています。
登場したばかりの最新バージョンのv5.5では、自分の声を録音してAIに歌わせるVoices機能や、自分が過去に作ったオリジナル楽曲を6曲以上読み込ませてAIのモデルをパーソナライズするCustom Models機能が追加されました。楽曲の長さは通常で約4分から5分ほどですが、Extend機能を使えば8分以上の長尺に延長することも可能です。
料金プランは3段階用意されており、1日50クレジットが付与されて約10曲作れるFreeプラン、月額10ドルで約500曲作れるProプラン、月額30ドルで約2000曲作れるPremierプランに分かれています。なお、作成した楽曲を商用目的で利用するにはProプラン以上の契約が必須となります。今回は、Proプランを利用しました。
Udioは元Google DeepMindの研究者らが2024年4月に立ち上げたプラットフォームで、音楽プロデューサー向けの高度な編集機能が強みです。生成された楽曲の特定の小節だけを指定して別の楽器やメロディに再生成するインペインティング機能や、タイムライン上で細かく楽曲を切り貼りするSessions機能などを備え、既存の音楽制作ソフトに近い感覚で作り込みできます。
また、48kHzステレオの高音質出力に対応しており、オーケストラや映画音楽のような空間的な広がりを求めるジャンルで高い評価を得ています。なお、著作権に関する一部の訴訟や和解の過程で機能制限がかかっており、現在は楽曲のダウンロードができなくなっています。
そのため、Udio上での再生やURLによる共有が中心になります。1曲の生成には2〜4クレジットが消費され、無料アカウントは1日10クレジットに加えて月100クレジットまで利用でき、Standardは月額10ドルで月2400クレジット、Proは月額30ドルで月6000クレジットまで使えます。
Lyria 3 Proは、Google DeepMindが開発している音楽生成AI。もっとも手軽な使い方は、Geminiアプリのチャット画面から「こんな曲を作って」と日本語で指示する方法で、30秒のクリップなら無料で生成できます。最長約3分のトラックを作るにはGoogle AIの有料プランへの加入が必要です。生成した楽曲はMP3またはカバー画像付き動画(MP4)でダウンロードできます。
出力は48kHzステレオで、テキストによる指示だけでなく、画像を読み込ませてビジュアルのムードを音楽に変換するマルチモーダル入力にも対応しているのが特徴です。ライセンス処理済みのデータのみで学習したと公式に発表しており、すべての出力にはSynthIDと呼ばれる人間の耳には聞こえない電子透かしが自動的に刻み込まれます。
さらに、Gemini APIやVertex AIを通じたAPI従量課金(1曲約0.08ドル)にも対応しているため、ゲームや動画編集アプリに音楽生成機能を組み込みたい開発者にとっても有力な選択肢になります。
狙い通りの曲に近づけるプロンプト設計の基本
音楽生成AIを使いこなすうえで最初に直面する壁が、どのような言葉を入力すれば思い通りの曲になるのか、というプロンプト設計の課題です。画像生成AIと同じように、ただ漠然といい感じのポップスを作ってと指示を出しても、頭の中に思い描いた通りの結果が返ってくるとは限りません。
.
