Sunoで人間の声だけの曲を作ってみた｜AI音楽生成、ここまでできるとは

2026年6月14日 2026年6月24日

tadashi

AIで音楽が作れる、という話は聞いたことがあっても、実際に触ってみると想像以上のことができるんです。

今回試したのは「Suno」という音楽生成AIです。テキストでお願いを書くだけで、曲が出来上がる。そう聞いてはいたものの、実際に作ってみたものは、ちょっと想像とは違う方向に転がっていきました。

この記事のポイント

Sunoはテキストの指示だけで楽曲を生成できるAI音楽ツール
「楽器を使わず、人の声だけで音楽を作る」という実験をしてみた
ChatGPTと一緒に考えたプロンプトをそのまま紹介
ハミングや囁きを重ねた"声だけの曲"が実際に生成された

Contents

Sunoって何？

Sunoは、テキストで曲のイメージを伝えると、AIがそのまま楽曲として生成してくれるサービスです。ジャンル、雰囲気、テンポ、歌詞のテーマなどを文章で指定するだけ。ボーカル入りの曲が数十秒〜数分で出来上がります。作曲も演奏もできない人間が、いきなり「曲」を持てる。これだけでもかなり大きな変化だと思います。

「人の声だけで音楽を作る」という思いつき

普通に曲を作るだけでも面白いのですが、ここでひとつ思いつきました。「楽器を一切使わず、人の声だけで音楽を作ったらどうなるんだろう」。声だけでベースもパーカッションもメロディも作ってしまう、いわゆる「ヴォイスパーカッション」や「アカペラ・ループ」のようなスタイル。そういうジャンルへのリスペクトを込めつつ、AIに伝えてみたら、どうなるのか。ハミング、息づかい、囁き、途切れる声の断片。そういう「声の素材」だけを重ねて、一つの曲にしてほしい。そんなイメージを、ChatGPTとの壁打ちを重ねながら、プロンプト（AIへの指示文）にしていきました。正直、「これでちゃんと音楽になるのか？」という半信半疑な気持ちもありました。

実際に使ったプロンプト

参考までに、実際にSunoに渡したプロンプト（英語）を載せておきます。テーマは「孤独・内省」。声だけで、静かな心の内側を表現してほしい、という指示です。

Create an all-vocal a cappella instrumental—no instruments allowed, only human voice sounds, Use layered humming, beatboxing, singing, whispering, and vocal basslines to form a full rhythmic and melodic composition, Each voice should feel alive, playful, and deeply connected—like a single person becoming an orchestra through joy, Let the rhythm be bouncy, body-based, syncopated, Let some parts sound like spontaneous vocal improvisation, This is music that smiles, Music that feels like the body is remembering it can sing even without words, ‑Construct a dark, ‑emotional soundscape using only human voices—no instruments, ‑Use breath, ‑hums, ‑sighs, ‑soft chants, ‑layered whispers, ‑and broken phrases to create an atmosphere of isolation and reflection, ‑The rhythm should be irregular, ‑like a heartbeat in grief, ‑Let the vocals overlap, ‑fade in and out, ‑struggle to form a melody, ‑This is not a song, ‑It is the sound of a soul trying to remember how to sing, ‑Let silence be part of the rhythm, ‑Let emotion crack through

こうして見ると、もはや「音楽の指示」というより、ちょっとした詩のようにも見えますよね。

実際に生成された曲

結果として、できあがったのは、本当に人の声だけで構成された曲でした。不規則なリズム、重なって消えていく囁き、メロディになりきれない声の断片。レイヤーになったハミングや、声で作られたベースラインのような響きも混ざっています。ここがちょっと面白いんですよね。指示したのは文章だけなのに、「声が楽器になる」というイメージが、ちゃんと音として返ってきたわけです。このプロンプトから生成された曲が、こちらです。 Voices from the Inside（Suno）「これは歌ではなく、声が歌い方を思い出そうとしている音だ」というイメージを伝えたところ、まさにそういう空気を持った曲ができあがりました。

言葉で音楽の「質感」を伝えるという体験

Sunoを使っていて感じたのは、ジャンル名やコード進行を知らなくても、「質感」や「気分」を言葉で伝えれば、それが音になるということです。「明るい曲」ではなく「体が思わず動き出すような曲」。「悲しい曲」ではなく「魂が歌い方を思い出そうとしている音」。こういう、ちょっと詩的な表現でも、AIはそれを音楽的な要素に変換してくれます。これは音楽制作というより、イメージを翻訳してもらう感覚に近いのかもしれません。

作った曲は、世に出すこともできる

Sunoで作った曲は、ただ自分で聴いて終わりにすることもできます。でも配信サービスを使えば、SpotifyやApple Musicなどで公開することも可能なんです。自分も実際に、作った曲をいくつか配信サービスに登録して公開しています。簡単な申請のステップはありましたが、特別な機材も人脈もなく、個人でここまでできる。数年前には考えられなかったことだと思います。

声だけでも、音楽になる

Sunoを使ってみて一番驚いたのは、「楽器を使わない」という制約をつけても、ちゃんと音楽として、しかも一つの世界観として成立してしまうことでした。人の声には、思っている以上にいろんな表情があるんです。それをAIが拾って、音楽という形に編み直してくれる。これって、ちょっとすごいことだと思いませんか。もし気になった方は、Sunoを一度試してみてください。 Sunoを試してみる言葉にした「気分」が、思っていなかった形の音楽になって返ってくる。声というものは、こんなにも豊かだったのか。そう気づかせてくれる体験でした。