シリーズ:
Part 1 | Part 2 | Part 3 | Part 4(本記事)| Part 5(最終回)
NotePerformerの先にあるもの — Melismaと音楽生成の可能性
ここまで、NotePerformerを中心に、楽譜から音楽をどのように再構成するかという視点で見てきました。
では、この「楽譜を解釈する」という方向性は、この先どこへ向かうのでしょうか。
ここでは、その延長線上にある試みの一つとして、Melismaについて少し触れてみたいと思います。
Melismaという試み
Melisma [1] は、AIを用いて「楽譜から音声を生成する」ことを目的としたシステムです。
従来の音源が音を再生するものであるのに対し、Melismaは楽譜を解析し、その内容に基づいて演奏そのものを生成します。
この点において、NotePerformerと同様に「楽譜を読む」という方向性を持ちながらも、そのアプローチはさらに一歩先に進んでいるように見えます。
公開されている複数のサンプルを聴くと、その演奏はすでにかなり音楽的であり、単なる試験的な段階を超えつつあるように感じられます。
特に新しいバージョンでは、フレージングやダイナミクスに揺らぎや選択の要素が見られ、より生成的な方向へ進んでいる印象を受けます。
[1]: Melisma
NotePerformerとの違い
NotePerformerは、音楽理論や演奏慣習に基づくルールによって、安定した解釈を提供するシステムです。
同じ楽譜に対しては基本的に同じ結果が得られるという点で、非常に高い再現性を持っています。
一方でMelismaは、ランダムシードによって結果が変化する仕組みを持ち、同じ楽譜であっても異なる演奏が生成される可能性があります。
これは、決定論的な再生ではなく、確率的な生成処理が行われていることを示しています。
言い換えれば、
- NotePerformer → 楽譜を解釈する
- Melisma → 楽譜から音楽を生成する
という違いになります。
単旋律とポリフォニー
興味深い点として、現時点のMelismaは、和音や重音に対応していません。
これは単なる未実装というよりも、音楽を時間的な流れとして生成するアプローチに起因するものと考えられます。
単旋律の生成は比較的扱いやすい一方で、和音のように複数の音を同時に成立させるポリフォニーの生成は、音響的にも音楽的にも難易度が一気に上がります。
どの音を前に出すか、どのようにバランスを取るかといった問題は、単純な延長では解決できないためです。
実際には、複数のトラックを用いることで和音的な響きを作ることは可能ですが、それぞれが独立して生成されるため、声部間の関係は必ずしも考慮されません。
この点は、複数の旋律を重ねることで多声音楽が成立していった初期の音楽と、どこか似た構造を持っているようにも感じられます。
解釈から生成へ
これまでの音源は、
- 音を鳴らす
- 演奏を作る
という方向に発展してきました。
そしてNotePerformerは、「楽譜を解釈する」という段階に到達しています。
そのさらに先には、「音楽を生成する」という方向が見えてきます。
つまり、「楽譜 → 解釈 → 生成」という流れです。
制作という視点から
現時点では、安定した結果を得られるNotePerformerの方が、ポリフォニーの処理など実用性という意味では優れていると言えるでしょう。
一方でMelismaは、音楽制作の在り方そのものを変えていく可能性を持っています。
特に、「楽譜を書くことが、そのまま音楽を生み出す」という方向性は、これまでの制作スタイルとは大きく異なるものです。
まとめ
NotePerformerは、楽譜を深く解釈することで音楽を成立させる、非常に完成度の高いシステムです。
そしてその先には、Melismaのように、楽譜から音楽を生成しようとする試みが現れ始めています。
現時点ではまだ単旋律を中心とした段階にありますが、その方向性は明確であり、今後の発展によって音楽制作の風景が変わる可能性も感じられます。
音楽の歴史を振り返ると、単旋律から多声音楽へと発展してきた流れが見えてきます。
その意味で、現在の音楽生成技術がまず単旋律から始まっていることは、むしろ自然なことのようにも思えます。
そしてもし、今後これがポリフォニーへと進んでいくのだとすれば、それは単なる技術の進歩ではなく、音楽史そのものをなぞるような過程なのかもしれません。
もっとも、音楽は単純に同じ道を繰り返すわけではありません。
それは循環するのではなく、形を変えながら前へ進むものです。
言い換えれば、音楽は螺旋のように進んでいるのかもしれません。
英語版はこちら