高度な音楽検索、音楽推薦、その他新しい音楽の楽しみ方(アプリケーション)を実現するために、質の高い音楽のメタデータ(音楽の特徴などを表すデータ)に対するニーズが高まっている。従来は人の手によるメタデータ付与作業が主流であったが、コストの問題や、付与されるメタデータが人によって異なるという問題があった。
ソニーでは、信号処理、統計処理を施すことにより音楽の波形を解析し、ビート、コード進行、楽曲構造、ジャンル、含まれる楽器音、ムードなどのさまざまなメタデータを自動的に抽出する「12音解析」を独自開発し、"ネットジューク"、"Rolly"、VAIOの付属ソフトウェアなどに採用している。

図1 12音解析とは



メタデータの例
| スピード感 | 人が感じる音楽の速さ。同じテンポでも音質やリズムパターンなどによって人が感じる音楽の速さ感は異なるため、テンポとは区別される。 |
|---|---|
| エネルギー感 | 人が感じる音楽のエネルギー感。静かな曲は小さく、にぎやかな曲は大きくなる。 |
| ジャンル | ロック、ジャズ、クラシックなどのジャンルに当てはまるかどうか。 |
| 楽器音 | 音楽にピアノ、ベース、ギターなどの楽器が含まれているかどうか。 |
| ムード | 明るい、さわやか、優雅など、ムードを表すキーワードに当てはまるかどうか。 |