AI & Cloud Service Technology Report03 360 Reality Audio 音楽体験に、 ソニーのAI・クラウド技術。
Outline
360 Reality Audioは、ソニーの空間音響技術を用いて臨場感溢れる音楽体験を可能にするサービスです。人間の音の聞こえ方には個性があり(聴感特性)、耳や頭の形によって変化します。360 Reality Audioはアプリで撮影した耳の写真を分析し、利用者に最適な音響設定を生成。全方位から音が降りそそぐように聴こえることで、まるでライブ会場にいるかのような没入感を体験することができます。アーティストは、楽曲制作の過程でボーカル、コーラス、楽器などの音源に位置情報を付与し、球状の空間内に配置することが可能です。自由な位置で音を鳴らすことで、理想的な音響環境で楽曲を提供できるようになりました。
Project Members

株式会社ソニーリサーチ
研究開発(R&D)
福田
AIエンジニアとして、
個人の聴感特性の
解析や最適化技術の開発を担当。

ソニー株式会社
ビデオ・サウンド事業
クラウドサービスエンジニア
佐藤
360 Reality Audioの
システム構築を担当。
※ 所属・仕事内容は取材当時のものです。
AI技術とクラウド技術で実現する
個人に最適な音楽体験の提供
どのような仕組みで実現しているのでしょうか?
まずユーザーがスマートフォンの専用アプリから撮影した耳の写真から、耳の形の膨大なデータを学習したAIが耳の形状を3次元データとして推定します。そして、今度は耳の構造から、耳の形と音響特性の組み合わせの特性を学習したAIがHRTFを推定し、その値をもとに最適な音場を設定するという仕組みです。
どのような理由からでしょうか?
低コストで顧客体験を実現するために
クラウドに載せるものを
極限まで削る
開発が始まった2017年当時はディープラーニングの流行の真っ只中。しかし、クラウドを用いたAIのオーディオ製品への組み込みはまだ手を付けていない分野でした。そのため、AIモデルをどう動かすかということから模索していきました。AIモデルに関してある程度形になった後も、ヘッドホンチームの協力やアプリの開発、アルゴリズムを実行するためのクラウドサーバーの技術などが必要で、どんどん輪が広がっていったんです。
最低限のサーバー構成で、UX(ユーザー体験)チームから要望された反応速度を満たしながらも、コストを最小限に抑えるよう工夫が必要になりました。
Lambdaは今でこそストレージ上限が増え、すべてのライブラリを入れられるようになりましたが、当時はストレージの上限が厳しく、ライブラリの一部をS3に置き、Lambdaの起動時にS3からファイルを取得して実行するという少し強引な仕組みで実行していました。
ソニーグループの幅広さを活かして
全員が納得するクオリティーへ
どのようにクオリティーを担保したのでしょうか?
そんな微調整を何度も繰り返せたのは、ソニーグループ内に株式会社ソニー・ミュージックソリューションズがあって、スタジオと直にやりとりできたからこそですね。
特に印象的だったことはなんでしょうか?
個人に最適な音楽体験を
当たり前の選択肢に
アップデートを予定していますか?
どのような広がりを期待していますか?
さらに、360 Reality Audioを活用したリアルタイム配信「360 Reality Audio Live」にもソニーとしては取り組んでいます。オンライン配信を楽しむカルチャーは定着していますが、360 Reality Audioを用いた配信はまだ始まったばかりです。360 Reality Audioはライブの音響もヘッドホンで再現できるので、会場ごとに異なる“一番音がいい席”の再現も可能です。ライブ会場に足を運べなかった際にも、360 Reality Audioによって臨場感の高いライブ体験を提供し、より多くの人にライブの良さを味わってもらえたらいいなと思います。



