人が機械に合わせるのではなく、一人ひとりに合わせた心地よさを生み出す製品・サービスの実現に不 可欠な「A I(人 工 知 能)」。その基 盤となる機械学習技術や、機械が人の言葉を扱うための音声・自然言語処理技術の研究開発などに取り組んでいます。

音声信号処理・音声認識

雑音や残響のある環境でもユーザーの声を正確に認識することは音声UIの前提条件。そのためにソニーは「音声信号処理」と「音声認識」の技術開発に取り組み、音声の認識性能向上を追求しています。例えばFuture Experience Programのコンセプトプロトタイプ“N”の首元に置かれる機器の特徴を活かした「高性能風切音抑圧」、使用頻度の高いコマンドなどを素早く認識できる組み込み音声認識と超大語彙を扱うクラウド音声認識の協調動作による「ハイブリッド音声認識」など、機器形状やユースケースに合わせた技術の最適化により、徹底的な使い勝手の良さを実現しています。

[音声信号処理・音声認識のイメージ]

発話意味解析・自然言語処理

音声で機器を操作するために、音声認識された発話文字列を、機器が実行可能な情報形式(意味表現)に変換する「発話意味解析技術」の研究開発を進めています。多様な話し方を吸収する機械学習と、設計者の意図を反映するヒューリスティック処理をハイブリッドで用いることで、高精度の機器操作を実現。また、そのための要素技術として、単語の切り出し、品詞や属性の付与、構文構造の抽出など、テキストを解析する「自然言語処理」と、曖昧性を含む言語情報を適切に解析する「知識情報処理」の技術開発も行なっています。

[発話意味解析・自然言語処理のイメージ]

Deep Learning (深層学習)

ソニーは映像、音声、センシングデータ解析などの領域でDeep Learningの高性能技術を実現しています。Deep Learningはさまざまな製品やサービスですでに幅広く使用されており、Xperia Earの首振り動作認識やソニー不動産の価格推定エンジンなどにも活用されています。低消費電力・低演算リソース下でも高精度を実現する手法や少量データで高精度認識を実現する手法など、最先端の研究開発に取り組むとともに、開発者向けのDeep Learningフレームワーク ”Neural Network Libraries” をオープンソース化し、世界のAIコミュニティの発展にも積極的に貢献しています。

[Deep Learning の解析イメージ]

行動学習

「行動学習」は強化学習に代表されるように、自律システムが試行錯誤を通じて環境に適した行動を獲得する技術。人が設計しきれないほど複雑・多様な状況での行動計画や、事前の想定を超えて変動する環境に追従するオンライン最適制御を主な目的とし、Navigation(地図獲得と自律移動)とManipulation(物体操作)などのロボティクス課題やゲームAI分野への応用を目指しています。海外大学や研究機関との共同研究も積極的に行ない、最先端技術を取り入れた研究開発を進めています。

[強化学習の原理]
このページの先頭へ