新卒採用

コンテンツメニュー
音声・自然言語処理:すでにスマートフォンやゲーム機に採用され、今後ますます活用が広がる「音声UI」。現在、ウェアラブル機器や「Life Space UX」などの次世代機器における「使い勝手のよい音声UI」の実現に向けて、研究開発を行っています。

騒音の中でも人の声を正確に聞き取る
音声信号処理・音声認識

ユーザーの声を正確に認識することは音声UIの前提条件です。そのため「音声信号処理」と「音声認識」の技術開発に取り組み、音声の認識性能を追求しています。マルチマイクによる高性能風切音抑圧やハイブリッド音声認識などの技術を、機器形状やユースケースに合わせて最適化することにより、ウェアラブル機器の徹底的な使い勝手の良さを実現しています。
音声信号処理・音声認識のイメージ:1.「明日の予定を教えて」と音声で入力 2.音声信号処理で認識しやすい音声に回復 3.音声波形を文字に変換 4.「明日の予定を教えて」とテキストで出力

人の「ことば」を理解し、機能を動作させる
発話意味解析

音声UIでは、音声認識の結果である文字列からユーザーの「ことば」を理解し、ユーザーの期待する動作の実行が求められます。そこで「ことば」を実行可能な情報形式(意味表現)に変換する「発話意味解析技術」の開発をしています。話し方の多様性を吸収するための機械学習技術と設計者の意図を反映するためのヒューリスティック処理をハイブリッドで用いることにより、高精度の機器操作を実現しています。

曖昧な「ことば」も正しく解釈する
自然言語処理・知識情報処理

ユーザーの「ことば」をシステムが正しく解釈するためには、言い換え表現や省略などの曖昧性を含む言語情報を解析する技術が必要になります。音声UIを支えるバックエンド技術として、単語や複合語の切り出し、品詞や属性の付与、構文構造の抽出など発話文を解析する「自然言語処理」と、曖昧性を解決するための「知識情報処理」の技術開発を進めています。
発話意味解析のイメージ:1.「カラヤン指揮のベートーベンの第九をかけて!」と音声入力 2.音声を認識し自然言語処理・知識情報処理の技術で発話意味解析を行う 3.実行可能な意味表現(操作命令:音楽/再生 artist:ベルリンフィル music:交響曲第九番)に変換 4.音楽アプリを起動

For the Future
人のしぐさに反応する「対話エージェント」の実現へ

「音声信号処理・音声認識」に「画像認識」等を加えたマルチモーダル(五感)なセンシング技術と、一般知識処理などの技術を統合することにより、ユーザーの声やしぐさに反応し、人々の生活・行動を適切にアシストする「対話エージェント」の実現を目指します。

この技術領域に関わる
社員のインタビュー

「新入社員奮闘中!」
戸塚 典子
「職種別社員紹介」
朝川 智
このページの先頭へ