ページの先頭ヘッダーをスキップし、本文へ

make.believe Special site

Japan

本文の開始
コンテンツメニューをスキップし、コンテンツの開始へ

技術情報

顔画像認識

 ソニーの顔画像認識は、ソニーが開発したエンターテインメントロボットの、オーナーや家族の顔を認識するという技術が源流となっている。また、コンパクトなアルゴリズムを持つ点が特長であり、LSIや組み込みマイコン、Windowsマシンなどの多様な実装形態に対応することが可能なため、さまざまなソニー製品に応用されている。

顔認識の機能

 「顔画像認識」という技術は、広義には顔画像に関する情報を抽出するさまざまな技術を含む。例えば、ソニーの顔画像認識技術には以下のような機能がある。
顔検出: 複雑なシーンの中からいろいろな方向(角度)を向いた顔の領域を見つけて提示する
顔姿勢推定: 顔の向いている方向(角度)を推定する
顔パーツ検出: 顔の中の部位の位置を特定する。例えば目の中心、鼻の頭、口端など。
顔属性判別: 検出された顔のカテゴリーを分類する。例えば性別、年齢、人種、表情など。
顔識別: 登録された人物と照合し、個人の同定を行う。狭義の顔認識はこの人物を同定する機能のことを指す。
  • マルチビュー顔検出の例:正面を向いていない顔も検出。
    マルチビュー顔検出の例:正面を向いていない顔も検出。同時に顔の向きを推定する。矢印の方向が顔の向き、矢印の長さが角度(正面が0度。横に向くほど矢印が長くなる)を表している


  • 顔パーツ検出の例
    顔パーツ検出の例
  • 顔属性検出の例
    顔属性検出の例:ここでは、男女、大人と子ども、笑顔と非笑顔の判別結果を載せている。バーの長さが判別のスコアを表している。


  • 顔識別の例
    顔識別の例:登録されている人物のうち2名が該当しており、その該当者の名前を表示。その他の人物は登録されていない人物だと判定している。



統計的画像認識

 次に、最も商品化応用が進んでいる顔検出技術について解説する。

 まず特定の大きさの顔のパターンを定義する必要がある。人間の視覚は16x16画素程度の粗い画像パッチからでもそれが顔であるか顔でないかの判定をすることができる。また色に頼らずに白黒の画像からでも顔を探すことができる。そこでコンピューターでも同程度の大きさの顔画像パターンを扱う。

1. 走査することで顔を探し出す
 この顔パターンを入力画像の左上から右下まで順に走査し探す。
  • 顔パターンの例と入力画像


  • PCクラスタシステム
    PCクラスタシステム

2. 顔パターンの判定
 顔のパターンと言っても個人の違い、顔の向き、照明環境の違い、表情の違いなどさまざまな変動の要因があり、容易に定義しきれるものではない。そこで顔画像と非顔画像を多数集め、統計手法を使って顔と非顔画像を判別する関数を作成する。この際、どのような特徴量を使うかがポイントとなってくる。ソニーはコンスーマーエレクトロニクス機器でも実装が容易になるように非常にシンプルな独自の特徴量を使っている。この特徴量は組み合わせが多様であるため、演算は非常に簡単だが強力な判別能力を発揮する。

 また、解析により多くの時間を必要とするのだが、人工知能研究のために導入されたPCクラスタシステムを使用し、ソニーでは最適な特徴量を探し出しコンパクトな顔パターン辞書の作成を可能にしている。


顔検出技術の応用

 ソニーではすでに顔の検出技術がさまざまなAV機器に応用されている。大きく分けて次のように分類される。

撮る、キレイにする:
 デジタルスチルカメラ"サイバーショット"の「顔キメ」機能では撮影時に高速に顔を見つけて、AF、AE、AWBなどのカメラ制御を、顔領域が美しく撮影できるように最適にコントロールする。「スマイルシャッター」機能では顔属性判別の笑顔判別を組み合わせてシャッタータイミングを自動制御している。
 フォトプリンター"PictureStation"の「くっきり補正」では、印刷前に顔領域を検出し、逆光補正、肌色補正、ボケ補正などのイメージング処理を行っている。

検索する:
 デジタルビデオカメラ"ハンディカム"の「FaceIndex」機能では、撮影時に顔検出をすることで顔サムネイル画像を作成する。ユーザーは見たい顔のサムネイルをタッチパネルから指定することで、そこから撮影した動画を再生することができる。
 "サイバーショット"DSC-G1では、バンドルソフトウェアとの連携で顔画像の有無や大きさなどの顔検出結果のパラメータから画像ファイルの検索をすることができる。同様の機能がVAIO Movie Storyでも実現されている。

見せる:
 ブルーレイディスクレコーダーやHDD搭載DVDレコーダー"スゴ録" のスライドショー機能「x-PictStoryHD」では、顔検出の結果を使って効果的に人に焦点を当てたエフェクトを生成でき、「フェイスフレーミング」と呼ばれている。
 同様の機能が"PlayStation 3"の「ポートレートスライドショー」、VAIO Movie Story、 HDDフォトストレージで実現されている。 
  • 顔検出技術の応用



今後の技術展開

 現在、もっとも応用が進んでいるのはデジタルスチルカメラで、メーカー各社が実装を行っている。さらに、プリンターなどでの利用を含めてデジタルイメージング分野での利用が活発化している。ただ、ソニーは顔検出だけではなく、笑顔判別を利用した「スマイルシャッター」の提案なども行っており、いち早く次のステージの顔画像認識技術の機能の利用を始めている。その他の商品群でも顔認識から得られる情報を増やすことで、よりきめの細かい補正処理やコンテンツ検索、コンテンツ生成などが行えるため、今後は顔識別技術の本格的な応用が待たれている。

 このように、顔画像認識技術は今後さまざまな画像を扱う機器に導入されると考えられるが、画像から抽出された顔の特徴などを表すメタデータをどのように管理し機器間の連携を図っていくかという点も、ユーザーの利便性を上げていくための課題だ。




本文の終了フッターをスキップし、ページの終了へ
Copyright 2012 Sony Corporation
ページの終了ページの先頭に戻る