テキスト情報に対応した口形状変化を有する顔動画像の合成

金子 正秀  小池 淳  羽鳥 好律  

誌名
電子情報通信学会論文誌 D   Vol.J75-D2   No.2   pp.203-215
発行日: 1992/02/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (マルチメディアにおけるパターンの認識・生成技術論文小特集)
専門分野: 
キーワード: 
知的画像符号化,  モデルベース符号化,  メディア変換,  顔動画像,  音声の規則合成,  

本文: PDF(1.2MB)>>
論文を購入




あらまし: 
人間が互いにコミュニケーションを行う場合には,テキスト,画像,音声等の異なる情報伝達メディアを複合的に利用している.また,ユーザが望みの形態で情報を受け取ることを可能とするという観点から,これらのメディア相互間での変換技術の重要性が高まってきている.本論文では,顔動画像のモデルベース符号化における人物頭部の3次元形状モデルを用いた顔動画像合成手法を利用して,入力テキストに対応した口形状変化を有するリアリティのある顔動画像を生成し,合成音声と同期させて出力する方法について述べる.具体的な手順としては,まず,既開発のテキストからの音声の規則合成ルーチンをベースとし,同ルーチンから音素単位に音韻特徴と持続時間の情報を得る.この音韻特徴に基づいてあらかじめ定めた規則により音素ごとの口形特徴を導出し,更に具体的な口形状パラメータ値の割当てを行う.次に,頭部の3次元形状モデルにおける口部分の形状を口形状パラメータ値に基づいて変化させた後,形状モデルへの濃淡付与を行い,リアルな顔動画像を合成する.以上の方法を用いることにより,任意の入力テキストに対して自然な口形状画像を合成することが可能となる.