十分統計量と話者距離を用いた音韻モデルの教師なし学習法

芳澤 伸一
馬場 朗
松浪 加奈子
米良 祐一郎
山田 実一
李 晃伸
鹿野 清宏

誌名
電子情報通信学会論文誌 D   Vol.J85-D2    No.3    pp.382-389
発行日: 2002/03/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
音韻モデル,  話者適応,  十分統計量,  教師なし学習,  

本文: PDF(715KB)>>
論文を購入



あらまし: 
十分統計量と話者距離を用いた音韻モデルの教師なし学習法を提案する.提案法では,音響的に近い話者群の十分統計量を用いて統計処理計算により正確に適応モデルを構築する.提案法では,(1)発声話者に音響的に近い話者を選択し,(2)選択された話者の十分統計量を用いて発声話者に適応した音韻モデルを作成する.十分統計量の計算は適応処理の前にオフラインで行う.提案法では発声話者の音響的に近い話者群の十分統計量を用いて統計処理計算に基づき適応化を行うため高い認識率を獲得することができる.また,少量の発声文章で適応処理が行われる.更に,十分統計量をオフラインで計算することにより適応時の処理が短時間で行われる.話者クラスタリングによる方法と比較すると,提案法では発声話者のデータによりオンラインで動的に話者クラスタを決定するため,適切な話者クラスタを獲得することができる.認識実験により,少量の発声文章により適応を行った場合,MLLRより高い認識率を獲得できることを示す.