話者性と発話交代を考慮した複数話者対話音声の認識

村井 則之  小林 哲則  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2   No.11   pp.2465-2472
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 将来技術の応用:音声認識・理解・対話
キーワード: 
複数話者対話,  統計的発話交代モデル,  話者性,  GMM,  MLLR,  

本文: PDF(622.1KB)>>
論文を購入




あらまし: 
複雑な発話の交代を含む複数話者の音声を認識するアルゴリズムについて検討した.複数話者の対話認識を扱う場合,認識システムは従来のように何を話したかだけでなく,誰がどこまで話したのかを知る必要がある.本研究ではそのような問題の解決手法として,連続音声認識システムにおける言語モデルに発話交代の生じやすさの表現を含めるとともに,各話者の声質を統計的モデルにより与えることで,発話者と発話内容を同時並行的に推定するアルゴリズムを二つ提案した.テレビのスポーツニュースにおける対話部分を対象とした認識実験の結果,発話内容の認識と各話者の発話区間の認識を別個に行う方法に比べ,提案手法は発話内容の認識で最大29.5%,発話者の認識で93.0%の誤りを改善できることが明らかになった.