順位統計量を用いたテキスト独立型話者照合手法

岡本 悠  柘植 覚  堀内 靖雄  黒岩 眞吾  

誌名
電子情報通信学会論文誌 D   Vol.J94-D   No.9   pp.1551-1560
発行日: 2011/09/01
Online ISSN: 1881-0225
DOI: 
Print ISSN: 1880-4535
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
順位統計量,  T-norm,  コホート話者,  GMM,  

本文: PDF(697.2KB)>>
論文を購入




あらまし: 
本論文では,順位統計量を用いた話者照合手法を提案する.順位統計量は,入力音声に対する申告話者,多数の背景話者モデル(GMMs)とのゆう度の比較で得られる順位そのものを指す.我々はこの順位統計量に対して,しきい値処理を行い照合する.提案手法ではT-normと同様に背景話者モデル数に比例して計算コストが増える.そこで提案手法の照合コストを下げるためにコホート話者を利用した手法も併せて提案する.評価のために,科学警察研究所が構築した『大規模話者骨導音声データベース』に収録されている男性283名の気導音声を用いて実験を行った.T-normを用いた場合のEER2.24%に対して,提案手法のEERは2.17%だった.また,コホート話者を用いた場合は282名から約80%の人数を削減した平均57名分の順位統計量の計算で,282名の話者を用いた場合と同等の性能を達成した.