小規模会議のステレオ録音を対象とした話者同定法

浅野 太  佐藤 加奈子  小沢 絵里子  

誌名
電子情報通信学会論文誌 A   Vol.J101-A   No.5   pp.60-69
発行日: 2018/05/01
Online ISSN: 1881-0195
DOI: 
論文種別: 論文
専門分野: 電気音響,音響一般
キーワード: 
話者同定,  ステレオ録音,  GMM,  HMM,  

本文: PDF(1.1MB)
>>論文を購入


あらまし: 
小規模の会議において,ICレコーダなどで録音した音声から,発話者を同定する手法を提案する.この手法の特徴は,話者の音声サンプルなどを用いた事前学習や,マイクロホン配置などの事前情報を必要としない点であり,議事録作成のコストをかけられない小規模会議に適している.ICレコーダで用いられているシングルポイント・ステレオマイクロホンで収録した音声のチャネル間レベル差を特徴量とし,これを混合ガウス分布モデルによりクラスタリングすることにより,話者同定を行う.更に,混合ガウス分布モデルの学習で得られたモデルパラメータと,状態遷移を抑制するよう設計した状態遷移パラメータを用いた隠れマルコフモデルにより,発話区間内のショートポーズなどを取り除き,平滑化する手法も提案する.実験の結果,3人の話者による音声データに対し,80%程度の識別率が得られた.