小学生音声データベースを用いた子供音声認識の検討

小川 厚徳
山口 義和
松永 昭一

誌名
電子情報通信学会論文誌 D   Vol.J87-D2    No.8    pp.1572-1580
発行日: 2004/08/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
子供音声認識,  小学生音声データベース,  音響モデル,  クラスタリング,  

本文: PDF(1.4MB)>>
論文を購入



あらまし: 
本論文では,小学生音声データベースの構築と,それを用いた子供音声認識の検討について報告する.従来の音声認識研究は,成人の音声を用いて行われたものがほとんどであり,子供や高齢者の音声を対象にしたものは少なかった.特に,国内における子供音声認識の検討は,データベースや実験内容の面で不十分であった.本研究では,まず,子供音声の収録を円滑に行うための専用のシステムを構築し,小学生を対象に,学年及び性別のバランスのとれた単語発声データベースを構築した.次に,構築した小学生音声データベースを用いて子供音声認識実験を行った.まず,全学習データより作成した小学生音響モデルと既存の成人音響モデルを用いて評価データに対して単語認識実験を行い,学年ごとの認識率の変化の傾向を明らかにした.次に,得られた実験結果をもとに,学習データのクラスタリングの検討を行い,認識率の改善を得た.また,クラスタリングに加え,成人音響モデルを利用することにより,更に認識率の改善が得られることを示す.