非可聴つぶやき認識

中島 淑貴  柏岡 秀紀  キャンベル ニック  鹿野 清宏  

誌名
電子情報通信学会論文誌 D   Vol.J87-D2   No.9   pp.1757-1764
発行日: 2004/09/01
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 論文
専門分野: 音声,聴覚
キーワード: 
インタフェース,  音声認識,  非可聴つぶやき,  Non-Audible Murmur(NAM),  NAM認識,  

本文: PDF(655.4KB)>>
論文を購入




あらまし: 
「非可聴つぶやき認識」という,新しいスタイルの実用的な入力インタフェースを提案する.これは音声認識の雑音に対する脆弱性,情報の周囲への漏えい性を克服するため,声帯の振動を伴う通常音声の空気伝搬ではなく,「非可聴つぶやき(Non-Audible Murmur: NAM)」,つまり第三者に聴取不能な声帯の振動を伴わない調音呼気音の体内伝導を,体表からサンプリングし,HMMを用いて認識するものである.これを実現するための基礎として,第一に医療用膜型聴診器の原理を応用した体表接着型マイクロホンを開発した.第二として体内を伝導するNAMを採取して認識するために最適な接着位置を発見した.第三としてNAMの音響学的性質を検討した.第四として,この部位から採取されたサンプルを用い,HMM音響モデルに追加学習してNAM音響モデルを作成した.これらをもとに,日本語ディクテーション基本ソフトウェアを評価に用い,認識エンジンJuliusを使用して大語い連続認識実験を行い,NAM認識の実用可能性を検討した.