音声トランスクリプションのこれまでと今後の展望

古井 貞煕  

誌名
電子情報通信学会論文誌 D   Vol.J83-D2    No.11    pp.2059-2067
発行日: 2000/11/25
Online ISSN: 
DOI: 
Print ISSN: 0915-1923
論文種別: 特集招待論文 (音声情報処理:現状と将来技術論文特集)
専門分野: 
キーワード: 
音声トランスクリプション,  大語彙連続音声認識,  統計的パターン認識理論,  意図理解,  

本文: PDF(4.2MB)>>
論文を購入



あらまし: 
統計的パターン認識理論,ケプストラムとデルタケプストラム,隠れマルコフモデル,統計的言語モデルを基本とする音声トランスクリプション(音声文字変換),広くは大語彙連続音声認識の技術が近年大きく進展し,音声ワープロ,放送への自動字幕付与,情報検索への適用など,種々の応用が展開しつつある.本論文では,これまでの研究の展開と基本技術,残されている課題について解説し,今後の展望を述べる.特に,種々の変動を含む話し言葉に対応できる適応的言語モデル及び音響モデルの構築,そのための話し言葉の大規模コーパスの作成,音声から話題語を抽出し,話し手の意図を理解し,要約する機能の実現の重要性などに焦点を当てる.