音声対話と意図抽出
高齢者の情報支援のための音声対話技術とは?
高齢者の情報支援を行うロボットシステムには、音声対話技術が使われます。しかし、軽度認知症者を含む高齢者との対話中の音声を正確に認識することは困難で、多くの技術的課題があります。それらに対応するための音声対話技術として、次のようなものがあります。利用者のニーズと現場で発生する問題に対応して有効な技術を選択することが重要です。
-
高齢者の声の性質に合わせる話者適応技術
-
生活環境の雑音に対応する雑音除去技術やマイクアレイ技術
-
自発的発話における発声の揺れに対応するサブワード単位の音声認識技術
-
発話内容をテキスト化するのではなく、発話全体の特徴から意図を取り出す技術
-
意図の抽出に、言語的特徴だけでなく、韻律情報(イントネーション)を利用する技術
-
話し方や認識結果に応じて、言い直しや聞き返しなど、対話の進行を動的に制御する対話プラニング技術
-
ロボットが話している途中でも、割り込んだ返事を認識できる、バージイン技術
-
音声とそれ以外の音とを区別する音声区間検出(VAD)技術