音声対話と意図抽出

研究の概要

実証実験

ロボットによる情報支援の有効性と効果検証のため, 実際の高齢者住宅に長期間設置して実証実験を実施
8名の被験者に対して延べ40ヶ月の音声対話データを取得

システム構成

意図抽出モジュールをクラウドサーバ上に実装
端末で取得された音声は HTTPS プロトコルにより暗号化してサーバに送信
サーバでは, サブワード音声認識と基本周波数(F0)を抽出した後、意図(対話行為タグ)を認識
ネットワーク上の管理画面で入力した対話シナリオと、意図認識結果に基づいて、端末上のアプリで対話の進行を制御

結果

1,145回の情報支援
4,458発話を抽出
音声検知の平均検出率: 68.8%
平均検出精度: 85.9%

3_3_2_1.png

得られた知見

  1. ① ある程度規定された情報提示の枠組みのもとでも、音声対話の応答内容や発話スタイルには大きな多様性があり、 それに対応可能な柔軟な音声認識モデルや対話モデルの構築が重要
  2. ② 生活スタイルによって環境雑音も多様であり、それに応じた雑音対策が必要