【概要】
喉頭がんやALSなどの病気で声を失った方々のコミュニケーション手段として個人音声合成器が注目されています。しかし、従来の技術では、構音障害(注1)などがあると、合成音声が不自然になる課題がありました。東北大学と株式会社ヒューマンテクノシステムは、この課題を解決するため、NEDOの支援を受け共同研究を実施し、その成果として、AI音声変換技術(注2)をベースとした発話障害補助ソフトウェア「コノコエ」を開発しました。
【詳細な説明】
研究の背景
喉頭がんや筋委縮性側索硬化症(ALS)などのため声を失った人の生活の質(Quality of Life:QOL)を向上する手段として、あらかじめ録音した自分の音声データを使って任意のテキストを読み上げる「個人音声合成器」が注目されています。しかし、従来の個人音声合成器は録音した音声の特徴を忠実に再現するため、構音障害などで発音が不明瞭な場合、合成器の音声も不明瞭になってしまう課題がありました。
今回の取り組み
この課題の解決を目指し、株式会社ヒューマンテクノシステムと国立大学法人東北大学はNEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)の「課題解決型福祉用具実用化開発支援事業(注3)」の下、明瞭な声で自分らしく話すことができる発話障害者向け個人音声合成器の開発に関する共同研究を行ってきました。このたび東北大学の能勢隆准教授らが開発したAI音声変換技術を基に、その機能を拡張した上で健常者の音声を変換することによって、その人らしい声を保持しながら明瞭な音声を生成する発話障害補助ソフトウェア「コノコエ(注4)」が株式会社ヒューマンテクノシステムにより開発されました。
今後の展開
日常生活においてより豊かなコミュニケーションを実現するためには状況に応じて感情や話し方などを柔軟に変更することが必要となります。今後は同一の音声から平常の音声だけでなく「楽しそう」「悲しそう」などの表現豊かな音声への変換を実現することで、QOLのさらなる向上への貢献を目指します。また、AI音声変換技術を応用することで、授業などのオンライン配信や音声編集などにおける音声の多様化についても取り組んでいきます。
図 1. 循環型敵対的生成ネットワークに基づく音声変換
【用語説明】
注1 構音障害
口唇・舌・口蓋や脳機能などの障害により、話しことばを正確・明瞭に発音できない状態。
注2 課題解決型福祉用具実用化開発支援事業
研究開発項目:明瞭な声で自分らしく話せる発話障害者向け個人音声合成器の開発
事業・プロジェクト概要:https://www.nedo.go.jp/activities/EP_00375.html
注3 AI音声変換技術
深層学習などの高度な機械学習技術に基づき、音声に含まれる話者性などの特徴を変換する技術。
注4 コノコエ
重度の構音障害をお持ちの方へ、自分の声ではっきり伝わる音声合成ソフト「コノコエ」
https://konokoe.jp/
【問い合わせ先】
東北大学 大学院工学研究科 通信工学専攻
准教授 能勢 隆
E-Mail:takashi.nose.b7*tohoku.ac.jp (*を@に置き換えてください)