国立大学法人豊橋技術科学大学
発音学習の未来を開く、発音動作可視化装置

国立大学法人豊橋技術科学大学
発音学習の未来を開く、発音動作可視化装置
本特許では、発音動作を可視化し、音声を合成する装置について詳細に述べられています。特に、調音特徴系列を声道パラメータ系列に変換する手段や、音声を合成する手段を備えています。さらに、座標ベクトル系列変換手段は、予め複数話者の音声から抽出した声道パラメータを入力データとし、発話状態の透視画像から計算された声道パラメータに対応する調音器官の座標ベクトルを教師データとします。また、画像生成手段は座標ベクトルの時系列を非線形に平滑化し、調音器官の座標値を曲線補完します。加えて、調音器官のうち音源部位を特徴ある状態の画像を生成し、理想とすべき発音動作における座標ベクトル系列から目標画像を生成します。
つまりは、本特許は、発音動作を可視化し音声を合成する装置について説明しています。
AIによる特許活用案
おすすめ業界 教育言語学人工知能
- 発音学習アプリケーションの向上
- 言語学研究の進展
- 音声認識技術の向上
本技術を用いて、発音学習アプリケーションを改善します。ユーザーの発音動作を可視化し、音声を合成することで、発音の誤りを具体的に指摘し、改善方法を示すことが可能になります。
発音動作の視覚化と音声合成機能を活用して、言語学の研究を推進します。特に、調音器官の運動や音声の変化を詳細に調査することで、言語学における新たな発見を促進することが可能です。
本特許の技術を活用し、音声認識技術の精度を向上させることができます。音声認識システムは、声道パラメータや調音器官の動きを理解することで、より正確な音声認識を可能にします。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2013-531279 |
発明の名称 | 発音動作可視化装置および発音学習装置 |
出願人/権利者 | 国立大学法人豊橋技術科学大学 |
公開番号 | WO2013/031677 |
登録番号 | 特許第0006206960号 |
- サブスク
- 譲渡
- ライセンス
準備中です