国立研究開発法人情報通信研究機構
音声認識の新次元!End-to-End型ニューラルネットワークを活用した音響モデルの学習装置

国立研究開発法人情報通信研究機構
音声認識の新次元!End-to-End型ニューラルネットワークを活用した音響モデルの学習装置
本発明は、音声認識技術の一つである音響モデルの学習装置に関するもので、End-to-End型ニューラルネットワークを用いています。学習音声を全体的に分析し、仮説を構成する単語列の生成を行います。学習音声の全体に対して音声認識を行い、仮説及び学習データの正解サブワード列に基づく認識精度を算出します。この結果を元に、音響モデルのパラメータセットを更新し、音声認識の精度を向上させています。さらに、終了条件が満たされるまでこのプロセスを繰り返し、最適な音響モデルのパラメータセットを得ることを可能にしています。
つまりは、この特許は、音声認識技術における音響モデルの学習装置に関するもので、End-to-End型ニューラルネットワークを活用している。
AIによる特許活用案
おすすめ業界 IT音響技術AI開発
- 音声認識技術の精度向上
- AI音声アシスタントの進化
- 進化した音声認識技術を活用した新サービスの開発
本特許を活用することで、音声認識技術の精度向上を図ることが可能です。音響モデルのパラメータを最適化することで、音声認識のエラー率を低減し、ユーザー体験を向上させることができます。
本特許の技術は、AI音声アシスタントの進化に寄与します。より精度の高い音声認識能力を持つAI音声アシスタントは、ユーザーとのコミュニケーションをスムーズにし、より便利なサービスを提供することが可能となります。
本特許の技術を活用し、音声認識を必要とする新たなサービスや製品の開発を行うことができます。例えば、音声を活用した健康管理アプリ、教育アプリ、エンターテイメントサービスなど、様々な分野での新たなビジネスチャンスを創出することが可能です。
活用条件
- サブスク
- 譲渡
- ライセンス
商品化・サービス化 実証実験 サンプル・プロトタイプ
特許評価書
- 権利概要
出願番号 | 特願2016-197107 |
発明の名称 | 音響モデルの学習装置及びそのためのコンピュータプログラム |
出願人/権利者 | 国立研究開発法人情報通信研究機構 |
公開番号 | 特開2018-060047 |
登録番号 | 特許第0006884946号 |
- サブスク
- 譲渡
- ライセンス
準備中です