首页 > 期刊 > 自然科学与工程技术 > 信息科技 > 电信技术 > 数据通信 > 基于稀疏DBN和双向LSTM的视觉语音识别算法 【正文】

基于稀疏DBN和双向LSTM的视觉语音识别算法

王一鸣; 陈恳 宁波大学信息科学与工程学院; 浙江宁波315211
  • 稀疏深度信念网络
  • 双向长短期记忆网络
  • 视觉语音识别
  • 稀疏表示

摘要:唇部视觉信息作为语音识别的辅助信息一直受到广泛关注,为更好的提取唇部视觉信息,提出一种基于稀疏深度信念网络(Deep Belief Network,DBN)和双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)的视觉语音识别算法。该算法通过在DBN的目标函数后引入混合的范数和范数来实现DBN的稀疏表示,以此稀疏DBN对唇部视觉信息进行稀疏瓶颈特征的提取,再将提取的瓶颈特征送入BiLSTM进行特征的学习分类。实验表明,该算法能有效的识别唇部视觉信息。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

投稿咨询 免费咨询 杂志订阅

我们提供的服务

服务流程: 确定期刊 支付定金 完成服务 支付尾款 在线咨询