首页 > 期刊 > 自然科学与工程技术 > 信息科技 > 计算机软件及计算机应用 > 智能计算机与应用 > 基于序列到序列模型的文本到信息框生成的研究 【正文】

基于序列到序列模型的文本到信息框生成的研究

鲍军威; 周明; 赵铁军 哈尔滨工业大学计算机科学与技术学院; 哈尔滨150001; 微软亚洲研究院; 北京100080
  • 文本到信息框生成
  • 序列到序列模型
  • 注意力机制
  • 拷贝机制

摘要:本文展示了一种序列到序列的模型(Seq2Seq)来基于文本生成信息框(Infobox),信息框指的是一组"属性-值"对。该模型以端到端的方式工作,可利用一个编码器将一个文本段落表示成一个隐向量序列,然后通过解码器来生成信息框。本文在WIKIBIO数据集上进行实验。研究提出的序列到序列模型取得了58.2的F1值,该结果比流水线式的基准方法显著提升了21.0个百分点。实验结果表明,本模型具有以生成序列的方式来生成"属性-值"对的能力。引入注意力与拷贝机制可以提升模型的准确率。更重要的是,研究观察到该拷贝机制有能力从输入文本中拷贝稀有词来生成目标端信息框中的"值"。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

投稿咨询 免费咨询 杂志订阅

我们提供的服务

服务流程: 确定期刊 支付定金 完成服务 支付尾款 在线咨询