首页 > 期刊 > 自然科学与工程技术 > 工程科技II > 电力工业 > 电力大数据 > 一种基于最小距离编辑法的模糊地址识别模型 【正文】

一种基于最小距离编辑法的模糊地址识别模型

金鹏; 杨菁; 王宗伟; 刘鲲鹏; 卜晓阳; ZHENG; Xuan 国家电网有限公司客户服务中心; 天津300309
  • 模糊地址识别
  • 文本相似度计算
  • 最小编辑距离法
  • 支持向量机
  • 谐音字识别

摘要:由于受到客户方言及语言习惯因素影响,加之客户服务中心客服坐席手工记录客户地址的形式不统一,难以实现精确筛选细化到小区、村庄级别的相近地址,支撑定位客户反映的频繁停电等问题。该文提出了一种地址模糊匹配模型,根据地址信息的文本和拼音形式,利用最小编辑距离算法量化非结构化客户地址间的偏差程度。进一步应用支持向量机分类技术,结合地址文本信息和拼音信息的编辑距离计算结果,实现对相近地址的有效识别。试验结果表明,该方法可以克服谐音字对地址识别的影响,具有计算速度快且识别能力强的优势,能够支撑筛选频繁停电地址等场景应用。另外,通过网格搜索法的应用,实现了支持向量机分类器主要参数的优化,提升了模糊地址匹配的精度。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

投稿咨询 免费咨询 杂志订阅

我们提供的服务

服务流程: 确定期刊 支付定金 完成服务 支付尾款 在线咨询