首页 > 期刊 > 自然科学与工程技术 > 基础科学 > 地球物理学 > 地球信息科学学报 > 主题模型在基于社交媒体的灾害分类中的应用及比较 【正文】

主题模型在基于社交媒体的灾害分类中的应用及比较

苏凯; 程昌秀; Nikita; Murzintcev; 张婷 北京师范大学地理科学学部; 地理数据与应用分析中心; 北京100875; 中国科学院地理科学与资源研究所; 北京100101
  • 主题模型
  • btm
  • lda
  • 推文
  • 主题分类

摘要:“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明:①在区分主题近似的短文本时,BTM总体精度为0.598.LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;②BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

投稿咨询 免费咨询 杂志订阅

我们提供的服务

服务流程: 确定期刊 支付定金 完成服务 支付尾款 在线咨询