摘要:
本文运用迁移学习思想,在AI Challenger2018数据集上训练细粒度情感分析模型RAM,并应用于景区和酒店数据集的情感极性提取。基于RAM模型预测结果,围绕“游客目的地印象分析”这一主题,分别完成印象词云分析、目的地综合评价、网评文本有效性分析、目的地特色分析四个任务。
针对任务1,使用TF-IDF权重计算关键词热度,并生成目的地TOP20印象词云表;针对任务2,基于RAM模型推断结果,将目的地特征表示为五维向量,并训练Adaboost回归模型拟合专家评分;针对任务3,分别使用编辑距离、词序列长度、情感极性三项指标,检测简单复制修改、无价值信息、内容不相关等三类无效文本;针对任务4,结合RAM预测结果与任务1-3的结论,对各目的地特色作出详细分析。
关键词:细粒度情感分析;迁移学习;RAM模型;游客印象;目的地评价