应用矩阵填充的微博预测模型Microblog Prediction Model Based on Matrix Completion
林育曼;文海宁;饶浩;
摘要(Abstract):
以微博为代表的社会媒体影响力越来越广泛深远.为有效预测微博热点并进行导控,首先批量获取经中文分词处理后的数据,以用户转发、评论、点赞次数为代表做数据预处理,通过相似度比较选出最佳微博填充矩阵模型.其次通过多种回归分析的比较与实践,用逐步回归法确定微博热点影响因子,进而用多元回归预测模型建立预测模型方程,计算精确度、准确率、召回率,并确定阈值.实验证明该预测模型能够保持较好的准确率,并可通过选择合适的阈值,进一步提升精确度.
关键词(KeyWords): 微博;矩阵填充;预测模型;回归分析
基金项目(Foundation): 教育部人文社会科学研究资助项目(13YJCZH144);; 广东省哲学社会科学规划项目GD13CJY07);; 广东省攀登计划项目(pdjh2015a0471)
作者(Authors): 林育曼;文海宁;饶浩;
参考文献(References):
- [1]张彦超,刘云,张海峰,等.基于在线社交网络的信息传播模型[J].物理学报,2011,60(5):66-72.
- [2]赵龙文,公荣涛,陈明艳,等.基于意见领袖参与行为的微博话题热度预测研究[J].情报杂志,2013,32(12):42-46.
- [3]陈江,刘玮,巢文涵,等.融合热点话题的微博转发预测研究[J].中文信息学报,2015,29(6):150-158.
- [4]李洋,陈毅恒,刘挺.微博信息传播预测研究综述[J].软件学报,2016,27(2):247-263.
- [5]苑卫国,刘云,程军军.微博网络中用户特征量和增长率分布的研究[J].计算机学报,2014,37(4):767-778.
- [6]徐建民,粟武林,吴树芳,等.基于逻辑回归的微博用户可信度建模[J].计算机工程与设计,2015(3):772-777.
- [7]柯赟.新浪微博信息传播的影响因素分析与效果预测[J].现代情报,2016,36(3):22-26.
- [8]田向国,肖林鹏,刘铁英,等.新浪微博信息传播路径阻碍因素分析及传播效果预测[J].情报科学,2016,34(5):91-94.
- [9]师亚凯,马慧芳,张迪,等.融合用户行为和内容的微博用户影响力方法[J].计算机应用研究,2016,33(10):1-5.