面向产品垃圾评论识别的特征工程Feature Engineering for Product Review Spam Identification
曾德胜;黄发良;潘传迪;
摘要(Abstract):
特征工程是产品垃圾评论识别研究中的关键技术之一,绝大多数现有的垃圾评论检测方法都是根据先验知识进行特征选择与指标定义,这类方法主观性过强从而难以应用推广.以电子商务平台"天猫"热销产品评论为研究对象,提出基于评论数据预分析的垃圾评论识别特征工程,然后运用决策树进行垃圾评论检测.实验表明,与其它基于先验的特征工程相比较,该方法能有效提升垃圾评论分类的效果.
关键词(KeyWords): 产品垃圾评论;特征工程;决策树
基金项目(Foundation): 浙江省智慧医疗工程技术研究中心开放基金(ZH2016004);; 福建省教育厅资助项目(JA13077)
作者(Authors): 曾德胜;黄发良;潘传迪;
参考文献(References):
- [1]聂卉,王佳佳.产品评论垃圾识别研究综述[J].现代图书情报技术,2014(2):63-71.
- [2]HEYDARI A,TAVAKOLI M A,SALIM N,et al.Detection of review spam:a survey[J].Expert Systems with Applications,2015,42(7):3634-3642.
- [3]林煜明,王晓玲,朱涛,等.用户评论的质量检测与控制研究综述[J].软件学报,2014,25(3):506-527.
- [4]JINDAL N,LIU B.Analyzing and detecting review spam[C]∥IEEE International Conference on Data Mining,2007:547-552.
- [5]LI F,HUANG M,YANG Y,et al.Learning to identify review spam[C]∥IJCAI,2011:2488-2493.
- [6]何海江,凌云.由Logistic回归识别Web社区的垃圾评论[J].计算机工程与应用,2009,45(23):140-143.
- [7]秦成磊,魏晓,曹红兵.基于书写行为与语义特征的评论有用性评估[J].计算机工程与应用,2016,52(6):117-121.
- [8]OTT M,CHOI Y,CARDIE C,et al.Finding deceptive opinion spam by any stretch of the imagination[J].Computer Science,2011(1):309-319.
- [9]MUKHERJEE A,VENKATARAMAN V,LIU B,et al.What yelp fake review filter might be doing[C]∥ICWSM,2013:409-418.
- [10]YE J,AKOGLU L.Discovering opinion spammer groups by network footprints[C]∥Proceedings of the 2015 ACM on Conference on Online Social Networks,New York:ACM,2015:97.
- [11]MUKHERJEE A,LIU B,GLANCE N.Spotting fake reviewer groups in consumer reviews[C]∥International Conference on World Wide Web,2012:191-200.
- [12]谭文堂,朱洪,葛斌,等.垃圾评论自动过滤方法[J].国防科技大学学报,2012,34(5):153-157.
- [13]彭庆喜,钱铁云.基于量化情感的网店垃圾评论检测[J].山东大学学报(理学版),2013,48(11):66-72.
- [14]孙升芸,田萱,何军.基于评论行为的商品垃圾评论的识别研究[J].计算机工程与设计,2012,33(11):4314-4319.
- [15]吴含前,朱云杰,谢珏.基于逻辑回归的中文在线评论有效性检测模型[J].东南大学学报(自然科学版),2015,45(3):433-437.
- [16]刘逶迤,逯万辉,丁晟春.商品评论信息可信度研究[J].情报科学,2012(10):124-127.