虚假评论特征研究

王召义 薛晨杰

摘 要:虚假评论的存在极大降低了在线评论的可信度与参考价值。虚假评论有着不同于真实评论的目的和动机,所以虚假评论会表现出与真实评论不同的特征属性。以虚假评论的目的和动机为切入点,采用内容分析法,从评论文本、评论者行为两个方面对虚假评论特征进行深入的归纳、分析和总结。为建立更有效的虚假评论识别算法或机制提供理论依据,为建立诚实有序的电商市场规范提供实践参考。

关键词:虚假评论;特征;评论文本;评论者行为

中图分类号:F27 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2020.27.029

随着电子商务的高速发展,社交媒体成为人们获取信息的重要渠道。在线评论不仅出现在各大电商平台,还充斥着自媒体平台及专业推荐点评网站。与此同时,在线评论通常表达了消费者对商品的实际使用体验及主观观点,已经成为影响消费者购买决策的重要因素之一,进而影响了产品的推广和销售。正面评价较多的商品,可以大大激发消费者的购买欲望,而负面评论尤其是居于前列、描述详细的差评则会直接打消消费者的购物念头。因此,在经济利益的驱使下,某些企业或个人为了推广或诋毁特定的产品,故意发布虚假的在线评论。这些虚假评论不但危害了消费者对产品的正确认知,还影响了商家的推广、销售等正常的营销活动,对电子商务秩序造成严重冲击,必须准确识别出来,才能找到有效的防治措施。而要识别出虚假评论,就要先熟悉其独有的特征,再据此将其过滤掉,最终还企业、消费者一个公平公正的电子商务交易环境。

1 虚假评论动机

虚假评论是由商家通过雇佣人员(常被称为“水军”)有意发表的虚假的、有欺骗性质的评论,其目的是为了提升或者损坏某一商品(服务)或某一类商品(服务)的声誉进而误导潜在消费者,使其做出具有风险性的消费决策。对于商家来说,正面评论往往意味着利润和好口碑,所以有足够的动力操纵评论;对于消费者个人来说,如果蓄意给予企业虚假的负面评论,则常常可以获得企业的经济赔偿。结合国内外学者、专家对虚假评论的动机研究,本文将虚假评论的动机分为三类:破坏动机、推广动机和诋毁动机。刘兵提出的“虚假评论和产品质量的关系”,对于理解、研究虚假评论动机十分有益。消费者购买商品,最关注的就是商品质量。在这里,我们假设已经知道产品的真实质量,表1给出了虚假评论和产品质量的关系。

(1)推广动机。推广主要为了提升品牌或产品的知名度、美誉度,利用个人(职业虚假评论者、企业的朋友和家人、企业经营者和员工、给予奖励的真实顾客等)和群体(专业的虚假评论组织),在刚开张或提报活动需要基础好评、无竞争优势急需流量销量以及掩盖居于重要位置的差评时,通过各种方式获取虚假的正面评论。区域1、3和5的虚假评论的目的就是为了推广该产品。虽然在区域1表达的观点与产品实际情况相吻合,但评论者没有披露其背后的利益冲突或隐藏的动机。例如,很有可能是为了快速提升人气或符合某项活动条件。区域3和5就有非常明显的推广动机,这样的企业最有可能雇佣专业的虚假评论组织或团队,在短期内对产品进行大量的正面评价,以获取最大推广效果。

(2)诋毁动机。诋毁主要针对的是商家给予竞争对手或消费者给予商家的虚假负面评论。商家甚至是一些声誉度比较高的企业利用个人或群体在各销售及展示平台上散播对竞争对手不利的评论、测评等,以达到报复的目的;某些唯利是图的消费者则故意给商家虚假消极评论,以获得一些经济赔偿。区域2、4和6中的虚假评论目标就是为了诋毁产品。虽然在区域6的评论可能是中肯的,但评价者可能含有恶意的动机,例如报复竞争对手或获取经济补偿。区域2和4的诋毁动机十分明显,特别是区域2,把“好”的说成“坏”的,严重干扰消费者购买决策。很有可能是竞争对手为了削弱竞争力更强的企业的实力和口碑,而雇佣“水军”来诋毁对手;也或者企业为了防止某些方面比如价格对自身销售有一定冲击性的竞争对手“上位”,假冒消费者对对方产品其他方面如质量进行诋毁式的攻击。

(3)破坏动机。那些与商品本身毫无关系的评论、只关于品牌的评论、将顾客引入其他平台比如淘客或微商的广告评论等,这种评论的动机是破坏正常的评论秩序,对于消费者而言是一种干扰性信息,损害了评论的真实借鉴意义。此类评论形式多为一些个人或商家为了借助平台的流量来为自己打广告,以及发布一些与商品使用本身丝毫不相关的评论。因此,整体看来,区域1和6的虚假评论不具破坏性,但是营造了不公平的市场环境,长期以来则可能使在线评论变得无用,让商家之间互相攻击。区域2、3、4和5的虚假评论是十分有害的,严重干扰了潜在消费者的购买决策,且区域2和4的虚假评论对于企业来说也是有害的。与此同时,我们无法获知有害虚假评论的比例,也无法分辨出评论所属区域,因此很难评估出虚假评论的危害程度。

综上,虚假评论识别应侧重于主要由推广动机、诋毁动机促成的区域2、3、4、5的虚假评论。现有的虚假评论识别研究主要集中在两个方向:第一类是通过检测用户的评论文本内容,从语义、情感、描述和字符等方面区分真实评论和虚假评论;第二类是通过对虚假评论者的评论行为特征进行深层次的分析和挖掘,从而区分虚假评论者和真实评论者。随着大数据技术的发展,虚假评论识别技术也在不断发展、完善,但是不管采用哪一类虚假评论识别方法,都要先深入分析虚假评论的动机,充分剖析、挖掘、归纳虚假评论特征,才可以不断提升识别虚假评论的准确率。

2 虚假评论特征

目的不同,行为就不同,虚假评论也不外乎如此。本文从评论文本特征和评论者行为特征两个方面深入探讨虚假评论的特征,以帮助商家、平台、消费者个人等利益相关者更好的熟悉虚假评论特征及更高效地识别出虚假评论。

2.1 评论文本特征

评论者通过语言表达其对评论对象的感受、观点或情感,而虚假评论实际是评论者编造的谎言,其内容建立在不真实的购物及使用经历上,必定会在评论的语言运用中留下虚假线索。通过对大量虚假评论的剖析、归纳,评论文本特征主要体现在以下几個方面。

(1)评论主题。消费者在表达对商品的主观观点时,一定会针对特定商品或主题进行评论,极少会出现离题万里的现象。例如,如果评论者在电脑商品评论中,发表关于相机的描述,那么该评论是虚假评论的可能性非常高。因此,如果评论内容和产品出现文不符题的情况,则可能存在虚假评论。

(2)评论情感倾向。在线评论主要是表达消费者对商品的使用效果的主观情感,没有主观情感的评论往往是“有问题”的评论,因为消费者不愿意浪费时间去发布一个无任何主观情感或观点的评论。而另一方面,如果主题情感信息过度强烈、情感词过度集中,过于有意夸大、强调主观情感倾向,则也可能表明此条评论是虚假的。

(3)评论文本的长度。消费者往往会对商品进行多角度的评价,也会较为明确的描述出商品的优劣,为了便于自己撰写及他人阅读,评论文本的长度比较适中,多数控制在140个字左右。而虚假评论涉及编写不真实的购物和使用经历,有可能没有太多可以写的,或至少一个有偿的虚假评论者可能不希望投入过多的时间来写评论,因此可能评论字数非常少。当然,也有很多虚假评论是直接复制粘贴而来,但为了提升可信度,字数又异常之多。

(4)主客观比例。消费者对所购商品的评论中,往往带有明显的主观色彩,如果评论者所给出的评论中过多地在客观描述,那么它仅仅起到广告的作用或者只是在描述产品而已,并未起到评论所应该起到的作用。因此,在商品评论中,如果存在大量的客观描述的评论,则虚假评论可能性比较高。

(5)正负向比例。消费者对所购商品的评论中表达自己的切身体会时,往往是从正负向分别表达自己的情感,这符合正常的购物体验,也是消费者最直观的感受,会表达对所购商品的满意面,当然也会体现出不满意的一面。因此,一个产品仅仅有表达正面或负面情感的评论,这个产品很有可能遭到了虚假评论。

(6)评论内容相似性。虚假评论者为了赶时间或尽快完成发布评论任务,常常复制或修改已有的类似产品的评论,这样评论之间的相似度就比较高。另一方面,如果评论之间的相似度值太低,说明存在一些无意义的评论,这些评论可能都是一些广告。

(7)评论文本中第一人称和第二人称的使用。在传统谎言中,说谎的人倾向于少用第一人称代词,其目的在于将自己与所编写的谎言撇开关系。相反,虚假评论者的行为完全不同。实际上,他们喜欢用更多的第一人称代词而不是第三人称代词,如我、我的、我们等。这样使他们的评论看起来更具有说服力,并且给读者的印象是他们的评论是基于自己的真实体验和评价。

评论文本特征的提取方法主要是在评论的词汇、句子、语篇及语义的层面上进行词法、句法和语义分析以获取其语言和文本特征,虚假评论的识别可以从以上方面来进行,符合条件越多的评论为虚假评论的可能性就越高。

2.2 评论者行为特征

真的假不了,假的真不了。虚假评论者发布评论的目的与真实评论者不同,其评论行为特征必然与真实评论者行为特征不同。虚假评论者行为有两种类类型:群体行为和个体行为。群体行为是一组相识或不相识的评论者或账户,共同协作以推销或诋毁某些产品或服务;个体行为是自己使用单一账户来写虚假评论。相对而言,群体行为损害性更大,由于成员数量非常多,可以完全操纵产品的评论。尤其是在产品刚发布时,更易于误导潜在消费者,对电商企业尤其是中小型的电商店铺影响非常大。

(1)爆发式行为(RB)。爆发式行为是指在短时间内产品评论数量呈爆炸式增长的一种现象。在正常情况下,产品评论是随机产生的,评论时间呈随机分布状,评论集中产生的概率非常低。但有的时候,产品评论也会爆发式增长,比如产品的知名度突然增加或者该产品参加了促销活动,也可能是产品受到了虚假评论攻击。虚假评论者在较短时间间隔内多次发表评论,以达到快速影响评论对象综合评分、操纵评论情感倾向的目的。一般通过计算评论者首次评论时间和最近一次评论时间的接近程度,用来捕捉爆发式行为特征。

RBpg,p=0,(L(g,p)-F(g,p)>τ)1-L(g,p)-F(g,p)τ

RB(g)=maxp∈PgGTWpg,p

其中,g代表群组,p代表产品,Pg是由组g评论过的所有的产品的集合,τ为爆发期阈值(有学者设定其值为20天),Lg,p和Fg,p分别是群组g评论产品p的最近和最早日期。因此,RBpg,p给出了群组g对于产品p的评论时间差信息。如果这个时间差比τ长,则认为不太可能是虚假评论行为,否则则认为群组g在很短的时间内突发评论了产品p,这更容易被认为是虚假评论行为。RB(g)考虑了群组g所有评论过的产品Pg,并取最大值,从而捕捉到该组最严重的爆发式行为特征。对于后文的群体行为特征描述,都照此取最大值。

(2)内容相似性行为。群组g的目标是获取经济利益,只要能够按时完成产品评论,就会降低撰写虚假评论的时间成本,从而倾向于复制自己或他人的评论,致使许多产品评论的内容相似度较高。

群体内容相似性(GCS)。当群组g的成员相互之间复制彼此的评论时,就会出现大量的重复或接近重复的评论,因此群体内容也会表现出内容相似性。为简单起见,假定每个成员最多为一个产品写一个评论,则可以通过计算评论间的余弦相似性值来量化群体内容相似性。

CSGg,p=avgmi,mj∈g,i

GCSg=maxp∈PgCSGg,p

其中,m是群组g的成员,cm,p是群组成员m对产品p的评论内容。CSGg,p捕捉到了产品p的群组g成员之间的平均内容相似性。

组内成员内容相似性(GMCS)。内容相似性的另一种呈现为群组g内的成员不认识彼此,只能复制或修改自己先前的类似产品评论。如果该组的多个成员都这样编写评论,则该群体更可能是在进行虚假评论活动。这种行为可以通过下面的模型捕獲:

CSMg,m=avgpi,pj∈Pg,i

GMCSg=∑m∈gCSMg,mg

当组内所有成员完全复制自己的不同产品Pg上的评论时,该组GMCS值为1,即表示虚假评论行为。CSMg,m表示成员m在所有产品集合Pg中的平均内容相似性值。

(3)针对性行为。消费者在发表产品评论时,都是在使用商品之后进行的,没有刻意去针对某商品发布或不发布评论,即评论对象是自己购买的商品。但是,虚假评论者的评价对象往往是将要进行推广或诋毁的产品,针对性比较强,例如只对特定的产品、品牌或店铺进行评论。针对性行为特征可以通过品牌偏离分、离群产品评论比例和评论密度进行量化。

品牌偏离分(BDS)。计算评论者在不同品牌上评论数的分布差异。xi代表第i个品牌,hxi为第i个品牌被评论的概率,采用熵值衡量。

fBDS=HX=∑nipxiloghxi

离群产品评论比例(ROPR)。離群产品指只被一个评论者评论的产品。该特征计算评论者m所有评论中是离群产品评论的比例。

fROPR=r∈Rm:r是离群产品评论Rm

评论密度是计算评论者在特定产品类别、店铺或时间段上进行评论的密集程度。包括产品类别密度(CD)、店铺密度(SD)和时间密度(TD)。

fCD=numReview(c)rRm;fSD=numReview(s)rRm;fTD=numDays(m)Rm

(4)早期评论行为。虚假评论者倾向于在产品刚上线时对其进行评论,可以最大程度的影响后来消费者对产品的印象。当群组g是第一个评论产品的,那么该组完全可以劫持产品的总体评价,以达到本次虚假评论目的。

早期评论(ETF)。早期评论是计算评论者m是多早评论产品p的。可以通过计算m最近的评论时间Lg,p和产品上线时间Ap的差值来衡量早期评论行为程度。β为早期评论阈值,估计值为7个月。

GTFg,p=0,(Lg,p-Ap>β)1-Lg,p-Apβ

GETF(g)=maxp∈PgGTFg,p

首条评论比例(RFR)。计算评论者m的所有评论中是首条评论的比例。如果某个群组或成员经常性的发表首条评论,那么很有可能存在虚假评论行为。

fRFR=r∈Rm:r是第一条评论Rm

(5)异常评分行为。虚假评论者通过给出与正常评论者不一致的、甚至极端的评分,达到提高或拉低评论对象综合评分的目的。如果群组g的成员多数给予极端的评分,那么存在虚假评论行为的可能性比较高。同时,也可以通过计算积极评论比例和评分偏差来量化异常评分行为。

极端评分(EXT)。判断评论者m是否总是对特定产品p给出极端评分。在5星(分)评价体系中,1星(分)或5星(分)为极端评分。r表示评论文本。

fEXT=1,(rm,p(rm))∈1,50,(rm,p(rm))∈2,3,4

积极评论比例(PPR)。计算评论者m倾向于发布积极情感评论的程度。在5星(分)评价体系中,评分≥4星(分)的评论为积极评论。

fPPR=r∈Rm:r∈4,5Rm

评分偏差(RD)。当群组内成员的评分偏离与真实评论者很多的时候,会发生有严重伤害的群体虚假评论。该偏差越大,这个群组就越糟糕。

Dg,p=rp,g-r-p,g4

RD(g)=maxp∈PgDg,p

其中,rp,g和r-p,g分别是由产品p由g组成员给出的平均分和非g组成员给出的平均分。D(g,p)为所述组在单一产品p上的偏差。如果没有评论者评论产品p,那么r-p,g=0。

3 虚假评论防治整治

研究虚假评论特征是为了更好的检测虚假评论、肃清网络环境,但要更有效、更彻底的防治虚假评论,还需要各利益相关者加强合作,群防群治。

(1)法律层面监管。我国《电子商务法》的正式施行已一年多,网络购物秩序更加有序,但仍然存在一些漏洞,很多商家及消费者都有意或无意、主动或被动地参与到虚假评论充斥的竞争环境中。从法律监管的宏观层面:应逐渐加大处罚力度,随时为商家、平台、消费者等利益相关方提供法律武器,制裁虚假评论中介或专门机构;应加强对消费者评论自由的法律保护,遏制“差评威胁”的发生。

(2)平台规则制定。虚假评论展示的自媒体、交易平台较多较繁杂,应该具体发布实施相对应的规则,才能够最大程度上限制虚假评论的发生概率。

(3)商家自觉行动。商家应该自觉遵守公平竞争的市场规则,从自身做起不利用“刷单”“水军”等方式为自己制造虚假积极评论,更要杜绝使用虚假消极评论诋毁同行商家;另外,要学会用正确的方式应对恶意评论,比如投诉平台、通过掌柜回复给予详细情况的解释等。

(4)消费者自我保护。消费者作为虚假评论主要的接收者和“受害者”,应在不去从事相关不当行为的前提下,提高法律素养;应提高鉴别评论真假的能力,对各个平台上如知乎回答、小红书测评、微博种草及直播间推荐中的评论保持理性的态度,提高媒体素养,形成自我保护意识和能力。

4 总结

随着新媒体的快速发展,虚假评论数量也在不断增长,虚假评论组织或个人也会一直存在,虚假评论也会变得越来越复杂,越来越难识别。对于许多企业来说,尤其是小微型电子商务企业,自己发布虚假评论或聘请专业虚假评论组织发布虚假评论,已经成为市场营销和品牌推广的一种廉价、有效的方式。幸运的是,各大电子商务平台都在积极通过计算机算法检测、打击虚假评论,但现有的算法技术难点在于如何在评论发布之后立即识别虚假评论,因为算法需要足够的证据来判断评论是否可疑,这可能需要花一段时间来积累证据。而这段时间,恰恰是虚假评论快速发酵和起效阶段。虚假评论都是由人来撰写、发布的,虽然他们可能会猜测出算法所使用的检测策略,但是也会不可避免的表现出与真实评论者的语言、行为等特征区别。因此,研究虚假评论的特征,是解决虚假评论一系列问题的一把金钥匙。本文从虚假评论的目的和动机出发,对当前虚假评论特征研究的关键问题进行分类总结,包括评论文本特征、评论者行为特征及其相对应的量化方法,为该领域进一步的研究提供研究方向、思路和方法上的参考和借鉴。不过,本文没有对评价对象的特征进行归纳总结,下一步将对其进行梳理,进一步完善虚假评论特征体系,最终为虚假评论的有效识别及整治防治措施的制定提供理论支撑。

参考文献

[1]刘璇.虚假评论对消费者购买意愿的影响研究[D].南京:南京大学,2015.

[2]刘兵.情感分析——挖掘观点、情感和情绪[M].北京:机械工业出版社,2018:205.

[3]方清.虚假评论对网络评论感知有用性的影响研究[D].杭州:浙江工商大学,2017.

[4]吴佳芬,马费成.产品虚假评论文本识别方法研究述评[J].数据分析与知识发现,2019,3(09):1-15.

[5]汪建成,严馨,余正涛,等.基于主题-对立情感依赖模型的虚假評论检测方法[J].山西大学学报(自然科学版),2015,38(01):31-38.

[6]宋海霞.融合内容及行为的虚假评论检测方法研究[D].昆明:昆明理工大学,2014.

[7]Xie S,Wang G,Lin S,et al.Review Spam Detection via Temporal Pattern Discovery[C]//Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Beijing,China.ACM,2012:823-831.

[8]Lim E P,Nguyen V A,Jindal N,et al.Detecting Product Review Spammers Using Rating Behaviors[C]//Proceedings of the 19th ACM International Conference on Information and Knowledge Management,Toronto,Canada.ACM,2010:939-948.

[9]Li Y,Feng X,Zhang S.Detecting Fake Reviews Utilizing Semantic and Emotion Model[C]//Proceedings of the 3rd International Conference on Information Science and Control Engineering.IEEE,2016:317-320.

[10]Liang D,Liu X,Shen H.Detecting Spam Reviewers by Combing Reviewer Feature and Relationship[C]//Proceedings of the 2014 International Conference on Informative and Cybernetics for Computational Social Systems.IEEE,2014:102-107.

[11]Mukherjee A,Kumar A,Liu B,et al.Spotting Opinion Spammers Using Behavioral Footprints[C]//Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,Chicago,Illinois,USA.ACM,2013:632-640.

[12]Jindal N,Liu B.Opinion Spam and Analysis[C]//Proceedings of the 2008 International Conference on Web Search and Data Mining,Palo Alto,California,USA.ACM,2008:219-230.