查看: 10516|回复: 2

京东反作弊系统深度解析(一)

[复制链接]
发表于 2015-7-27 14:50:42 | 显示全部楼层 |阅读模式
京东反作弊工作的组成
1.    京东反作弊工作现阶段主要是由两个研发部门和两个业务部门组成,其中研发部门包括“搜索部门”和“成都研究院”;业务部门包括“风控”和“质控”(一件事情多个部门操心,京东风格,你们懂得)。
2.    京东反作弊应用方向
2.1识别作弊行为,对其进行过滤、处罚等。
2.2平台的排序规则针对作弊更完善。

京东反作弊工作的进程

1.    人治阶段:
风控和质控两大部门组成纠察小组,人工识别虚假交易的行为,针对虚假交易的sku降权(锁定)、扣分、罚款;同时规则针对大额订单进行特殊处理(京东搜索产品负责人商倩兰2014年4月份公布此规则)
1.1人工识别
随着大家看到的京东的红利期,众多商家纷纷入驻京东,竞争也更激烈,各种淘系的操盘者也把当初淘系的做法带到京东。京东随之也指派质控部门来负责查单,用人工的方法来处理作弊sku及作弊的店铺。
在这个过程中,有很多商家出现的问题不是因为质控部门,而是因为“市面上的流言”导致互相厮杀。我曾收到投诉,也曾收到过有人发给我投诉的内容,让我帮助去查看,是否这样的投诉能有效。2014年10月份开始,我每天都收到很多发哭着的脸的信息,向我询问处理方法。当时后台的违规单,如图所示:


这种反作弊的处理方法俗称“杀毒”,它使用了比较粗糙的识别系统和人工排查的方法,排查中主要使用的判定维度是“评论”。在此基础上进行作弊订单的人工处罚/罚单写入,处罚期大部分均值为30天。其中又出现了一种厮杀,直接对竞品的sku攻击(差评+投诉),如图所示:


1.2针对作弊的规则完善

“销量、销售额”是影响京东sku排序的重要的数据,那么京东排序规则上针对反作弊所做的,就是合理的控制同一个订单下的sku成交的权重。大部分的商家开始在京东违规操作的时候,使用的方法是:一个订单“大成交额”和一个订单“大成交量”,如图所示:

平台根据这种作弊行为完善了一个sku权重计入的规则,我们称它为“大于等于2”规则。

大于等于2”规则:同一订单编号下,如果同一个sku成交数量大于2,那么这个sku在这一张订单中产生的数据对权重的作用仅计入2个,现阶段仍然适用。京东使用了这个规则,砍掉了很多“低质量订单”如图所示:


2.    系统阶段:
由系统识别反作弊订单,并将订单数据输出给“搜索过滤系统”过滤虚假交易订单,同时输出给“奖惩系统”进行警告,隐形降权,扣分及罚款。
2.1系统识别
系统识别中一共有3个系统,识别系统,过滤系统,奖惩系统,协同工作。
这里上图:

2.1.1识别系统原理是通过对非正常买家行为的判定进行订单过滤。
什么叫做“非正常买家行为”?
正常的客户行为举例:当客户搜索一个关键词后,在关键词的结果页下,会点击不同的商品,每个商品的“停留时间不同”,有的甚至只是点击了评论后查看了差评的情况就会“跳失”,有的会因为感兴趣,对商品进行“深度访问”;非正常的客户行为举例:客户搜索了关键词,只点击了你的sku,今天你的sku获得了500个独立UV,其中450个UV的行为都是这样的,我们称这种行为特征为“共性”。
如图所示(以下为非正常买家行为和正常的对比,截图区域有限,仅仅作为展示):


根据以上情况,除了路径共性外,还有哪些容易产生共性呢?

再上一栗子(我恨不得不说话,都直接拉图,拉数了):


大家可以导出你后台的订单,进行查看,这种情况一堆一堆一堆。。。这叫做“账号共性”。
识别系统截至今日共有80+共性判定列,具体的内容,会在以后的文章中逐一写出来。这部分的内容,大家可以学习“京东反作弊系统”的思考方式,一般这种时候我都把自己想象成一条查询语句或者一张透视表格。
2.1.2    过滤系统原理是将所有虚假交易订单排除在搜索权重之外。
过滤系统的上线时间是2015年2月。过滤系统上线后,大家监控自己排名时看到的表象大多为以下情况:

过滤系统对sku的作用后的具体表现多种多样。这里不一一举例。放到下次的表象中具体说。
2.1.3 奖惩系统,上线时间是2015年5月份。
将作弊sku与作弊阀值之间进行判定,触发奖惩系统自动对商品sku进行隐性降权。系统上线后,大家看到的警告单和一级处罚等情况,如下图所示:



关于奖惩系统及隐形降权方面,我们需要特别注意的是:
1,不是只有开具罚单的sku,才会被隐形降权;
2,不是罚单上开具的sku都会被隐形降权;
3,隐形降权的降幅比例不是唯一比例;
4,隐形降权的周期根据不同情况也为1-30日不等;
5,隐形降权的实施日期和罚单开具日期没有直接关系。
过滤和隐形降权的表象不同,通过下图我们可以看到明显的区别。


反作弊对sku作用下产生的各种表象,我会在下一次的内容里具体都写出来。
2.2     排序规则完善。
排序的规则一直在进行完善,因为我们是以反作弊的发展为结点来讲,所以这里着重讲与反作弊相关的一些规则上的变化,其中包括:
2.2.1 大额满减的sku直接下架处理
2.2.2  人气模型上线取代商品质量分当中:评论的变化是,不再使用评论总数来计算评论的权重,而是使用周期下单一sku的评论增加数量,不是spu。
2.2.3   价格排序中去掉超低价sku。

这次内容主要讲解京东反作弊系统的发展,了解系统发展可以帮助大家得到较好的投入产出比(人工及时间),举例子说:阿里需要跟**聊天,京东暂时还不需要;阿里需要使用**机,京东暂时也不需要。了解一个平台的工作系统,是让我们在实践中分辨对错的基础。
第二篇中我会写反作弊系统作用与我们的sku产生的各种表象,帮助seo及运营人员在排名推动的过程中,高效且及时的发现自己的问题,进行调整。
每次讲课我都会写一句话,表达自己当时工作的感受,这里也不例外:
我不喜欢作弊,看到这些风言风语,互相厮杀,讲起来,写起来,满眼都是泪。


文by:安璐千


发表于 2015-7-30 13:47:37 | 显示全部楼层
xxx
收费太高了,用不起啊
发表于 2015-8-29 10:10:37 | 显示全部楼层
很有意思的一篇文章!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表