查看: 2914|回复: 0

深度解析——京东搜索规则

[复制链接]
发表于 2017-5-23 22:47:11 | 显示全部楼层 |阅读模式
一、 最常问的搜索多久更新?
很多人搞不明白,下面所说的情况不包含系统故障。
搜索上更新分为两部分:增量更新和全量更新(两者不冲突)。
增量更新:商品组及时将消息发送到搜索,搜索将接受到的消息更新。一般10-30分钟内即可被搜索到。
全量更新:搜索每天都会对搜索的数据库重新建索引,保证在数据库中的数据都更新(下午6点离线(不影响线上)开始生成数据,再推送到线上,期间时间较长,第二天PC、列表、其它所有客户端9点前都会基本完成更新)。
1. 上架成功后,一般是半个小时内(没有勾选“上柜不展示”,去除此勾选是第二天被索引,若在18点后去除则是第三天被索引)即可被索引到,最迟第二天被索引(增量没接到消息时通过全量更新)。
2. 下架成功后,立刻--10分钟后不再被搜索到
3. 库存变更后,立刻—30分钟可以被搜索识别到新库存
4. 价格变动后,立刻—10分钟可以被搜索识别到新价格
5. 销量、金额,搜索反馈等第二天更新
6. 配送区域、限购区域等第二天更新
7. 图片、属性区(品牌等)、标签第二天更新
8. 店铺内的分类第二天更新。
9. 基础广告词第二天更新(最好白天更新,因广告词单独逻辑,每天都是晚上读数据库)。
10. 价格模型数据每周更新一次(搜索页周二/列表页周一更新),品牌模型数据(依赖于商品表和订单表)每天更新。
二、不同颜色.不同尺寸的SKU都可以搜索到吗?
1、SKU只有颜色时,所有颜色的SKU都可以搜索到
2、SKU有颜色和尺码时,同颜色可以搜到一个尺码,是15日销量最大且有库存的,其他尺码也可索引,但前端展示还是销量最大且有库存的。
3、SKU颜色为空,只有尺码时,所有尺码都可以被搜索到。
备注:
1、此处“库存”数据第二天更新
2、上架当天同颜色不同尺码全部能搜索到,当全量更新后识别同颜色不同尺码中有库存且销量最大的。
3、同一个商品的相同颜色只能索引一个颜色。
三、商品的哪些信息可以被搜索到?
搜索首先需文本匹配,而不是商品所有信息的文本都可被搜索,不同品类被索引的字段不同,如下:
3C和日百品类:
商品名称、品牌、同义词、三级分类(AB、A/B分类不索引如奶瓶奶嘴、戒指/耳饰)、扩展属性、基础广告词、店铺名称、店铺ID、颜色、尺码(3C颜色和尺码除外)、3C规格参数(型号|颜色|操作系统|网卡|核心数|推荐用途|适用机型|适用型号|打印机类型|声道系统|定频/变频|自动化程度|类别|主板兼容|适用范围|接口类型|散热器类型|核心|摄像头|CPU核数|CPU型号|CPU类型)、送礼搜索、大家说。
图书音像品类:
图书商品系列名称、图书商品出版商、图书商品作者、图书商品译者、图书商品外文名称、图书商品编辑、图书商品美编、同义词字段、店铺名称、扩展属性、书写、高级关键词、二级分类名(后续会替换成三级分类)、ISBN。
音像商品系列名称、音像商品导演、音像商品演员、音像商品外文名称、音像商品出版社、音像商品演唱者、音像商品表演者、音像商品录制者、同义词字段、二级分类名称、店铺名称、扩展属性、产品评级、厂牌、发行公司、介质、作词、作曲、编剧、指挥、知名乐团、演奏、又名、高级关键词。
行动建议:
在不影响现有的正确搜索结果,采销若需添加新的索引字段,请提供相关的数据给搜索评估(依据:对现有搜索结果带来正向影响)。
四、为什么我关心的商品没被搜索到?
1、新品上架最迟第二天才能被索引到,请先确认是否上架成功,另外是否后台设置了上架不展示(图书分类无上柜不展示)。
2、确认搜索的关键词,在商品已被索引的字段中包含。
3、用商品的全称(标题所有文本)去搜索,看是否可以搜出来。因有时短词搜索你关注的商品可能因销量等数据很少而排在后面,不容易被发现。
4、同颜色不同尺码只索引销量最大且有库存的SKU,其他SKU的文本也可被索引,但展示的是销量最大且有库存的SKU;
5、被识别品牌作弊的SKU,在搜索品牌库中的品牌词时被过滤;
6、商品需正确绑定品牌;
7、“送XX礼物”、“XX礼物”等搜索词会触发搜索送礼逻辑,反馈中有这些字段(即评价中出现2次以上)的才会被索引(只在标题等含有这些字段是不行的)。(PS:目前该逻辑已经更新,目前正在过渡,过渡完成后,与政策搜索逻辑相同)
8、 店铺内分类绑定需再第二天才能被索引;
9、 搜索结果超3W会被截断(文本+商品质量分),但搜索页数只展示100页(解决点击筛选后页数变多的体验问题)。
五、为什么我关心的商品排名突然下降很大?
1. 先确保用商品全称是否搜索到(单纯修改详情页不会影响排名);
2. 当前用户所在城市无库存的商品降权,请先查看当前访问jd.com的用户所在地,确认该商品在本地区是否有货
3. 搜索规则是根据各个因子的数据来综合排名,若数据发生变化,排名也会变化:如搜索计算的是3日和15日完成销量数据,若计算周期内商品销量数据已不再像前一天那么高则排名自然会受到影响;若在前一天计算权重时,与竞争对手销量差不多,但转换率和好评率竞争对手有量变到质变的提高,则商品排名也会受影响。(排除搜索系统异常)
4. 作弊商品会被降权;
5. 价格模型对商品排名也有影响。(价格模型每周二晚更新,周三排名有可能下降)
6. 店铺穿插会使某些店铺的展示数有所下降,但是会提升前几页的资源分配。
7. 商品的上下架有时也会影响当天的排名(商品质量分,此权重在下午2-4点计算,若在此时间段上下架,会计算不到当天的商品质量分,但取不到商品质量分时,搜索会默认为是新品赋予一个权重值=3),第二天会恢复正常。
8. 若修改了商品销售属性(如A商品无尺码,商家增加B商品时,给A商品多添加了尺码)导致SKUID变化会影响排名(不管修改什么属性,只要SKUID不变,商品排名就不会受太大影响,除非商品更换分类)。
9. 最近正在分批上线的品牌模型和人气模型,以及京东系统AB,不包含系统故障因素。
以上是针对最近提问一些比较多的基础的问题,下面说下京东搜索优化的一些重要知识点。
1、高相关分类:我们大家都知道京东的搜索是有高相关分类一说的,高相关分类顾名思义就是和搜索关键词相关性最高的三级类目,此三级类目会在搜索的时候优先展现,这个是系统根据很多纬度的数据计算出来的,并不是人为的。
以关键词“红豆”为例,红豆是一种食材,同时这个词也是一个男装品牌的名称,那么在京东搜索的时候会优先什么类目呢,大家可以自己搜索下试试。系统判断“米面杂粮”类目更适合展现给消费者,对平台的GMV更有利,所以会优先展示米面杂粮类目的产品,而不展示男装类目。关于这块,可以使用第三方工具“老板通”查询。
2、文本相关性:京东会对平台产品建立索引,然后当消费者搜索的时候,系统就会根据索引进行召回,并根据文本相关性得分进行排序,这是整个搜索系统工作的大概流程。那么系统会索引产品的那些属性呢?给大家总结下:
a、标题
b、副标题广告词
c、品牌
d、商品属性
e、销售属性
f、详情文字
g、评价内容及标签
h、店铺名称
大家可以根据以上总结的点来对自己的产品和店铺来进行针对性的优化,思考怎么让系统在消费者进行搜索的时候会对你的信息进行召回。
那怎么知道消费者会对哪些词进行搜索呢?可以参考一些行业数据,比如数据罗盘的热搜词或者老板通的关键词以及类目数据查询,可以直接看到类目或者指定关键词每天的成交单数,这个数据是过滤之后的,可以以此推算某个关键词对应位置的所需的刷单单量。
前八的坑位平均所需单量计算公式:单天整词订单量*0.9*0.4/8
0.9为第一页成交单量占比,0.4为前八成交量在第一页的占比,8为坑位数这个系数是全平台平均,某些类目可能有偏差,但误差不大。
建议可以把行业数据全部拉出来,做成表格,包含搜索量、成交量、客单、在竞商品数、前八所需单量等多列对比纬度,来对关键词进行判断,以达到减少投入增大效果的目的。
3、价格模型:京东于九月份基本全类目上线了价格模型,目前是第一阶段的价格模型,二阶段的多区间带价格模型预计明年才能和大家见面了,先说一阶段价格模型,这个是比较简单的,就是如果你的产品售价在系统给予的高权重价格区间内,你的产品就可以获得加权,只要在区间内,不分价格高低,权重都一样,在区间内再进行分段就是二阶段价格模型了。京东明年的方向会主抓品牌这块,整个平台会对优质的产品进行资源倾斜,其中在搜索这块,能体现产品优质的一个系统判别纬度就是高价,那么这块就很容易做了。
可以不断的给自己的产品加价,然后刷新看排名,自己把握这个度,别一双袜子都加到一百多,排名上去了也卖不掉,这种情况是真是出现过。价格模型是每周二进行更新,周期7天。
4、标题优化:标题优化说几点技巧
a、标题内的括号“()”内的内容是不计入标题长度的,一些不重要的说明信息可以写在里面
b、副标题可以被索引,可以展示在搜索结果页,优惠信息等可以写在这,并且可以展现在搜索页
c、标题越短越好是没错的,权重高是一个,第二是搜索可以看到副标题,空格是不计入长度的,但如果想做完全匹配的词,建议加空格,比如“风衣女”,消费者喜欢加空格搜索或者搜索下拉框就是带空格的,那么建议加空格,因为系统优先召回完全匹配
d、同义词缩减,比如“女士”和“女”在京东系统眼里,他俩是一样的,没区别,可以直接写成“女”以缩短标题。
e、最好不要堆砌关键词,标题长权重低不说,被抓到要扣分,虽然被抓的比较小,建议把所有想做的词拉出来之后,进行拼装缩减,详情见我以前写的帖子(半途而废了,不好意思)。
5、流量入口概况:目前京东的流量入口分两大块
PC:搜索+类目列表页
移动端:APP+M端+微信+手Q
搜索成交订单量在这两大端口的成交量都在一半以上。说两点关于这块的事情:
a、移动端的微信和手Q的类目列表页其实不是和APP一样的,他们的类目页其实是某些关键词的搜索页,大家可以自己试试,如果拿到这些词在PC的排名,相当于微信和手Q的类目也拿到了。(目前是这样)
b、移动端和PC端的排名正在进行拆分,已经有个别类目拆分完成了,还有正在进行测试的,数据源用的还是一样的,但是应用模型不一样,以后大家做排名可能就要分开做了。
6、人气模型:人气模型原本计划Q3全品类上线,目前还没有做到,但也差不多覆盖一半的类目了。人气模型上线后和之前的商品质量得分还是比较大的,主要体现在:
a、周期评论增加数替代总评论数计算权重
b、删除提换货率、跳失率和访问时间
c、新增纬度关注数、加入购物车和访问深度
7、品牌模型:品牌模型已于618之前上线,这就是为什么有些类目,某些评论很少的产品可以排在最前面,就是品牌模型在起作用。品牌模型主要考核的一些点有:
a、扩展区点击量
b、搜索量
c、GMV
d、销量
e、单价
8、店铺模型:店铺模型的主要作用是进行资源平均,避免一个店铺的产品扎堆显示,造成消费者的选择疲劳,同一个店铺的产品会被系统强制穿插,意思就是原则同一个店铺有两个产品可以排在第一和第二的,店铺模型应用后,只能是第一和第五。
9、个性化搜索:这个还在开发,不知道什么时候上线,不过已经应用在一些推荐位了,例如感兴趣,最佳组合等。
10、新品模型:顾名思义,新品有加权周期30天,搜索新品加权相同。
11、季节模型

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表