电商运营之站内搜索全面指南(二)
笔者在上一个章节中,给大家初步的讲解了一下,站内搜索的前端和后端人工干预的一些逻辑与页面呈现。那么,接下来就顺着这条叙事主干,带领大家更加深入地了解一下:站内搜索接下来需要明白的杂七杂八和主干。
站内搜索逻辑的基本组成:怎么被搜到以及怎么排序靠前?
怎么描述呢?
对商家而言,商品怎么才能被搜索到解决的是有无问题,而怎么排序靠前被消费者看到解决的是温饱问题。透过这两个问题我们来好好聊一聊搜索的两大要素: 索引和排序。
索引
搜索其实是依靠爬虫来提取信息的。
什么是爬虫?说的简单点就像是帮你搬运信息到仓库的小哥,爬虫只负责帮你收集信息,且会给你存放在仓库里,分门别类安排的整整齐齐。然后,你这个老板只需要查看这些信息就好了。
那么,相比互联网的广域搜索比如百度 和谷歌。电商网站的搜索就显得简单和闭塞多了,所有的商品都存在一个库里,你的爬虫甚至都不需要每天无时不刻的劳作,只需要每天跑一次就够了。所以,一个商品能否被搜索抓取到是能否展现给用户的必要条件。
索引指的就是:被爬虫抓取到并整理好的商品库。
索引分为 全量索引 和 增量索引 两部分。
全量索引为全站商品的一次更新,所有的商品变化包括上下架,名称属性标签库存信息等的变化通过全量索引进行更新;增量索引为实时更新(也不一定是实时更新,可能是按照整点规则进行更新)更新的内容主要是商品的部分属性。
下图是我一同事为了宣讲做的ppt 不是本人原创,直接截图复用了。
那么商品的哪些信息会被纳入索引呢?
——商品名称、销售地区、库存量、商品属性(尺码颜色款式等)、商品挂靠的类目名称、商品编号、商品的标签信息和价格等。
除了以上的一些固有信息外,商品的数据信息,比如:销量、评价、曝光点击等数据也会被纳入索引,用来介入接下来的排序步骤,计算排序得分。我们举个简单的例子,比如:我早上上架了一款苹果耳机。但是,我的商品标题和属性里都没有对这个款耳机的英文 AirPods的描述。
那么,用户在搜索AirPods时,是否会搜索到这款产品呢。显然是无法搜索到的,因为搜索是针对文本信息的精确匹配,此时解决办法有两个。
- 是给AirPods和苹果耳机配置同义词。
- 在商品标题属性或者标签上给商品加上AirPods关键词。这样改产品才会被搜索到。
以上即当商品的标题,属性,类目,标签,描述等属于索引范围的文本信息都不包含用户输入的关键词以及系统中的同义词时,这款产品是无法被搜索引擎搜索到的,当然也无法呈现给用户。
那么,各位对索引的概念是否有了直观的认识?没有也不要紧,我肯定不会讲第二遍。
排序
能不能被搜索到的问题解决了,接下来就是商家们最关心的问题,就是:怎样让自己的商品在搜索中让更多的用户看到?
这个就涉及到搜索的排序算法了。每家电商的搜索排序都是按照自己的算法逻辑进行的。排序的算法逻辑也是各有千秋和特色。排序算法应该是站内搜索里面各大电商的核心机密。
但是,排序的因子就不那么机密了,基本上你想得到的就这么些。只是各家在各个因子上的权重不一样,计算方式也不一样。
我们先来列举一下这些因子有哪些:销量(淘宝用成交笔数)、点击、收藏、加购、好评率、商品质量分(商品信息的完善和准确程度)、用户行为偏好(用以做千人千面个性化)、店铺评分等信息。
我这里倒是有一些 排序算法的公式,但是还是算了,我看了也头疼,大家只要知道影响排序算法因子就行,知道哪些因子起了决定性作用就ok。
下图为我为自家公司在初期版本上的排序因子,看看能得出什么结论?现在很多淘宝商家削尖了脑袋想一探这个排序算法的究竟,其实大可不必,电商千千万,搜索一条路。对于产品和运营而言,只要知道哪些是直接能够提升销售和转化就够了。
其实排序分为两个主要的阶段,一个是大范围的排序(类目排序),一个是商品范围的排序。
什么意思呢?首先,用户在输入一个关键词后,大概率是一个物品词或者品牌词,用户在电商网站使用搜索,95%的概率是要寻找想要购买的商品。此时,我们需要给到他们在这些商品的集合。我们称之为列表或者类目或者叫分类。
大家在电商app首页的底部 一般会看到这个模块,这个项目我将在后面的章节中给大家更加深入的讲解。如下图所示(红框部分就是分类)):也就是说先要定位用户想要寻找的商品在哪个分类中。只有找到这个商品的集合类目,然后再该类目中进行商品的排序,这才是排序的两步走战略——第一步,类目预测;第二步,商品排序。
目前类目预测主要是两种方式互为补充:人工和机器算法。
人工也就是我上一章中提到的人工后台干预。机器类目预测目前主要的方式有:类目文本+商品量集群算法;贝叶斯预测算法;中心词类目预测算法。这几种算法各有优劣,我将会在之后的搜索算法章节进行详细介绍。
好了,总结一下本章:第一步是解决有无问题,第二步是解决温饱问题。要先能被搜索到才能被更多用户看到。以上内容不代表绝对准确,有个人的观点在里面,谨慎采纳!
预告下一章内容:
- 站内搜索的物料基础:目录与商品描述
- 站内搜索运营的逻辑与数据指标
#专栏作家
作者:王欢,微信:wanghuan314400,运营小灰一枚。
本文由 @王欢 原创发布于人人都是产品经理,未经许可,不得转载。
题图来自Unsplash,基于CC0协议
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: