query推荐产品竞品分析:今日头条 vs 淘宝
本文是query推荐产品的竞品分析,笔者通过分析今日头条和淘宝两个产品的关键词推荐功能,对爱奇艺query推荐提供建议。
一、分析目的
所谓query推荐,目前的主流搜索引擎大都提供两种产品形态,在用户输入完整query之前,搜索引擎会在搜索框中弹出一系列推荐的query,我们称之为下拉推荐;
在用户输入完整query点击enter键之后,搜索引擎都会在搜索结果页的周围,一般是上方或者下方,会给出和输入query相关的query,我们称为相关推荐。
query推荐一方面从搜索意图上和网民的搜索意图匹配, 一方面和也能够达到引流的作用,能够快速引导网民找到需要的内容, 或者考虑商业变现因素,能够将搜索引导向与搜索意图匹配且有商业价值的搜索上,提升搜索引擎的变现效率。
通过分析今日头条和淘宝两个产品的关键词推荐功能,找到每个产品搜索推荐功能的优势、劣势以及可以优化的地方,对爱奇艺query推荐提供建议。
二、分析范围
移动APP端的关键词推荐模块
三、竞品选择
今日头条、淘宝
1. 选择原因
(1)今日头条
“有态度”的新闻资讯客户端,基于机器学习的个性化资讯推荐引擎,5秒算出使用者的兴趣,力求每一次推荐更加精准,让阅读更加有用高效。
为用户提供优质的资讯、视频、直播服务,看新闻视频、搜索新闻是用户的主要需求,搜索引擎采用的关键词搜索机制,信息资讯的查询、阅读、推荐都是基于关键词进行。
(2)淘宝
作为电商平台的霸主,主要场景在于用户搜索商品及推荐商品构成消费行为,淘宝的搜索引擎涉及对上亿商品的毫秒级处理响应;
淘宝的用户不仅数量巨大,其行为特点以及对商品的偏好也具有丰富性和多样性,淘宝的搜索推荐功能相对于其它行业的搜索发展和体验上相对领先。
2. 体验环境
- 设备型号:苹果7
- 操作系统:11.0.3
- 体验时间:2019.1.1
- 今日头条:7.0.5
- 淘宝:8.3.0
四、竞品分析
1. 默认搜索词
(1)今日头条
首页默认搜索词展现2个,过长时不完整展示,点击或者更换频道会根据头条热搜标题刷新更换默认词;
进入搜索中间页之后,搜索框下面从猜你想搜中随机选取并展示3条信息,并及时更新。
搜索框中的默认搜索词展示3条信息中的第一条,可默认搜索。
默认搜索词与用户的历史搜索记录无直接联系,有限选取的是当日的一些热点事件作为推送。
(2)淘宝
查询前在用户进入软件时,还未有任何交互时,淘宝的默认搜索词根据用户最近的搜索或点击的商品,主动向用户推送用户可能感兴趣的种子query,根据用户历史上采纳的符合用户推广意图的关键词,分析出用户的搜索意图或业务点。
首页默认搜索词展现1个,默认搜索词的长度适中,不会出现比搜索框长的情况,搜索中间页可以看到,默认搜索词展现的是下方搜索发现的第一个词,这个词是最契合用户当前搜索意图的词。
刷新之后每次的默认搜索词会更换成不同的词语,但是其种类基本保持不变且与搜索意图相关。
例如,搜索过“裙子女秋冬连衣裙”,多次刷新可以发现默认搜索词包含“软妹套装”、“很仙的毛衣女甜美长款”、“高腰阔腿裤套装”等,既可以细化描述用户的需求,帮助用户更快更好的找到想要的商品,又可以拓宽用户当前的选择范围,打开其他商品的销售渠道,并且保证推荐内容不与用户的搜索意向相违背。
2. 下拉推荐
(1)今日头条
下拉推荐会将用户最近搜索的query保存,当用户输入query的前缀,如果匹配上,会将这个搜索的query放在下拉推荐的前几个位置。
下图可以发现,用户先搜索“吴秀波”,再搜索“吴亦凡”,当输入“wu”时,下拉推荐列表会优先展现用户搜索过的关键词,然后在根据其他关键词的热度进行推荐。
(2)淘宝
下拉推荐处于用户已经开始在搜索框中进行输入,但输入还未完成的阶段。此时最常采用的方式是使用suggesion的方式,结合用户当前输入,向用户推荐完整的高质量query;
具体suggesion挖掘,可以找到一些高频的query,结合session数据,搜索点击数据进行挖掘。
在服务器端为每个用户保存最近一段时间内搜索最频繁的几个历史query,在用户输入完整query之前,如果输入的部分query是某个或者几个历史query的前缀,则将这几个历史query挑出来作为候选。
用户搜索“眉笔”、“眉粉”和“美妆蛋”,输入“mei”时可以发现最近搜索过的query依次展现在列表中,下方的query则是前期的搜索相关词。
3. 相关推荐
(1)今日头条——猜你想搜的
从产品形态而言,猜你想搜的七排两列默认展示20条推荐,可及时刷新,关键词太长的默认展示七个字,其余部分用省略号表示。提供屏蔽操作,可以隐藏起来不展示。
今日头条推荐方法是根据用户过去的行为记录来向用户推荐相似的资讯,采用基于内容的推荐,在对应子页面直接进行内容推荐,缺点是由于内容高度匹配,导致推荐结果的惊喜度较差,并且只有维度增加才能增加推荐的精度。
但是存在冷启动的问题,对新用户不能提供可靠的推荐结果,根据已有用户模型的数据,结合挖掘的各种榜单进行补足,对于新用户而言,软件无法通过用户搜索历史记录得到用户的搜索喜好。
“猜你想搜的”里面会放一些最近比较热门的新闻资讯。
下图可以发现,搜索历史记录为娱乐相关的剧或者明星资讯,但是“猜你想搜的”里面展示的还是最近比较热门的事件,与搜索历史无直接的联系。
(2)淘宝相关推荐——搜索发现
从产品形态而言,五排两列默认展示10条推荐,可及时刷新,提供屏蔽操作,可以隐藏起来不展示。
当删除之前的历史搜索记录,可以看到紧凑的三排两或三列展示推荐,推荐内容为之前搜索历史相关内容,可及时刷新,提供屏蔽操作,可以隐藏起来不展示。采用协同过滤进行推荐,假设“跟你喜好相似的人喜欢的东西你也很有可能喜欢”。
假设用户的搜索意图可以用一系列query来表征,那么同一个搜索意图在不同人之间的表达通常会不同,假设大量用户的搜索遵循某种规律,那么当某个个体出现的时候,我们可以按照这个规律来推荐出合适的query。
主要的任务就是找出和你品味最相近的用户,从而根据最近他的喜好预测你也可能喜欢什么。这种方法可以推荐一些内容上差异较大但是又是用户感兴趣的物品,很好的支持用户发现潜在的兴趣偏好。
如下左图所示,根据“历史搜索”口红,“搜索发现”将跟你喜好类似的用户可能搜索的故宫限量版口红和欧莱雅枫叶红推送给你。
但是也存在冷启动问题,无法向新用户推荐,系统刚刚开始时推荐质可能较量差。
电商行业也常常会使用到基于关联规则的推荐,即以关联规则为基础,把已购商品作为规则头,规则体为推荐对象。
如下左图所示,“历史搜索”头发蓬松神器,“搜索发现”将当前兴趣进行收敛相应的会向你推荐多功能吹风机电吹梳,关联规则挖掘可以发现不同商品在销售过程中的相关性。
相比对每个推荐场景单独进行个性化推荐的策略,淘宝还加入基于强化学习框架,根据全链路的数据进行整合,同时响应多个异构场景的推荐请求。
挑选query的策略,按照query被搜索的频度来挑选。考虑当前query之前用户的搜索query,这些最近搜索的query可以当作用户搜索的上下文,作为我们挑选候选query的凭据。
采用基于CTR预估的相关query推荐,更多的考虑在展现相同机会的情况下,相关query可能获取更多的点击率,从搜索流量出发,可以带来更多的转化。
预估query的CTR,在模型中用到的如下特征:搜索词与推荐query相关的特征;搜索词与推荐query的类目相关特征;候选query静态分相关特征;推荐query的词性特征;推荐query对应的结果页面特征。
根据用户搜索内容的不同,能准确的对用户进行画像。
如下左图可以发现历史搜索大多为女生化妆品,所以搜索发现推送的也是女生用的化妆品或者衣服,右图可以发现历史搜索大多为运动鞋类和男装,所以搜索发现推送的也是男士用品。
淘宝的搜索发现中前面的搜索词为近期兴趣相关,后面的搜索词为用户比较久远的兴趣爱好相关,搜索词推荐范围包括商品、店铺以及大V,搜索发现内容丰富度较高,每次页面刷新推荐内容均会变化。
搜索发现与历史搜索有很大的联系但是不会出现重复内容,其中的“俏皮两件套法国小众”和“加拿大鹅 雪咒”两条记录是之前搜索过的,最近删除了历史记录,可以看出淘宝会记录一些已经删除的近期用户的喜好,然后推荐给用户。
五、分析总结
1. 今日头条
根据分析可以发现,今日头条的内容推荐做的很好,如果长期观看其中的部分主题相关内容,则会优先推荐相关内容;
但是query推荐并没有做的很好,用户搜索的关键词并不会影响头条“猜你想搜的”里面推送的内容,“猜你想搜的”query推荐并不是真正的猜你想搜,而是系统经过计算推送出的一些实时热点事件。
而且其搜索框下方的三条信息是从“猜你想搜的”中选取的,默认搜索词又是下面这三数据的第一条数据,内容上存在一定的重复,除了点击的位置相较“猜你想搜的”靠上,没有什么明显的优势。
建议:可以将用户搜索的历史记录作进一步的分析,将“猜你想搜的”里面的热点内容根据用户的搜索兴趣进行排序,会增加进一步的点击量,不然“猜你想搜的”就只是一个热搜榜而已。
2. 淘宝
淘宝的默认搜索词会帮助用户更进一步的细化描述搜索意图,更快的找到自己喜欢的商品,省时省力的达到效果。
但是搜索发现中推荐的词会根据用户最新搜索词发生较大的波动,用户可能短期内买过一件商品之后很长时间不会再买同类的商品,从而导致不符合用户相关兴趣的query推荐词占据搜索发现的较多位置。
建议:可以结果用户的搜索需要和最近的成交订单结合进行推荐,如果用户已经购买了同类商品,那么就不要推荐同类商品了,可以基于同一个场景,进行不同类别物品的推荐。
如果用户近期搜索词相关性差距较大,则淘宝除了推荐搜索词相关内容,还会作进一步的预测推荐,但是这种推荐鲜果并不是很好,其中会出现一些与兴趣爱好完全不相关的词,这个方向还需要进一步优化。
3. 爱奇艺
爱奇艺默认词搜索相较淘宝内容的丰富度有待提高,如“爱情保卫战”、“赵川爱情保卫战”、“爱情保卫战赵川”,内容几乎重合,虽然及时刷新但是内容上并未有太多变化,而且默认搜索词并没有根据用户短期搜索的内容进行实时更新,多次刷新只有固定的七八个词。
“猜你想搜”也不会根据用户的最新搜索进行实时刷新内容,建议可以跟淘宝采用类似的策略,做到真正的与用户搜索相关。
本文由 @啦啦啦 原创发布于人人都是产品经理,未经作者许可,禁止转载。
题图来自Unsplash,基于CC0协议。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: