字节跳动入局搜索之战,背后有何野心?
图片来源@视觉中国
文 | itlaoyou-com,作者 | 韩志鹏
千呼万唤,今日头条的全网搜索终于"始出来"。
8月1日,字节跳动先是在招聘简章中宣布将打造独立搜索引擎,引发网友热议,随后,字节跳动官方回应称:全网搜索已在今日头条上线试运营。
进入2019年,字节跳动仍未停止进击步伐,持续发力短视频、在线教育等领域。这之中,今日头条始终为搜索留下一片领地,并不断对其发力,直到此次全网搜索上线。
看来,字节跳动是铁了心要吃"搜索"这块奶酪了。
不过,字节跳动入局的这场搜索之战绝不简单,各大互联网公司分而治之且固若金汤,另外一种声音则认为字节跳动正在"入侵BAT",战况一时之间波谲云诡。
但结果如何,这就得看字节跳动抱有何种野心了。
搜索之争
当下,今日头条全网搜索的服务体系正逐步完善。
例如,在今日头条搜索"武当山",首条内容便是携程旅行页面,用户点击后会被导入类似H5的页面中,其可在此查看相关的网友评论和景点信息。
同时,景点信息中还包括景点门票及旅游套餐的销售,用户无需跳转至其它页面便可实现预订下单及付款,所有操作都能在头条App内完成。
这是今日头条提供的搜索便利,但其中改进空间也不少。再以"武当山"词条为例,其前10条搜索内容中,除马蜂窝、携程和互动百科外,其余内容多来自站内的微头条、头条号等板块。
由此可见,在搜索内容丰富度上,今日头条还有很长的路要走。
罗马不是一天建成的,字节跳动对搜索抱有的野心并非空穴来风。自2017年起今日头条便在App内试水搜索业务,但期间并未官宣更多细节,直到今年,今日头条才开始为搜索业务"摇旗呐喊",各类官宣消息层出不穷。
这一切,要从年初的一次"小更新"说起。
今年1月,今日头条上线"帐号内搜索"功能。使用该功能,用户可以搜索到一些站内外的内容,包括视频和文字信息。
据当时报道显示,如果用户搜索到站外内容,今日头条会在内容条目下方标注"站外"二字,这和当前的今日头条搜索如出一辙。
今日头条试水站外搜索的消息曝光没多久,到今年3月,今日头条便在开屏广告上推广"头条全网搜索",广告词名为"搜罗全网好结果"。
彼时,今日头条的搜索业务已是"呼之欲出"。
可见,从今年1月的小范围试水到如今的App内测,今日头条在用"闪电速度"推广搜索引擎,面对市场已经饱和的搜索领域,今日头条仍不甘掉队。
这种"闪击"背后,字节跳动确实是"没有金刚钻别揽瓷器活"。
首先,据QuestMobile的数据显示,截止2018年底,今日头条MAU达2.4亿,而字节跳动整体的去重MAU达5.98亿。这样庞大的流量基数,势必会在今日头条的搜索入口中被进一步盘活。
字节跳动App布局及用户规模
其次,字节跳动的算法技术也会为其搭建搜索技术提供帮助,其头条号的建设和短视频矩阵也能为搜索内容形成底层支撑。
看来,有流量、技术和内容作为基础的字节跳动,入局搜索可不是"空手套白狼"。但今日头条若想在搜索层面继续突破,团队搭建也是重要工作。
据媒体报道,前360搜索业务负责人吴凯于2018年年底加盟字节跳动,负责搜索商业化;在此之前,吴凯还曾任奇鱼微办公的CTO,这是一家以AI技术为核心的智能办公平台。
显然,像吴凯这样长期从事搜索并精通技术的人才,正是今日头条所需要的。此外,字节跳动在招聘简章中也有注明,其搜索团队人员来自谷歌、必应等大型搜索公司。
这种团队积累将会助力今日头条的搜索建设。
如期所述,字节跳动在搜索道路上昂首挺胸地前进,但它所奔跑的搜索赛道已然是饱和市场,甚至是"一家独大"的局面。
截止2019年1月,中国搜索引擎市场份额排名中,百度以70.3%居首,第二名是UC旗下的神马搜索,占比15.62%,剩余约14%的市场份额由搜狗、360搜索和谷歌等公司瓜分。
同时,据百度2018年财报显示,其线上营销收入达819亿元,占总营收比重约80%,这证明了百度通过搜索引擎构建的"内容+信息流广告"业务已相对稳固。
作为国内搜索领域的王者,当百度在AI道路上大踏步向前之时,搜索业务是它的后花园,也是百度最坚实的港湾,若此地有敌军来犯,百度自然会不留情面。
今日头条就是这样一支进犯的敌军。
今年4月,百度以不正当竞争为由起诉今日头条App,称今日头条大量窃取百度搜索产品的内容和搜索结果,百度要求今日头条即刻停止侵权行为,并赔偿经济损失共计9000万元。
今日头条App被曝侵权百度
虽然该案正在审理中,但不难预测,在字节跳动进军搜索的路上,这类案件还会再次发生。
况且,在当今互联网大公司划江而治的状态下,数据和内容自然都被各路玩家封锁在水晶柜中,既然今日头条要做全网搜索,少了百度掌握的检索内容、阿里掌握的商品信息,这条路还能走得通吗?
这就是摆在字节跳动搜索前进路上的现实阻力。
可见,字节跳动铁了心地想吃一口"搜索"的蛋糕,但吃蛋糕的人已经有360、搜狗,还有"吃得最多"的百度,在这种局面下,字节跳动将面对怎样的挑战?又谋划着怎样的商业野心?
虎口夺食?
字节跳动已然踏入搜索业务的河道中,但其中水流却异常湍急。
首先,搜索引擎本身具备一定的门槛,就搜索技术而言,字节跳动自身沉淀的规模化内容数据,可以实现爬虫、存储和检索这三项搜索能力,但真正的难关则是第四项能力 ----排名。
百度能有今日功绩,正是在"排名"技术实现了突破。
上世纪90年代中期,世界上还没有真正意义上的搜索引擎,人们很难高效率高质量地获取想要的信息,当时还在美国的李彦宏便开始思考如何解决搜索技术。
李彦宏想到了自己在北大所学的科技论文索引方法,他认为,"科学论文通过索引被引用次数的多寡来确定一篇论文的好坏,超链就是对页面的引用,超链上的文字就是对所链接网页的描述。"借此可以计算出超链和页面之间的相关度。
最终,通过反复的科学论证,李彦宏在1996年提出了"超链分析"概念,并在1997年请了"超链分析技术"专利,以此建立百度,这甚至比谷歌申请的PageRank专利还早一年。
简言之,超链分析技术就是通过分析链接网站的多少来评价被链接的网站质量,其保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。
这项专利的唯一持有人便是李彦宏。
随后,通过不断的技术优化和数据沉淀,到2018年第三季度,百度搜索结果首条直接满足需求的比例已经超过40%,用户体验得到大幅提升。
字节跳动显然还不具备这样的技术底气。
虽然今日头条以算法技术起家,但相较于复杂的超链分析技术,字节跳动对搜索技术的补课还不能停。
在当今的互联网时代下,技术本身很难构成门槛,但就搜索引擎技术而言,字节跳动仍需要持续输出资金和人力资源,投入更多的时间和精力来突破这道难关。
这是一场与时间的赛跑。
况且,即使能突破技术的关卡,字节跳动可以实现爬虫、存储、检索和排名了,但它的内容足够支撑用户的海量检索需求吗?
如前所述,百度已经因"爬虫行为"状告过今日头条,用户如今也很难在今日头条上搜索到来自百度的站外内容,即使是百科词条,今日头条使用的也是"互动百科"。
同样地,今日头条也搜索不到微信公众号内容,同样也搜索不到来自淘宝、天猫的商品,即使用户搜索"衬衫"二字,今日头条推送的也是自家值点商城的商品。
出现这种情况主要是由版权保护和竞争本身造成的。
第一,国内对图片、音视频乃至文字内容的版权保护意识正在不断增强,今日头条在早期也因爬取媒体网站内容被凤凰、新浪诉至公堂,而今日头条想实现全网各类内容的搜索更是难上加难。
第二,今日头条已经进入百度的基石业务,后者自然不会开门迎客,封杀与诉讼战在所难免,这套逻辑对腾讯、阿里等存在竞争的互联网公司都相当适用。
如今,用户数据成为各家互联网公司的重要资产,随着企业边界扩张造成的冲突愈发激烈之时,封锁与死守,将是各路玩家对待用户数据和内容本身的真实态度。
因此,今日头条想爬取全网内容的路更是一条死胡同。
那么,在面对技术与竞争格局的重重挑战之下,字节跳动还是一猛子扎进了"搜索"的泳池里,这背后,字节跳动其实谋划着更大的商业野心。
自2018年开始,字节跳动就开始全方位布局,比如推出多闪、飞聊以入局社交,上线gogokid和大力课堂以入局在线教育,推出独立商城"值点"以入局电商。
可见,在图文与短视频之外,字节跳动不断放大业务线,将今日头条和抖音这些增长到顶峰的流量池,引向教育、电商等交易导向的场景中。
这一切,连同搜索业务,字节跳动似乎要在上市前讲一个好故事。
上市之前,各家公司都在讲出"更高更强"商业故事,比如小米的IoT,美团点评的生活服务,这种以自身长板延伸出的商业想象空间,有利于各家企业实现市值冲刺。
字节跳动也不例外,无论是在线教育还是搜索引擎,它讲述的是一个不断撬动用户流量,构建移联网文娱生态的小巨人形象,这种商业故事正是投资人所青睐的。
去年10月,字节跳动被曝完成Pre-IPO轮融资,投前估值750亿美元,而张一鸣曾在2015年表示,要把字节跳动的市值做到1000亿美元。
上市脚步不断临近,字节跳动还要继续创新,不断拉新,冲刺更高的市值目标。这也是上线全网搜索背后,字节跳动的真正野心。
最终,再回归到搜索业务被本身,字节跳动确实想从百度这种巨头嘴中夺食,但在技术、企业封锁等挑战面前,字节跳动真能虎口夺食吗?它的搜索业务又能撼动谁的奶酪呢?
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: