虎博科技创始人陈烨:成为助手、垂直化且实现闭环,这是下一代信息入口的雏形 | WISE 2019超级进化者大会
7月9-10日,36氪在北京和上海同步举办“2019WISE超级进化者”大会,活动设有七大会场,关注企业发展变革路径、行业风向把握、零售行业的进击与蜕变、万亿企业服务市场的崛起、产业创新机会、全球化趋势与差异化需求的爆发逻辑等议题,邀请超百位行业领袖,聚焦那些引领行业变革的超级进化者的崛起之路。
如果人们想自由的探索世界,首先要自由的获取信息。但已经拥有了搜索引擎、App以及推荐算法的我们,真的做到了自由探索世界吗?这个问题或许仍旧存疑。而虎博科技想做的事情,是通过人工智能的方式帮助人们重新解构更私域、更线下、更有价值的信息。在虎博科技创始人陈烨眼中,下一代的信息入口应该至少做到三点:符合第一性原理,更垂直,实现闭环。
以下为嘉宾演讲实录:
感谢36氪邀请虎博科技,今天分享一下我们在人工智能,特别是文本处理上的一些思考。
让我们自由地探索世界,这是虎博创业的初心。首先一起回顾一下,互联网发展史上的Killer Apps(杀手应用)。目前我们已经经历过Web、网上浏览、门户网站,最近的电商、社交,还有2007年iPhone问世。这个发展史上有几个规律。
第一,每一次大的Killer Apps背后,都有一个颠覆式技术的创新。从WWW到移动互联网,再下一步我们认为是人机对话。
第二,这个应用是惠及全人类的。
第三,这个发展历程中貌似还没有中国。
虎博相信在当今这个时代,在互联网Killer Apps发展史上中国能够写上一笔,这也是虎博的初心。
还有一个规律,每一次大的技术变革,导致的应用和商业变革都是从连接人和世界开始的,或者连接人和世界的信息开始的。它使得每一个人获取信息变得更简单、更自然。这也是虎博在做的事情,我们想打造新一代的,连接人和信息的入口。PC时代入口是搜索,这里面有谷歌和百度。移动互联网时代变成了推荐,大部分时间被推荐占用。那么下一波是什么?虎博想回答这个问题。有一个数据,现在中国人平均在网上的时间是9个小时,在移动端花费的时间是4个小时。仔细想一下,这些大部分的时间是推荐,但推荐有没有解决获取信息的问题呢?这是我们观察到的趋势。也正是这些趋势诞生了虎博和虎博想做的事情。接下来我分几个方面拆解。
第一,已经有足够多的Killer Apps App(杀手应用级App)占满了用户时长,但获取有用信息依然低效。
在座很多人都有刷几个小时抖音的经历,但静下心来问一下,它有没有解决获取有用信息的问题?没有。当你找一些专业信息时,依然低效。
第二,有价值的信息变得更线下、更碎片、更私域。
有价值的信息变得越来越线下,也更碎片化、私域化了。它可能存在于公众号里,可能存在于你和朋友的对话里,甚至存在于朋友圈或者语音、视频里。怎样把这些有价值的信息用人工智能的技术,再收集、重构、总结、呈现在用户面前呢?这是我们面临的下一个巨大机会和挑战。
第三,下一代用户更需要自然的、一站式、无缝的体验。
我们想到了机器人助理,用户不需要打开很多App。虎博是从金融开始切入的,我们有一个产品观,有用的信息入口下一代应该更垂直化、专业化。每个人都有金融需求,比如理财、看行情、看资讯。你需要打开多个APP或者网站。
深度学习过去十几年的发展,让这个世界的信息以更有效的方式重构。我们具体总结为两点,第一,更深层。第二,更结构化。
先说更深层。很多东西变得更深,不是原来的网页,它可能存在一个文档或者声音里面。我们的技术或者爬虫、数据处理,要进入更深的领域。人工智能使我们能逐渐做到这一点。然后是更结构化。每个人的思维都是结构化的。最抽象的方式是我问你答,或者有一个问题让系统给你答案。NLP可以以更有效的方式,逐渐实现这一点。
举两个真实例子。首先是虎博搜索引擎,在金融领域特别是公司研究领域,当用户问了一个口语化的问题,这个问题是瑞幸咖啡门店数。系统能够瞬间返回给你的答案。而且这个答案不是新闻稿,也不是数据库,而是瑞幸咖啡财报,并且不是一个文本,而是在一个表格里面。虎博能够像人一样解构这个表格,使得能够呈现结构化的数据。
第二,能够用人工智能覆盖大量的长尾数据,这也是当年谷歌打败雅虎和其他门户网站的原因,我们要重现这一点。用同样的技术,不光可以解决金融、财经领域的问题,还可以解决对用户信息需求比较大的领域问题。上海和北京的朋友现在面临一个问题:你是什么垃圾?我们可以输入渣男和渣女看看,这背后用的是最前沿的算法,什么东西都能分、都能理解。为什么渣男是有害垃圾呢?因为提到渣男的语境和有害垃圾的语境比较类似,所以用人工智能统计学的方法进行了推演,能够解决这类问题。
虎博的产品观,更多是To C的,要解决用户的问题,把用户的场景和需求闭环。
回到当初的问题,下一代的信息入口应该是什么样子?我们没有完全的答案,还在不停探索。目前总结了三点,也正反映了虎博做人工智能产品的产品观。
第一,第一性原理。
希望人工智能、产品不仅成为你的工具,而能够理解你,成为你的一部分。像你的朋友、助手一样陪伴你。这里面牵涉到的技术是自然语音理解和行业知识图谱。
第二,垂直化。
我们认为下一波信息类产品的机会或者需求,存在于垂直化、行业化、专业化的领域。当然专业化在中国互联网不是一个很好的词,大家会想到受众比较少。美国一些访谈内容是垂直化、专业化,而不是泛娱乐。但我们要做,我们认为这是中国市场缺乏,是我们这个赛道缺乏的。
第三,闭环。
因为垂直化,所以每一个垂直要闭环。什么叫闭环呢?因为用户的需求不止是获取信息,获取信息是为了做一个交易或者决策,甚至是和人去交易。在很多场景下,从金融到教育、医疗,是从信息获取开始,做一些社群社交,然后完成交易闭环。这里面有很多原因,只有真正的闭环,才能够真正敏锐把握用户的需求。同时只有真正的闭环,才能真正建立用户的逻辑。
为什么是垂直化、行业化呢?坦率讲,人工智能特别是文本处理发展到今天的阶段,必须利用每一个行业的结构、行业的特性,尊重这个行业才能做出有用的产品。做出有用的产品是虎博最关注的,而不是做出最酷炫的产品。
比如金融行业的信息需求我们总结为找公司、找行业、找市场行情。数据供给是哪里?是公司的财报、研究报告、资讯、行情数据。有了这个结构,我们惊喜地发现,我们的产品会超过一般的搜索引擎。在我们落地的场景里面,在用户获取信息效率上,提高了至少10倍,甚至是几百倍、几千倍。
总结一下虎博的七大核心技术。
智能搜索、智能推荐、机器阅读理解、机器总结、机器翻译、机器舆情分析、机器撰稿。我们是核心技术自己做,并且做到全世界做好。 比如结构信息的抽取、总结、翻译,在金融领域的水平是超过世界巨头的,包括谷歌。
虎博的金融产品矩阵,秉承的是让大家获取信息更自然、更简单的产品理念。其中有一个很好用、很有态度的产品,叫做西梅。这是汇聚了全球顶尖的资讯媒体,用我们的机器翻译和总结,把最有用的信息呈现在用户面前。之前有的朋友说,你们有个产品比较好,是不是梅西?梅西是阿根廷的球星。我们正好相反,叫西梅。它是全部自动的,并且不停在扩张好的内容、好的媒体形态。这是虎博科技的介绍。回到初心,我们希望做的产品能够让我们自由地探索世界,谢谢大家。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: