科大讯飞联合创始人兼高级副总裁江涛:AI连接万物,共创新时代 | WISE 2019超级进化者大会
7月9-10日,36氪在北京和上海同步举办“2019WISE超级进化者”大会,活动设有七大会场,关注企业发展变革路径、行业风向把握、零售行业的进击与蜕变、万亿企业服务市场的崛起、产业创新机会、全球化趋势与差异化需求的爆发逻辑等议题,邀请超百位行业领袖,聚焦那些引领行业变革的超级进化者的崛起之路。
万物互联时代,人工智能取得了突飞猛进的发展,语音合成、识别等技术也在司法、教育、医疗、家庭等多场景上落地。未来还有哪些应用可以大规模的进行产业化落地,实现从算法到应用的持续迭代成为最受关注的问题,也成了未来人工智能领域最大的产业机会。对此,科大讯飞联合创始人兼高级副总裁江涛认为,一方面要让机器从能听会说到能理解、会思考,从感知智能进阶到认知智能。另一方面,人工智能不光要实现技术突破,还要形成量大面广、可以在商业上获得巨大成功、有影响力的产品,让用户真正有意愿付费购买,为你的产品“投票”。
以下为嘉宾演讲实录:
各位开发者、创业者,大家上午好!
科大讯飞是由一群中国在校大学生发展起来的上市公司。1998年科大讯飞的团队成员还是中国科技大学实验室里一帮做研究的人,1999年才成立了这个小公司。今天看到这个主题“超级进化者”,我们还是蛮有感触的。2008年科大讯飞上市,33亿的市值。上市十年之后,规模进一步扩大,也跟大家一样共同面对人工智能时代巨大的产业机会。
今天想跟大家分享我们对人工智能时代产业机会的看法。从科大讯飞的角度来看,人工智能已经发展到了什么阶段呢?首先要跟大家回顾一下科大讯飞过去十年,在人工智能上所做的工作。
2010年全球有两家公司基于深度学习算法,在语音识别上第一次做出了突破。一家是谷歌,做了英文的连续语音识别。另外一家是科大讯飞,2010年10月28号在北京香格里拉酒店,发布了全球第一个连续中文语音识别系统,这个系统在全球也是领先的。我们用了几年时间,把深度学习理论框架进一步琢磨透了以后发现,深度学习这套体系,不光是解决机器能听会说的问题,也可以进一步延伸到能理解、会思考。很多有规律可循、重复性的脑力劳动,在特定任务里拿到足够多的过程化数据,有足够多的领域专家给我们训练,在特定任务上机器可以不断逼近这个领域的专家水平。2014年我们开了一个很大的发布会,正式启动了“讯飞超脑”这个项目,它要解决的问题就是让机器从能听会说到能理解、会思考,从感知智能到认知智能。
科大讯飞在努力探索从能听会说到能理解会思考,有哪些应用可以规模化落地,可以实现从算法到应用的持续迭代。过去几年的探索下,2018年科大讯飞在包括教育、医疗、司法等领域的赛道上,已经跑出了一批非常好的应用。在我们公司的大会上,刘庆峰董事长跟大家说,现在科大讯飞人工智能战略到了2.0阶段,就是红利兑现期。人工智能不光要实现技术突破,还要形成量大面广,可以在商业上获得巨大成功、有影响力的产品。
我们回过头来再看看人工智能的核心技术发展到什么阶段了,首先看一下语音合成技术。今年中央广播电视总台联合科大讯飞,基于我们的技术做了全球第一个多语种的虚拟记者“通通”。我们拍摄了主持人的形象,录了一小段视频,可以让机器说世界主流的语言来当主持人。这不光可以用在央视,像36氪这样的媒体合作伙伴也是有需求的,它能让你们的内容变得更加生动有趣,更加个性化。
语音识别这几年取得了突飞猛进的发展,但随着万物互联时代的到来,语音识别的要求也越来越高了。在万物互联时代,很多设备离我们比较远,比如智能家居。如果你要走到设备的开关面前再说指令就没有意义了,还不如直接摁一下开关。智能家居,就是要在远距离情况下,能控制家用电器。在高噪音的情况下,比如一边开车,一边语音命令控制。在远距离、高噪声、多人说话的情况下,语音智能还能不能做到,这才能体现出万物互联的价值。
去年,在号称史上最难的语音识别比赛CHIME-5上(一个在厨房、起居室等各种场景下进行的高难度比赛),科大讯飞作为中国代表击败了美国同行,拿到了全球最好的水平,在所有的四个主要指标上都囊括了全球第一。基于这些技术的突破,人工智能从去年到今年在大规模的进行产业化落地。科大讯飞也发布了一系列围绕办公场景的产品,比如转写机,现在有一些基金公司在购买使用。它是一个小箱子,一打开可以实现会议记录。会议开完以后,生成一个二维码,所有在场的人一扫二维码,从PPT到演讲者说的话、从语音到文字,都可以直接分享查看。我们还有智能办公本,大家开会中说的语音内容也可以变成结构化的文字。除此之外,会议记录系统、智能录音笔,都在618取得了很好的售卖成绩。我们是把办公场景产生的声音和手写的文字,变得可保存、可检索、可统计、可分析,极大提高办公效率。我相信这个场景未来有很大的空间,这是人工智能实实在在落地的、已经达到的规模化应用。
当然光讲技术突破没有用,还要看用户是不是拿他的钱来为你的产品“投票”。刚刚过去的618,在京东、天猫这些平台上,科大讯飞围绕办公场景做的一系列产品,都得到了市场的高度认同,比如“机器翻译”。科大讯飞去年的机器翻译推动实际规模数据的统计对比结果,已经远远超过六级考试的大学生水平。而基于这项技术开发的讯飞翻译机,也得到了市场的认可,已经覆盖了200个国家和地区,在今年618众多翻译机品类中遥遥领先,得到的用户的广泛认可。
刚刚说了“能听会说”的规模化应用,从2014年科大讯飞启动“讯飞超脑”之后,科大讯飞重点加码的领域,是从能听会说到能理解会思考。围绕很多脑力劳动者,也就是产业互联网中的需求,除了语音之外,进一步到了认知层面。这些脑力劳动者在特定任务上的表现,机器也在不断学习。这里有一项基础技术叫机器阅读理解技术,也就是机器对于人类自然语言描述的文章能读懂多少。在“讯飞超脑”项目支持下,这方面的研发加大了力度。去年1月22号的SQuAD上,科大讯飞首次在F1指标上,超过美国大学生水平。这是斯坦福举办的机器阅读理解的挑战赛,谷歌、微软、IBM、Facebook等全球主要的科技巨头都参加了。尤其是微软,这几年持续加大对人工智能的重视,且微软过去几年里都在这项比赛中保持了全球领先。但是2018年1月份,我们超过了微软。目前在精确匹配指标上,全球有两家公司超过了美国大学生水平,一是家微软,一家是科大讯飞,而且我们得分比微软还高。今年3月20号,我们用全新的算法,再次刷新了记录。在SQuAD 2.0比赛中,精确匹配和模糊匹配,我们都超过了美国大学生的水平,这是机器阅读理解领域非常有里程碑意义的测试。
机器阅读理解达到了这样的水平,在应用上有什么变化呢?教育领域是个例子。在前年一些典型的比赛比如高考、研究生考试上,机器在批改作文的主观题上,已经达到了人类专家的水平。机器无论是小分差、中等分差还是大分差上,都比人类的阅卷老师有明显的优势,改得更准、评分更稳定。基于这些技术突破,我们通过人工智能可以系统分析孩子写在纸上的内容,然后把孩子做作业、考试的过程化数据收集到,分析孩子的薄弱环节,给他提供个性化的指导方案。
除此之外还有医疗领域的应用。科大讯飞是全球唯一一个通过了国家医师资格考试的技术系统。国家的医师资格考试满分600分,科大讯飞的系统跑了456分,超过了2017年53万考生理的96.3%,具体的临床问题机器能够分析,并给出解决建议。在去年我们把这项技术真正做成了产品投入应用,到今年年初每天已经有1.3万个真实场景下的辅助诊疗的案例产生,覆盖了900多种常见的疾病。这套系统不是给最顶尖的医生用的,而是给基层医院社区、县级医院的医生用,减少他们的漏诊、误诊。95%的常见病,机器都能提供建议,诊断的准确率也在不断提升,目前是达到了97%。随着数据规模不断提升,未来的准确率还会持续提高。
当然人工智能是一个伟大的历史进程,不是三五年就能走完的。人工智能的核心技术从算法上,包括对小样本、无监督的场景进行持续训练,怎么跟脑科学、类脑科学进行结合,还有很多工作要做。人工智能在应用模式上,怎么实现人迹协同,也都还有大量要探索的工作。从感知智能到认知智能的很多核心技术,我们都已经把它包装成科大讯飞开放平台,向所有开发者开放。现在这个平台上已经有100万开发者,在场也有很多创业者,希望大家都可以到科大讯飞的人工智能开放平台上来。你不用管深度学习底层的技术实现有多复杂,你尽管在熟悉的领域做擅长的事情,把复杂的人工智能算法交给科大讯飞。通过这个平台,我们希望帮助大家共同获得成功。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: