新科技创业2019 | 研发神经网络合成加速技术降低60%成本,「激浊扬清」有声读物合成方向加速商业化
受访公司:北京激浊扬清文化科技有限公司
受访人:CEO汤巍敏
公司所处大赛道:人工智能、媒体技术
公司所在细分赛道标签:智能语音、 语音合成
官网:http://www.jizhuoyangqing.com/
36氪此前报道:《做语音新闻聚合推荐平台,「随身听」获远望资本数百万元天使轮融资》
Q1、2019年第一季度 , 公司在技术、产品、市场、商业化、融资、团队等方面取得了哪些进展?
北京激浊扬清文化科技有限公司是一家提供声音合成模型和AI资讯技术服务的信息大数据科技公司,以独有的舆论预测算法、文章摘要抽取算法及先进的声音合成模型,为客户提供热度预测、内容精炼、音质优良的语音内容服务;产品为“随身听”,是智能音箱和车机的音频资讯产品,有别于传统的音频串烧,随身听可检索、可推荐、可图谱联想。随身听的下一版会做合成有声读物,提升有声读物生产效率和用户体验,打破内容平台积累的录制门槛。
公司创始人来自百度大数据团队,在百度期间均曾获得百度hackathon大赛黑马奖。核心技术骨干是硅谷音视频技术公司OpenTv的同事。目前已经获得:中关村高新技术企业、国家高新技术企业 等资质。核心客户主要有:人民日报社,腾讯,人民网,环球网等。
2019年第一季度,技术方面,神经网络合成技术加速,实现了实时率1以内;减除了GPU的依赖;韵律模型2.0上线。目前行业的主要成本在时间成本和GPU服务器的经济成本;提高实时率将直接提升时间效率,减除GPU依赖,能降低60%以上的经济成本。
商业合作方面,与人民网、环球网,独家技术服务战略合作;与人民日报社签订了有声报纸音频合成技术合同。有声读物合成方面,启动商业化,签订两家合作伙伴。
Q2、2019年, 公司在技术、产品、市场、商业化、融资、团队等方面,可能还会有哪些新进展?
技术上,研发韵律3.0;文本处理技术更进一步,让韵律更自然;高音音色充实,让听感更清澈;实时率再提升一倍,时间效率更高。
商业上,有声读物合成收入超过资讯合成,并继续在资讯和有声读物合成领域深耕。
Q3、2019年第一季度,行业内发生的对所在行业影响最大的三件事?
融媒体国家政策推动: 国家有千亿的投入将带来这个行业的繁荣,影响行业的发展。
2C音色学习应用:会给声音合成带来很多新玩法和商业机会。
播音主播纷纷AI化。
Q4、2019年第二季度,会关注的行业大件事有哪些?
国际前沿的AI技术动态。
融媒体推进步伐。
有声读物的AI化。
Q5、2019年, 自己所在的行业、所在的细分方向大概率会出现的事情和趋势会有哪些?
音视频版权AI化。传统靠音频版权积累的护城河会降低。AI技术在资讯媒体上的应用,媒体效率提升。
这些变化对有声内容平台公司和版权公司将带来较大的不确定性,对媒体技术公司将迎来可能的变革的机会。
Q6、2019年,公司所在的行业会呈现出来什么样的竞争格局?
我认为最重要的竞争力是:技术竞争力,工程化能力、效率。这也正是我们一直深入的,另外细分领域的定制能力也很重要。
Q7、2019年,公司是否会有一些里程碑节点?
我觉得下一步很重要的一个攻克方向是自动化标注和学习。这个技术将带来技术应用效率的大提高,成本大大降低。
Q8、2019年,公司所在的赛道上的公司,有什么一定要做的事情或者争夺的市场?
这个领域目前还比较碎片化,还没有连成片的大规模应用之前正是积累新的技术路线经验和争夺细分高地的时候。
新科技创业系列主要针对新科技方向的公司,如AI、机器人、物联网、医疗、3D打印、区块链、智能制造、传感器、半导体、VR/AR/MR 、商业航天、新能源、新材料、有技术创新的硬件等。如果你对这个系列感兴趣,欢迎参与我们“新科技创业2018”系列的调研,调研问卷下载地址:https://shimo.im/docs/d7YCMGpugIwmI4HC/,问卷回复请发送至syq@36kr.com。
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: