百度地图推出语音定制功能,可以生成个人语音包 | 钛快讯
图片来源@视觉中国
钛媒体快讯 | 9月19日消息:百度地图事业部总经理李莹今日宣布,百度推出行业首个地图语音定制功能。据李莹介绍,语音定制功能推出后,用户只需要在手机录制20句话,经过20分钟左右的制作,就可以生成个人完整语音包。
如图,用户可从百度地图首页进入语音定制页面,可选择性别,还可以录制童声。录制的文本方面,用户也可以选择系统推荐文本,卡通文本和电影台词。特别是录制童声时,百度为低龄儿童设置了语句更短、可重复的儿童语句。录制完的语音包可以自己使用,也可通过微信或者百度地图分享给他人使用。
百度地图语音定制模块图示
据悉,用户定制的语音包使用场景比较广泛,在手机地图的任何场景中都可使用,比如景区智能语音导览、智能语音交互等全部场景使用。用户可免费使用自己或家人的语音包在景区游览。
李莹也特别强调,在整个流程中百度地图遵循了业界最标准、最成熟的安全规范,采取了非常安全的保护措施,会最大程度的保障每个用户的安全隐私。"百度地图对于语音定制服务的权限获取将仅用作语音包录制,不做他用。百度地图未经用户的授权同意,不会将用户的语音包共享给任何人。"
李莹在演讲中介绍道,如果做一个通用大库的语音包,大概需要录制的语音量是上万句,制作周期近半年。如果做个人定制的,如某一个明星的语音包,需要在大库基础之上录制1000到2000句语音,要在专业的录音棚里面录制大概两周时间,而真正把这个语音包用语音技术生成出来需要两个月的时间。
新的语音定制功能大大缩减了此前语音录制的成本。 百度语音首席架构师贾磊介绍了语音定制功能背后的技术:
" 百度地图语音定制功能基于百度独创的说话人韵律迁移技术Meitron,其特点主要体现在发音人音色转换,多情感朗读和韵律风格迁移三个方面,从而让个性化语音合成的定制门槛大大降低。"
云端深度学习语音合成技术可形成不同风格的声音
贾磊介绍道,以前语音合成大多数都是新闻播音腔,而现在百度的语音合成可以有多重风格和声线。在现场原声与合成声音的比对测试中,两种声音几乎分辨不出差别。
当前,在数据生产方面,百度地图80%数据采集环节已实现AI化,拥有3000万的POI空间图谱、700万的用户兴趣图谱,共同组成了百度地图POI高精知识图谱。
(本文首发钛媒体,作者/芦依)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: