AI技术突破音频内容生产瓶颈,文字时代加速转向声音时代
图片来源@视觉中国
2018年2月,中读的会员卡分销一夜之间在朋友圈刷屏,一日之内售卖5.4万份,也让这个《三联生活周刊》(以下简称《三联》)推出的知识平台第一次为大众所熟知。
然而,当知识分销后来被微信紧急叫停,一次性打包售卖10年杂志电子版的"大甩卖",注定要回归到细水长流的知识付费。
传统媒体转型的最大痛点:文字内容"产品化"
虽然中读也曾经找过朗郎这样的明星IP来合作头部内容,但并不顺利。因为与得到、喜马拉雅这样的头部内容平台相比,20多年下来积累的优质内容及读者群体,才是中读相比其他平台最大的优势。
然而,把这些文字内容专为化知识付费产品,却注定要经历一个"内容产品化"的过程。10年电子版会员卡这种简单粗暴的方式,也要让位于更精细、更原生、更智能的产品设计。
"我们的文字内容是常态化生产的,但是音频内容没有达到这个目标,不管是小课还是专栏,都不能做大常态化生产。"中读创始人朱文轶曾经表示,让音频内容可以有规律性地持续生产是中读团队一直以来的追求,也是整个知识付费行业的"痛点"。
2018年,中信出版集团找到《三联》,将《我们为什么爱宋朝》、《宋朝那些人》两个"爆款"封面故事集结出版,这也是杂志将内容再次变现的传统方式。
然而,随着互联网碎片化内容获取变得愈发廉价与便捷,纸质书销量的连年下滑,对于杂志来说,"集结出版"这块原本脂肥膏厚的蛋糕优势不再。
"我们还可以做什么?"当中信出版的图书引发了一定反响后,《三联》总经理李鸿谷陷入了新的思考。
本次大会上,李鸿谷提到:
古登堡发明印刷机的时间是1439年,有个统计是,此后的1453到1503年,欧洲的印刷文本共800万册,等于之前欧洲全部手抄本的文字量。
而如今,随着信息进入互联网深度传播时代,全球每年创造的信息量更是不计其数。《三联》的执行主编每日至少要通过pad或手机、电脑读5万字的文本,这些容易产生视觉疲劳和"视觉超载"。
AI音频技术,突破了声音内容的生产瓶颈
鉴于此,《三联》开始考虑扩大此前于2017年开始试水的音频课程,将宋朝故事发展成了音频内容《我们为什么爱宋朝---- 宋朝美学十讲》。继按专栏集结成书之后,存量内容又有了更易消费和传播的呈现方式。
只是接下来,在大规模"文字音频化"的过程中,原作者的时间成本与专业声优的制作成本,成为了其盘活亿级内容资源的瓶颈。
在中读开设音频节目的《三联》资深主笔袁越,谈到了自己录制时的使用感受:
我花15年写了80多万字的《生命八卦》专栏文章。如果在录音棚里把它们一遍又一遍朗读出来,会累死。如果用普通音频软件来读,又很容易读成催眠曲。
随着AI语音技术的持续发展,中读终于找到了音频内容常态化生产的"最优解"。
8月21日至8月25日,北京国际图书博览会(BIBF)期间,中读举办了以"声音里的知识和AI"为主题的知识大会。在大会上,中读介绍了自己谋求转型的新经验,在2017年年入局付费音频领域后,又发布了首个AI语音定制专栏。
为此,《三联》采用的新方式,是携手微软,将个性化语音定制技术运用到有声内容生产中,AI音频在经过训练后被赋予文章原作者的声音,让听众感觉到"如闻其声"。
传统的有声内容主要依靠名人、主讲人或者声优亲自上阵录制,往往需要耗时几个月,成本巨大。声音录制也受限于人员、时间、环境等因素,无法实现产能最大化,求知者接收优质内容的时间也会随之延迟。
而 个性化语音定制系统则彻底突破了生产瓶颈,只需少量训练数据量就可以训练出一个逼真自然的人工智能声音,大幅度提高了存量内容的转化效率, 有利于优质内容的高效生产、再生产以及声音知识的优化和传播。
文字内容的音频化也不仅是一个文字转换为声音的过程,更是与用户关系的进一步拉近,毕竟性格各异的声音比千字一面的文字更有亲切感,更容易打造作者的独特人设。
不仅如此,相比于文字内容结集出版,音频课程的规模化生产可以更自由、灵活地对文字内容进行结构化梳理,无论是大课、小课都可以灵活定制。除了亿级的存量内容,《三联》每期15 --20万字的内容将成为源源不断的内容库。文字内容与音频课程的同步、互动,也将激发出更大的想象空间,可以称得上是内容领域的O2O。
破壁语种障碍,多语言音频内容助力文化出海
AI技术也使"生产出形式多样的衍生内容产品"成为可能。"让课程主讲人开口说他不会说的语言,从英语、法语甚至是当地方言,实现多语种及多种说话风格的输出"是中读进行的另一项大胆尝试。
本次大会上,中读除了展示首个AI音频产品《土摩托*生命八卦》外,还展示了最新推出的《宋朝美学十讲》的英文版本。
当《三联》与中读的高知用户走向海外,常常会遇到向外国人传递中国传统文化的反向需求。此时,AI技术便可生成有一定语调和节奏感的他国语言版中国故事,便于拥有对外汉语传播交流需求的人群向外输出。
不仅如此,这种中英文内容的切换,对在国内生活的海外留学生和专家学者来说,也拓展了学习汉语和汉文化的途径和内容。
在"中读"《土摩托*生命八卦》知识音频栏目下,钛媒体发现,有受众指出了音频仍像"机读"、断句和读音错误等技术bug。诚然,当AI音频初推之际,技术的不足会影响用户体验;不过,技术会随着发展而进步,AI音频普及之后可能带来的知识产业变革,却是不容忽视的行业新风向。
在AI语音技术的加持之下,能够转换语种的合成音频产品,对于《三联》来说,不但盘活了存量内容资源、拓展了用户的碎片化使用场景,还破壁了语言限制、将用户肖像扩大到了截然不同的新群体中。
同时,AI音频的普及,还使原本生产一次性内容的文字工作者变成了IP供应商,极速提升了产品二次变现的效率,可以很大程度地改善传统写作者的生存状态。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: