以音乐版权为例:谈谈什么是 “元数据”?又有什么用?
虽然“元数据”对于国内的从业者来说,还是一个陌生的概念。但其实我们每天都在接触这些数据,这些数据构成了我们日常工作中最基础的部分。而往往最小的、最基础的信息,一旦出现问题,带来的影响可能是巨大的。
最近,国外某签约主流唱片公司的音乐人爆料说,他被拖欠了高达四万美元的版税,并且永远无法回收这笔钱。更为重要的是,这并不仅仅只是一首歌拖欠的版税,而是70首歌累计的版税,其中最早的款项可追溯到六年以前。
而这一切问题的源头,则在于歌曲的元数据。
什么是元数据?
元数据是大数据相关的一个专业名词,是关于数据的组织、数据域及其关系的信息。换言之,元数据就是关于数据的数据。
目前,这一名词在我国音乐版权与发行行业尚未被广泛使用。具体到音乐行业,简单来说, 元数据通常是指我们在音乐流媒体平台看到的与歌曲息息相关的信息,包括歌曲名称、演唱者、作词、作曲、唱片公司、发行公司等等。 这些数据需要在歌曲传播、流通时被同步,并且被各个平台、公司的数据库识别,以便在歌曲产生播放收益时准确支付版税。
从产业链角度看,最常接触到元数据的则是跟音乐版权管理、发行相关的工作, 例如:唱片公司、发行公司和音乐流媒体平台。 元数据听起来是音乐行业中一个非常不起眼且枯燥的东西,然而它却跟音乐人和唱片公司的收益息息相关。
提供歌曲相关的正确信息听起来十分简单,但是,现实总是要比理论更加复杂。
“因为相关信息的错误,每一秒我都在流失几分钱。”一位音乐人匿名吐槽道。事实证明,歌曲的原始信息出现各种错误数十年来一直困扰着音乐行业。缺乏准确提供元数据的行业标准,也没有在歌曲发行前确认歌曲元数据的标准流程,世界上更没有一个地方来储存这些歌曲元数据,相反,歌曲的元数据被零散的分布在世界的各个角落。
当你在流媒体上点开一首歌曲的相关信息时,出现的问题绝不仅仅是相关人员的名字拼写错误那么简单。元数据的缺失、错误或对应不上给音乐行业带来的问题,随着创造的音乐和产生的收益越来越多,之后将会演变成一场巨大的危机。
元数据为何会出错?
理想的情况下,元数据应该由制作人或艺人填写,并将数据移交给唱片公司和发行公司。不过现实的流程十分仓促,为了尽快将歌曲上架,唱片公司和发行公司往往会加速这一流程。
首先,由于没有统一标准化的元数据格式,人为输入的错误风险极高,而数据库的数据在转移时也有可能发生错漏。唱片公司的元数据可能与流媒体平台的不统一,流媒体平台的也可能和著作权集体管理组织的不统一。在数据无法被匹配时,只能被修改或被忽略。每个数据库都会有自己的格式要求,这也增加了发行困难和错误率。
其次,最初发布歌曲时,很可能就录入了错误的信息。一首歌可能由多位歌手、词曲作者、编曲者等共同完成,每增加一个名字,数据链就越长,出错率就越高。打错名字、少录入了一个人名,或者在合并数据库的时候发生错误的删减,都是有可能的。
一首歌的元数据可以复杂到什么程度呢?
举例来说:Kate Perry的《Firework》涉及到5位作者,然而这5位作者签约了5家不同的版权代理公司。因此,这些信息全部都要被包含在歌曲元数据当中以便作者能够收到版税。
一家音乐元数据公司的创始人表示,2016年大热的单曲,每首歌平均涉及到4位歌曲创作者和6家版权公司。这样,复杂的数据链会导致元数据出错的可能性极高。少写一个人名、人为错误的拼写,或者无法和流媒体平台的格式匹配,都会导致音乐人拿不到应有的版税。
根据估算,大概有25%的授权费用无法正确的分配给音乐人。 在海外,无法被支付给作者的版税称作“黑匣子版税(Black Box Royalties)”。据统计,这笔钱已经高达25亿美元。而元数据不匹配仅仅是产生黑匣子版税的情况之一。
Kobalt的首席产品官Simon Dennett提到:“曾经在人们还购买CD的时候,一首歌曲一般只有一个版本;然而在今天,一个beat就可能有数百个不同的版本,如不同的混音、封面、YouTube歌词视频或其他语言的录音等等,而所有的这些都可以产生万亿、数万亿的播放,每次播放都会产生收益。“同一首歌产生了多个版本,使得元数据的处理更加复杂。
以国内案例来说,华晨宇和杨宗纬合唱了《国王与乞丐》这首歌,而华晨宇和杨宗纬在之后又在不同的综艺节目上演唱了重新编曲的独唱版本,并被发行到了流媒体平台上。这首歌的元数据就会变得十分复杂。知名乐评人邓柯曾经在微博上提到,编曲的署名也存在极大的不规范性。将一首歌重新编曲,有的改动的大,有的改动的小,然而编曲署名并不严谨,这也导致了元数据的不准确。
虽然国内还未施行对编曲等工作人员的版税支付,但类似的问题也出现在艺人、词曲作者和代理商之间。
一位从事著作权集体管理的工作人员告诉音乐先声,由于一些歌曲年代较早,已经无法追溯版权归属或者词曲作者,而代理商提供的歌曲数量巨大,通常无法一一核实信息。采集到的信息,也往往有很大一部分无法和原始数据进行匹配。这其中包括了同一首歌曲的不同版本的各类信息和归属于不同的代理商、歌手的本名、艺名、繁体、简体的不统一等等。而这些问题的检查、筛选和更正,目前还仅仅是通过人工来完成。
在音乐从实体唱片时代到流媒体时代的转变过程中,也出现了元数据的信息转移遗漏。 曾经,发行实体唱片都会在专辑内写明相关创作者,然而在流媒体时代,一些歌曲在传播过程中,因为年代较早或发行原因,甚至会缺失词曲作者等基本信息。
一位从事歌曲发行的资深业内人士说道:“在流媒体平台上,词曲作者是需要在平台内认领歌曲才能获得相关版税,然而有些歌手在发行歌曲时忘记、或根本没有写词曲相关信息,这样的歌曲就会被认领失败,相关版税也无法支付。”
元数据的缺失和错误当然是可以被修正的,但是,修改一次的成本往往很高,大部分词曲作者也没有精力处理这样的事情。海外有歌手称: “有些错误由于修改一次所花费的时间太长,平台或许会拒绝支付这段时间所产生的版税。”
一位资深从业人员也曾抱怨,由于发行公司的信息和版税分配紧密相连,在发现重要信息标注错误后, 在流媒体平台修改信息需要提交资料层层审核,周期有时甚至长达几个月。而这之间产生的版税究竟会流向何处也未可知。跨国发行的流程就更加复杂,一旦出现歌曲信息错误,修改难度就更高。
什么时候会发生 黑匣子版税?
简单说,产生黑匣子版税有三种原因:
- 唱片公司与流媒体平台预付款和实际付款的金额差;
- 跨国生意中由于各个国家的法律不同而产生的无法支付的版权费用;
- 由于元数据出现不匹配情况而无法支付的版税;
展开来看,一种是唱片公司(比如环球、索尼这样的主流唱片公司)通过流媒体平台发行歌曲并拿到了预付款,当合约结束,实际所获得的款项与预付款产生了金额差,平台方通常会让唱片公司保留这笔钱,以希望能保持长久的合作,而这笔钱不会分配给任何相关作者。
曾经供职于非营利平台SoundExchange的Simson说:“唱片公司都非常喜欢接受这笔钱,因为难以分配的钱就不必分了。”
其实在国内,也有类似的案例。被行业内经常诟病的“音著协”也在此问题上备受质疑。“音著协”因为一揽子许可替词曲作者收费,然而有些词曲作者根本没有加入“音著协”,那么,这些钱去哪儿了?
根据业内人士的消息,“音著协”会保留这笔钱,等到相关作者入会时一次性支付。而“音集协”则会将每年可以分配的收入都分配给会员,并不会扣除未入会权利人的版税。
如何解决元数据的问题?
为了解决音乐行业元数据的难题,有海外有从业者认为可以参考IMDb——一个互联网电影资料库,可以从上面找到演员、导演、制片甚至制作助理的信息。
然而,建立一个音乐行业的数据库看上去简单直接,在实际操作中却不是这样。而最大的阻碍,还是来自于音乐产业的流媒体化。因为每天不仅仅有大量的专辑发布,而且还有单曲和从专辑中拆分出的单曲。
Cross Border Works的Vickie Nauman说:“我们从一年发行十万张实体专辑到每天上传两万五千首数字歌曲到流媒体平台。”
有部分人认为,像TuneCore或DistroKid这样的数字音乐发行公司应该处理这些事情。因为发行公司是艺人与流媒体平台的唯一对接口。还有一部分人认为,流媒体平台本身就应该通过显示更全面的歌曲元信息,来激励所有参与歌曲制作的人确保数据是正确的。
还有一小波人建议,让歌曲作者和制作人在创作完歌曲后就立刻储存下歌曲元数据。不过, 因为版权问题过于复杂,大部分人艺人则根本不了解元数据,也不知道元数据问题可能会影响他们的收益。
目前,针对这一痛点,海外也涌现了一些相关公司。例如:有一款叫做Splits的APP,可让音乐人在线创建一个数字协议,管理歌曲的合作者及其所有权百分比。还有一家名为Creator Credits的科技公司,将元数据嵌入歌曲中,以便能精准地追踪歌曲分发和播放时产生的版税并进行分配。
但就目前来看,没有一个数据库能够获得音乐行业所有作品的所有信息。海外已经多次尝试创建用于歌曲元数据的全球集中式数据库,例如国际音乐联合会(International Music Joint Venture)、国际音乐注册局(International Music Registry)、全球歌曲数据库(The Global Repertoire Database)等项目,都以失败告终。
其原因,大致包括音乐产业不同领域之间的内部斗争、不愿分享信息以及资金问题。还有其他更实际的障碍,例如不同的语言、不同的版权法以及全球各地的产业文化和传统。
虽然制作集中式和标准化元数据的提议令人感到很困难,但大部分人依旧认为这是不能够被放弃的。除了能修正数据外,它还能让版税分配更加精准。Dennett说:“将这些数据整合到一个可以连接聚合全球信息的平台,是一项具有挑战性的项目,但却是一项非常高尚的使命。”
目前,《美国现代化音乐法案》中已经从立法层面提出要建立一个面向社会公开、词曲等权利人可以监督修改的数据库,虽然该数据库应该由谁建立、运营,依旧是一大争议,但至少美国已经在现实中推进和尝试。
此外,区块链技术被认为或许是解决这一问题的出口之一。高晓松曾在接受虎嗅记者采访时曾经提到,MIT的Media Lab媒体实验室已经与伯克利音乐学院合作了一个音乐区块链应用的项目,能做到去中心化分发内容。三大唱片公司、英特尔、Spotify、Netflix都参其中,并且在2017年10月份已经开始试运行。
国内也有不少人认为,区块链可以解决版权保护、跟踪和管理、分割、交易的问题,而且这些过程完全是透明的。
简单来说,将区块链技术应用在音乐分发领域,音乐人可以自己修改元数据、链接参与创作的歌曲,更加透明地追踪版税情况。
虽然“元数据”对于国内的从业者来说,还是一个陌生的概念。但其实我们每天都在接触这些数据,这些数据构成了我们日常工作中最基础的部分。而往往最小的、最基础的信息,一旦出现问题,带来的影响可能是巨大的。所以说,是时候将”元数据“的问题重视起来了。
参考资料:ttps://www.theverge.com/2019/5/29/18531476/music-industry-song-royalties- metadata-credit-problems
作者:Andy;编辑:范志辉;公众号:音乐先声
本文由 @音乐先声 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于CC0协议
作者暂无likerid, 赞赏暂由本网站代持,当作者有likerid后会全部转账给作者(我们会尽力而为)。Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: