什么叫好内容,一个细思极恐的问题... - 扯氮集
-- Preview: --
1
28日下午,应上海社科院新闻研究所邀请,参加了一个小型讨论会,主题是“何为优质在线内容”。
通俗地讲,就是“什么叫好内容”?
这个问题看着简单,其实仔细想想,是能够想出一个细思极恐的结果的。
2
非常巧,27日中午在微信上,我和馒头大师关于好内容这三个字还唇枪舌剑了一番。
这位游戏爱好者感叹《荒野大镖客2》的盛况:上线一周狂卖800万套,营收5亿美金。这部游戏研发历时8年,投入8亿美元,但馒头大师认为大赚是没有悬念的:预计能卖出2000万套。他又举了一个《GTA5》的例子,这部神作卖了9500万套。
他的结论是:好内容不怕等,也不愁卖。
我的问题是:什么是好内容呢?魔兽世界这部电影在中国票房是不错的,但却输掉了全球票房。它算好内容吗?
馒头大师“好内容不怕等也不愁卖”这句话,总给我一种以结果定义“好”的味道。假设《荒野大镖客2》卖了800套,算好内容吗?
不过,这种问法也有很纠结的地方:如果不好能卖那么多吗?
有时候我们还会碰到这样一种情况:一个内容刚刚出来时,既无叫好也无叫座。但过了N年后,却成为“神作”——优秀内容。
典型的例子就是:周星驰的大话西游。
影视剧、游戏,都是非常复杂的“内容”,我们退一步,先说图文类内容。
到底什么叫“好”呢?
3
点击量。
很遗憾,的确点击量就是度量内容好坏的指标。
用结果倒推好坏,在当下,恐怕是最硬的客观证据。
但这里还要再做精细化工作,点击量需要分类。
读来非常轻松的短篇娱乐报道,和严肃的长篇某上市公司深度调查,他们的点击量比较是没有意义的。
目标人群不同,以及,很重要的,阅读目的也不同。
但我想,既然内容文本可以做“颗粒化”工作,受众也是可以做“颗粒化”的。
我们甚至可以发现,一个被公认为有眼光的人(比如马化腾),和一个不过尔尔的人(比如魏武挥),在同一篇文章上的阅读行为(例如阅读时长,例如是否反复上下拉动以表示在仔细阅读与否,例如是否分享甚至包括分享时所加的一段简单短评)。很显然,我们要为前者的度量加一个权。
在大数据面前,按照不同维度进行分类的点击量比较,总是有操作路径的。
无论怎样繁复,恐怕好内容在结果上,是可以度量的。
4
读到“从结果倒推内容好坏”,如果你还能表示同意的话,那么再往下一步,还有一些惊悚的推论。
我们可以根据大量的内容度量的指标,从而发现这些被视为“好”内容的共性。
换而言之,我们能找到“好”内容的生产方法。
请允许我用一个文科生看到就皱眉的词:算法。
好内容的生产是可以有算法的。
其实,经验就是一种还没有数据化的准算法。把经验变为算法,我并不觉得是什么完全不可能的事。
棋手下棋,是要讲经验的。
我们已经成功地将下棋经验变成算法,最后击败了人类。
司机开车,是要讲经验的。
但我们正在努力让司机的经验,变成“算法”。自动驾驶现在已经走到了L3的阶段。
如果把生产内容这件事往AI上靠,类似自动驾驶,大概也是能分出所谓L0一直到L5的阶段的。
在一些很简单的内容生产上——比如财经数据播报——机器人新闻走到L3阶段应该是没有疑问的。腾讯的Dreamwriter在三年前就已经浮出水面了。
撰写一篇评论文章,为什么不能有算法?
有足够多的数据能建立真正的内容访问量指标(而不是大而化之仅仅比较十万加还是九万加),就一定能找到所谓“好”内容的算法。
5
和家父魏永征教授讨论这个事。
我提到唐诗宋词这种对今人难度很高的内容创作,我认为调教AI写唐诗宋词比调教其写散文容易得多。因为唐诗宋词讲格律,算法比散文清晰。
家父表示了不同的意见。在他看来,格律诗乾隆大帝写了数万篇,也不能和李白杜甫辛弃疾李清照相提并论。
我在同意之余,却认为,在大部分阅读的场景下,我们要的不是艺术品(李杜辛之类),只是普通读物(乾隆的水准就可以了)。
艺术品大概还是人类的势力范围。
家父又提出,好内容对人类的情感是有影响的,而人类情感,计算机恐怕很难理解。
不能理解不是问题,关键是能不能掌握影响情感的方法(至于这个情感到底是什么,不知道也无所谓)。
我们已经略略看到了一种经验的复制可能性。
比如那篇刷了屏的锦鲤文章,有人发现,写作者是著名情绪调动高手迷蒙的实习生(有可能是助理)。也就是说,咪蒙的方法是可以复制的。
事实上,咪蒙本人对她的经验也有一定的归纳。
当然还是经验范畴,不是算法范畴。
但这一步真得很难么?
6
回到问题本身:何为在线优质内容。
如果这个问题有解,那么,人类将再次向计算机拱手交出自己的一块地盘。
探讨在线内容的优劣,其实就是在摸索优质内容的标准,其实就是在摸索优质内容的方法,其实就是在摸索优质内容的算法。
这一步一步下去,终将使得大学取缔中文系,取缔新闻系。
当然,我承认,找人采访挖料这种事,计算机大概干不来。
但人类就变成了AI厨师的下手:把料准备好。往算法里一灌,好内容立刻生成。
这个意义上讲,新闻专业还是要的,但大概高职就够了吧。
7
“千人千面”这四个字,诸位可能是不陌生的。
我们平时讨论的“千人千面”,更多意义上是传播向的。内容是人工生产的,算法根据你的一些特征,有针对性地分发内容给你。
我们设想这样一种情况。
我对某事感兴趣,当我输入关于这个事的关键词后,算法自动生成一篇我认为是“好”内容的内容。
如果再进一步,算法连我输入这个动作都不需要,直接就可以推送我感兴趣的且我认为叫“好”内容的内容?
有那么点AI“洗稿”的意思。
我有生之年看得到这种“盛况”么?
8
希望能看到扎实的反对意见。
—— 首发 扯氮集 ——
本号不接受商业合作,实在死乞白赖想合作,五十万一篇好不?
作者执教于上海交通大学媒体与传播学院,天奇阿米巴创投基金管理合伙人
阅读原文
Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: