1800万条点评内容抄自携程美团?马蜂窝:正在核实
在餐饮方面,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上,抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到他们官网声称总点评数的85%。
-- Preview: --
马蜂窝“点评造假”的消息已经在网上沸腾了一个周末。
10月22日早间,马蜂窝终于正面回应此事:“针对该文中歪曲事实的言论,和已被查证的有组织攻击行为,马蜂窝将采取法律手段维护自身权益。 ”
10月20日,微信公众号“小声比比”发布了一篇题为《估值175亿的旅游独角兽,是一座僵尸和水军构成的鬼城?》的文章,直指旅游社交分享网站马蜂窝上的2100万条“真实点评”中,有1800万条都是“通过机器人和从点评和携程等竞争对手那里抄袭过来的”。
作者在文中表示,马蜂窝点评的增长趋势在某段时间里非常诡异。比如,点评的数量,会在特定时间节点呈“指数级上升,随后断崖式回落”。并且出现了很多点评账号自我身份矛盾、时间错位的现象。
作者抓取了马蜂窝上116万家餐厅,并抽取了其中三分之一作为样本,同时又抓取了大众点评、艺龙、携程等其竞品网站的内容进行对比,同时强调,自己定的“抄袭标准”为“一字不差”,也就是说,和来自其他网站的内容一字不差的点评才会被定性为抄袭,“哪怕十句话中有一句不同,就不算抄袭”。
尽管“抄袭标准”已经十分宽松,但作者还是有所发现:
在餐饮方面,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上,抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到他们官网声称总点评数的85%。
作者在文中指出了几点证据,证明马蜂窝的点评内容多是出自抄袭:
很多账号的身份、性别、地点都自相矛盾。比如有的显示为“官方账号”的问答账号,会在同一天之内既发出“给老公在上海定了全季酒店”的内容,又写出“和女友在南京汉庭睡得很好”的评价。类似的事故还有很多:
同时,一些“抄袭”自Yelp上的评论,还有着使用谷歌翻译机翻的痕迹:
有时候还会错抓一些与评价主题不相关的内容:
还有,一些抄袭账号或者是公司内部员工还会经常成为马蜂窝网站活动奖品的得主。
......
而在刨除这些作弊账号之后,作者选择剩余的正常用户中15000个最活跃的账号,做出了热力图进行分析,热力图显示,这15000人在2015年中旬突然同时活跃,又在2016年初同时沉寂。
这一系列诡异的用户行为,让作者质疑像是“商量好的”。
虎嗅进入马蜂窝进行搜索, 但目前仅能搜索到上述截图中“问答小班长8号”和“问答小班长11号”的官方账号,并且它们的点评数为0。 无法判断在此之前是否存在上述点评内容,或者近期账号是否有过清空的动作。
要成为“最大的旅游流量平台”?
马蜂窝之前出现在热搜上,还是因为世界杯期间那则洗脑广告——“旅游之前为什么要先上马蜂窝”,和8月份让用户“从海参崴打车去希腊”的新闻。
马蜂窝最早以攻略和游记起家,如今已经成为一个独角兽。2017年年底,马蜂窝刚刚完成了1.33亿美元的D轮融资,当时,马蜂窝CEO陈罡还曾经在一封公司内部信中喊出过马蜂窝的目标:三年后,成为中国最大的旅游流量平台。
但实际上,马蜂窝和其竞品企业之间的差距还十分明显。
根据艾媒的数据,2018年5月,马蜂窝的月活为845.3万,而携程为6855.2万,去哪儿为4179.3万,同程为2221.8万。
但马蜂窝是旅游内容平台中为数不多的变现完成度还算高的一个。
最初,马蜂窝之所以能实现基础的“流量—广告”变现,就是靠着大量的攻略、游记、点评等内容优势。一直以来,马蜂窝要讲的故事就是海量垂直UGC内容带来的大量用户和流量,据官方披露的数据,马蜂窝现有用户量约1.2亿,其2017年整体GMV近百亿(主要来自自由行业务和酒店交易)。
而如今,抄袭、内容造假的事故一出,这样的优势也被蒙上了一层灰色。
对于点评造假这件事,马蜂窝一位市场经理于今天中午对央广“下文”客户端记者回应称:“我们现在正在核实相关情况。我们正在等结果,然后将对媒体反馈。”她表示,暂时不知道具体什么时候出结果,不过今天应该是可以的,具体发布渠道在讨论中。
*文章为作者独立观点,不代表虎嗅网立场
本文由 Cuba Libre 授权 虎嗅网
发表,并经虎嗅网编辑。转载此文章须经作者同意,并请附上出处(虎嗅网)及本页链接。原文链接:https://www.huxiu.com/article/267848.html
未来面前,你我还都是孩子,还不去下载虎嗅App 猛嗅创新!
阅读原文
Tips: Until now, everytime you want to store your article, we will help you store it in Filecoin network. In the future, you can store it in Filecoin network using your own filecoin.
Support author:
Author's Filecoin address:
Or you can use Likecoin to support author: