同时希望此事能增强大众对市场规范化的信心

2018-10-24 13:07

  质疑文章援用了乎睿数据团队所供数据,称在马蜂窝上发现了超过7000个抄袭账号,平均每个账号从各大旅游点评平台上抄袭搬运了数千条评论,合计抄袭572万条餐饮点评,1221万条酒店点评,占总点评数的85%。
 
  除了点评,游记、问答等马蜂窝核心内容,据乎睿数据团队分析,都存在不同程度的洗文、抄袭问题。
 
  世界杯期间因广告“一炮走红”的马蜂窝,陷入信任危机。
 
  10月22日,马蜂窝旅游发表声明,称已对全站游记、攻略、嗡嗡、问答、点评等数据进行核查,并查处了涉嫌虚假的信息。马蜂窝还强调,点评内容仅占全站数据的2.91%,涉嫌虚假点评更是微乎其微。针对文中歪曲事实的言论,马蜂窝将采取法律手段。
 
  22日晚,乎睿团队信息发布人“梓泉”公布了一份“诉讼服务告知书”显示,马蜂窝起诉深圳乎睿数据有限公司、丁子荃名誉侵权案已获立案。
 
  双方你来我往。10月23日,“小声比比”再度发文《我承认,我们是有组织攻击马蜂窝的》。
 
  乎睿数据表示,成为被告很意外,同时希望此事能增强大众对市场规范化的信心。
 
  23日,钱江晚报记者联系到了马蜂窝旅游网的公关人员,对于目前的情况,他表示不方便多说,但一直强调,对于“小声比比”和深圳乎睿数据有限公司的动机,有质疑余地。之后马蜂窝旅游网将继续对此事作出回应。
 
目前这一阶段的流体标注的目标是让图像更快更容易,提高整体资料集标记速度达三倍。接下来Google要改进物体边界标记,并以更多的人工智能加速界面操作,扩展界面以处理现在无法辨识的类别。10月24日上午消息,据中国台湾地区媒体iThome.com.tw报道,Google在2018 ACM多媒体会议上,推出一种使用机器学习来标注图片界面,让使用者快速为图片中物体标记出轮廓以及标签,提高整体标记速度达三倍。
 
  由于现代基于深度学习电脑视觉模型的性能,取决标签训练资料的多少,越大的资料库将能让机器学习有更好的表现。Google在许多深度学习的研究都一再提到,高品质的训练资料取得并不容易,而这个问题已经成为发展电脑视觉的主要瓶颈,对于诸如自动驾驶、机器人或是图片搜寻等这类以像素为辨识基础的工作更是如此。
 
  传统的方法需要使用者手动以标记工具,圈出图片中物体的边界,Google提到,使用COCO加Stuff资料集,标记一个图片需要19分钟,标记完整个资料集需要53000个小时,太过耗时没效率。因此Google探索了全新的训练资料标记方法-流体标注(Fluid Annotation),能以机器学习帮助使用者快速找出图片物体轮廓上标签。
 
  流体标注从强语义分割模型的输出开始,使用者能以自然的使用者界面,借由机器学习辅助进行编辑和修改,界面提供使用者需要修正的物体以及顺序,让人们能够专心于那些机器尚无法辨识清楚的部分。为了标注图片,Google预先以约一千张具有分类标签和信任分数的图片训练了语意分割模型(Mask-RCNN),具有最高信心的片段(Segment)能被用于初始标签中。
 
  流体标注能够为使用者产生一个短清单,透过点击就能快速为物体上标签,而使用者也可以增加范围标记,来覆盖没被侦测出来的物体,并透过滚动选择最佳的形状。另外,除了能够增加,也能删除既有的物体标记或是变更物体深度顺序。  钱报记者以民宿推广为由,联系了两家店铺。其中一家向记者开价,撰写加上发布,一条点评20元,“保证50字以上,6级账号发布,很划算。”随后他向记者发来一份范例,如果不经提醒,完全看不出这是一份虚假的“营销”点评。
 
  “游记一篇500元,阅读量保1万以上,点评20元,攻略点赞一次0.2元,分享一次0.25元。” 从游记定制,到虚构点评,甚至点赞分享,这些都是明码标价。