大数据的10大误区

2022-05-31 08:18:20
[ BPO网导读 ] 大数据在当前的科技新闻中占据了主导地位,它被吹捧为一切问题的可能的解决方案,从入侵检测与预防欺诈,到治疗癌症和设置最优的产品价格。


  一些公司认为,如果他们只是收集数据,他们以后会找出这些数据的利用之道,但付出大量成本却毫无价值。事实上,一些数据集适用收益递减规律。例如,你进行民意测试来预测选举结果。你需要一定数量的投票人以获得具有代表性的样本。但这个数量达到某个点之后,增加更多的人不会显著影响误差幅度。
  而且这不仅涉及存储成本,Recommind公司信息治理和大数据管理全球主管Dean Gonsowski说,该公司总部位于旧金山,专注于非结构化数据分析。
  例如,数据越多,进行排序的时间就越长。“当数十亿条记录入库,搜索需要花费数小时或数周。”他说。
  误区5 :所有数据的都平等
  弗吉尼亚州在过去20年一直在收集有关学生注册人数,财政援助和奖励程度的数据。但是,这并不意味着,20年前收集并存储在相同的数据字段中的数据一定是相同的数据。
  “我处理的最大问题是,仅仅因为它是在数据字典中,研究人员认为这是公平的比赛,”弗吉尼亚州议会高等教育政策研究和数据仓库主管Tod Massa说。“例如,ACT和SAT的学生的考试成绩数据,最初只对本州的学生收集,然后有一个缺口,然后收集本州和其他州的学生数据。”同样,不同种族在K - 12级别和在高等教育的数据也有所不同。
  事实上,任何特定的数据,由不同的机构,或不同的人,或在不同的时间点报告的,都可能有所不同。
  因此,分析师需要具备的不只是统计技能,而且还要熟悉数据的当地知识,和行业的整体发展趋势,如SAT和ACT成绩被重新标定。
  “你不能编程所有这些东西放到一个数据仓库。”Tod Massa说。
  这同样适用于外部的数据源,也就是说,很好地使用任何数据,确实需要了解这些数据收集的文化和背景。
    误区6 :更具体的预测更好
  人的本性认为更具体的东西更准确,如'下午3:12'比'下午某个时间'更准确。
  但事实正好相反。在许多情况下,更精确的预测不太可能是准确的。例如,一个客户买了一台特定配置的笔记本电脑,而过去购买该配置笔记本电脑的唯一的客户,还买了一双粉红色的高跟鞋。
  “热门粉红色高跟鞋的推荐可能很具体,但可能太具体,导致很高的误差,”位于加利福尼亚州圣莫尼卡的营销公司Retention Science首席执行官Jerry Jao说。
  所以,通常看起来漂亮的东西,实际上可能无助于业务和营销管理。


BPO网版权及免责声明

1、凡本网注明:“BPO网”或者“原创”的所有作品,版权均属于BPO网所有,其他媒体、网站或个人转载使用时必须注明:“文章来源:BPO网”。违反上述声明者,本网将追究其法律责任。

2、凡本网注明“来源:XXX(非BPO网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其产生的任何结果负责。

BPO公众号 BPO公众号
返回顶部