首页 百科文章正文

大数据时代我们离真相更远

百科 2024年05月06日 11:42 989 于琴

大数据背后隐藏的迷雾 – 大数据远离真相的例子

随着大数据技术的日益普及和应用,我们似乎可以更加清晰地看到现实世界的真相。然而,实际上,在大数据分析的背后,隐藏着种种迷雾和误解,有时候,我们所相信的真相并不一定是真实的。本文将根据现实中的几个具体案例,来探讨大数据背后的迷雾,以及如何避免大数据的误导。

1. Facebook 的情感实验

2012 年,Facebook 秘密地在约 70 万个用户帐号上进行了一项名为“情感实验”的研究。他们在这些用户的新鲜事上进行了自动化的“情感调整”,让这些用户的新鲜事流中出现更多积极或消极的帖子,以此探讨这些帖子对他们的情绪状态的影响。然而,这种实验违背了很多伦理原则,比如说未经被试人同意、精神侵犯等。由于实验是基于代码的自动处理的,没有考虑到受试者的个体差异,也没有考虑到他们生活和社会背景的影响,因此无法获得可靠的结论。

2. Google 的流感预测

从 2009 年开始,Google 利用其热门搜索词的数据来预测流感的传播情况。他们认为,当有更多的人在搜索与流感相关的词时,这意味着当地的流感病例会增加。然而,这种方法很快遭到了挑战。在 2013 年,当南加州大学和哈佛大学的研究人员对谷歌的流感预测进行回溯性分析时,他们发现谷歌的算法的准确性不到 10%。问题出在了 Google 算法的简单性上:它只关注了他们搜索查询的数量,却没能考虑到其他因素,比如说家庭联络、医疗保健等。

3. 统计学家之争

2013 年,哈佛大学的统计学家 Gary King 和他的团队发表了一项论文,声称他们可以使用 Twitter 上的信息来预测选举结果。他们称这种方法的准确率可以达到 90%。然而,另一位统计学家 Andreas Graefe 对此提出了异议。他认为,在社交媒体上随机抽样可能导致偏差,因为这里的用户并不代表整个民意。Twitter 并不是选民的主要来源,而且这些选民也不会总是在社交媒体上表达他们的意愿。后来,经过 14 个月的追踪观察,结果发现,King 的算法对于近 3/4 的情况下都没有达到预期的准确性。

在这些案例中,我们可以看到大数据分析的局限性和引导误导的问题。所以,我们需要针对性地想办法来避免这些问题。我们需要确认大数据分析的依据和原则,需要注重精细的实证和数据采集。其次,我们需要保持大数据分析的开放性和多样性,与其说依赖一个数据集,不如说

标签: 大数据远离真相的例子有哪些 大数据时代我们离真相更远 避开大数据

大金科技网  网站地图 免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052 沪ICP备2023024866号-3