【外评】大数据已死

💡 原文中文,约6700字,阅读约需16分钟。
📝

内容提要

大数据时代已经结束,数据规模并不是真正的问题所在。大多数人并没有真正的大数据。数据存储和计算分离,存储规模大于计算规模。分析工作负载处理的数据量比想象的要小。大数据前沿不断后退,大数据是一种负担。大多数人不需要担心大数据。

🎯

关键要点

  • 大数据时代已经结束,数据规模并不是主要问题。

  • 大多数人并没有真正的大数据,数据存储量普遍较小。

  • 数据存储和计算分离是现代云数据平台的重要变化。

  • 分析工作负载处理的数据量通常小于预期,很多查询只涉及少量数据。

  • 大数据的定义逐渐退化,符合条件的工作负载数量减少。

  • 数据的保存成本高于丢弃数据的成本,数据可能成为负担。

  • 大多数人不需要担心大数据,只有少数企业属于大数据的百分之一。

延伸问答

大数据时代为什么被认为已经结束?

大数据时代被认为结束是因为数据规模并不是主要问题,大多数人并没有真正的大数据,且分析工作负载处理的数据量通常小于预期。

现代云数据平台的一个重要变化是什么?

现代云数据平台将数据存储和计算分离,这是过去20年中数据架构发生的最重要变化。

大多数企业的数据存储量通常是多少?

绝大多数企业的数据存储量都低于1TB,很多企业的数据量甚至不到100GB。

大数据的定义是如何变化的?

大数据的定义逐渐退化,符合条件的工作负载数量减少,很多工作负载现在可以在单台机器上运行。

为什么数据可能成为负担?

数据可能成为负担是因为保存数据的成本高于丢弃数据的成本,且企业往往懒得删除不必要的数据。

大数据的使用是否普遍?

大数据的使用并不普遍,只有少数企业属于大数据的百分之一,大多数人不需要担心大数据。

➡️

继续阅读