【外评】大数据已死
💡
原文中文,约6700字,阅读约需16分钟。
📝
内容提要
大数据时代已经结束,数据规模并不是真正的问题所在。大多数人并没有真正的大数据。数据存储和计算分离,存储规模大于计算规模。分析工作负载处理的数据量比想象的要小。大数据前沿不断后退,大数据是一种负担。大多数人不需要担心大数据。
🎯
关键要点
-
大数据时代已经结束,数据规模并不是主要问题。
-
大多数人并没有真正的大数据,数据存储量普遍较小。
-
数据存储和计算分离是现代云数据平台的重要变化。
-
分析工作负载处理的数据量通常小于预期,很多查询只涉及少量数据。
-
大数据的定义逐渐退化,符合条件的工作负载数量减少。
-
数据的保存成本高于丢弃数据的成本,数据可能成为负担。
-
大多数人不需要担心大数据,只有少数企业属于大数据的百分之一。
❓
延伸问答
大数据时代为什么被认为已经结束?
大数据时代被认为结束是因为数据规模并不是主要问题,大多数人并没有真正的大数据,且分析工作负载处理的数据量通常小于预期。
现代云数据平台的一个重要变化是什么?
现代云数据平台将数据存储和计算分离,这是过去20年中数据架构发生的最重要变化。
大多数企业的数据存储量通常是多少?
绝大多数企业的数据存储量都低于1TB,很多企业的数据量甚至不到100GB。
大数据的定义是如何变化的?
大数据的定义逐渐退化,符合条件的工作负载数量减少,很多工作负载现在可以在单台机器上运行。
为什么数据可能成为负担?
数据可能成为负担是因为保存数据的成本高于丢弃数据的成本,且企业往往懒得删除不必要的数据。
大数据的使用是否普遍?
大数据的使用并不普遍,只有少数企业属于大数据的百分之一,大多数人不需要担心大数据。
➡️