Page 1 of 1

并非所有数据都有用:什么是暗数据

Posted: Thu Dec 05, 2024 8:40 am
by nurnobi95
“数据是新石油。”如果您还没有听到(几乎听不到)这句话,请举手。

我们现在不打算讨论为什么数据变得如此重要,但我们要讨论一些并不总是被考虑到的事情:并不是所有闪闪发光的东西都是金子,在每个数据库中,在每个信息存储库中,材料都是金子。不再存储任何利息。

这就是所谓的暗数据。根据咨询公司 Gartner的定义,暗数据是组织在其业务活动中收集、处理和存储的信息资产,但通常不用于其他目的(例如分析、业务关系和直接货币化)。

为什么要保存这些数据?
几乎任何类型的文档、应用程序、交易和/或操作都会生成暗数据。一些典型的例子是客户或前雇员信息、日志文件、调查数据、财务报表、笔记、演示文稿、电子邮件、电子邮件附件、非活动数据库、旧版本文档、呼叫中心记录、客户评论等。

确实,组织通常保留所有这些暗数据只是为 vnpay 数据库 了遵守某些法律义务(例如保留发票),但这种存储和数据保护通常会比保留这些暗数据的价值带来更多成本(有时甚至更大的风险)。我们的存储库中的信息可以提供。

据估计,到 2025 年,全球每天将产生 463 艾字节的数据。许多公司努力保存和收集用户的大量信息,有时没有考虑他们真正想要所有这些数据的用途。是的,我们的目标是方便地分析它们,以制定业务策略并更好地调整您的产品和营销以满足客户的需求。但完成了吗?

此外,保存如此多信息的愿望意味着存储没有兴趣或价值的数据。事实上,根据大数据分析公司Splunk的报告,组织收集的数据中有55%都可以包含在这种脏数据现象中。

暗数据的缺点
这些暗数据的最大问题不是我们以无用的方式存储它,而是它可能导致其他并发症。

例如,必须分配更多资源才能保存所有这些信息。此外,根据我们存储它的方式和位置,该体积可能会影响其他设备的性能,因此,我们的计算设备需要更多的功率。

此外,如果我们保留的这些无用数据中存在个人信息,我们必须记住,我们应该监视和控制它们,因为个人保护权也适用于这些文件。应该记住,信息越敏感,我们必须考虑的安全策略就越多。

Image

这又会导致我们不得不采用更复杂、成本更高的安全措施。更不用说,一旦发生数据泄露,如果攻击范围与个人信息数据有关,我们作为公司的声誉可能会受到更大的损害。

最后但并非最不重要的一点是,这些信息还需要我们投入时间。我们必须知道,几乎所有的数据都有有效期和失效日期。如果过去了十几年,我们继续保留纳税记录是没有用的。不及时使用的数据很快就会变得无用。

如何避免产生脏数据
确实,就个人而言,我们有时发现很难删除某些照片,即使它们对我们没有什么价值。但在专业、工作和业务层面,我们必须避免陷入这种数字第欧根尼综合症,并尝试存储和保存尽可能少的无用信息。

因此,首要措施是从今天开始解决这个问题,采取必要的措施:将它们从存放的地方移走、保护它们或消除它们。

为了防止产生更多无用数据,公司可以使用允许选择有价值数据的工具来自动化某些操作。跟踪数据使用情况也很有帮助。这里的挑战是识别未使用的表和数据库,将它们移动到更经济的系统(例如云)。这个简单的操作将释放一定的数据存储资源,提高其他操作的性能并让我们节省硬件投资。

但同样重要的是,所有相关人员都必须接受必要的培训和知识,以避免生成和保存这些脏数据。所有员工都必须了解这些数据政策,以防止数据被保存在计算机、笔记本电脑、手机、本地和云端以及可移动存储设备上(即使是重复的)。