数据分析是一门相对新的学科,随着计算机技术(如机器学习)在过去五年中的迅速发展,正在呈指数级增长。
随着全球智能手机和互联网的广泛采用和使用,现在可以收集大量数据。然而,数据收集和分析行业目前正在使用一些过时模型,这些模型不符合当今监管要求,往往支配于少数大型数据经纪商和数据交易网络,它们不考虑用户的权利或同意。
将我们的数据掌握在少数大公司手中意味着他们可以通过滥用他们对我们信息的访问权限来满足他们自己的利益。这可以从包含数百万人最私密数据的大型数据库的高调泄露和黑客攻击中看出。例如,Equifax黑客攻击导致黑客获得了1.45亿美国人的社会安全号码和其他敏感信息。
这些大规模的数据泄露导致立法者对数据的收集、使用和存储进行仔细研究,从而产生了新的全面数据法规,其中影响最深远和最重要的是欧盟最近实施的GDPR(通用数据保护条例)。
对于多个领先行业的许多公司而言,数据现在是最有价值的资源之一。它被称为“新石油”,因为数据收集和分析彻底改变了成功企业创建盈利模式的方式。然而,拥有大量数据是一把双刃剑,因为不良数据可能对数据驱动的业务模型造成严重的影响。
事实上,糟糕的数据可能导致企业收入下降25%至10%。数据的来源和收集方式对其质量至关重要。事实上,数据的收集方式和数据本身的重要性一样。
为了解决这个问题,数据治理应该满足两个非常重要的要求:它必须考虑数据的来源和收集方式,并且它必须解决和记录对数据所做的任何更改或操作以用于分析目的。每当有人分析、处理或收集数据时,都应该遵守数据特定的“监管链”。
区块链是一种分散的数字分类账,用于记录网络中发生的交易,使用加密技术进行保护。由于区块链网络的不可变和加密验证的安全性,它提供了一种解决数据行业当前存在的问题的方法。