大数据与区块链是当今最热门的两个话题,带动了一系列的投资热潮。不论是风投领域,还是传统的金融领域,只要有这两个关键词出现,往往能让企业获得特别的关注。这也说明了这两个词在当今社会的火爆程度。
各个维度对 区块链 进行了详细阐述,那么大数据又是什么呢?现在很多人都认为,大数据的本质是「大」。也就是说,它的数据量必须非常的广泛和巨大,可能是海量级的。其实这并不准确。
大数据所指的「大」其实更偏向于全,也就是尽可能地接近某个统计范畴内最全面的数据,甚至达到全数据的统计结果。只有这样才能真正实现大数据的基本目标。
例如,在一个重大的政治事件发生之前多少年,会发生一次旱灾,或者一次重大疾病的流行对宗教的传播有什么影响。以这样的模式,这位历史学家对过去几千年的人类历史进行了一次梳理和分析。结果他发现了一个预测模式,通过这个模式,他甚至可以预测未来的某一年,在世界上的某个国家会发生什么样的重大历史事件,而这种预测的准确率达到了一个很高的水平。
因此我们可以认为,假如有足够多的数据量,就可能对世界上所有即将发生的事情进行预测。如果能够做到这一点,那么无疑我们将控制整个世界的变迁。
这要怎么做到呢?要实现这一点需要不断提取尽可能多的数据。
区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。广义来讲, 区块链 技术是利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式。
通过 区块链 模式,可以尽可能地将那些非结构化的数据进行结构化处理。通过将现有各种数据拆解并存储于各个存储单元,我们能对整个世界的数据模式有更加清晰的认知。
既然说到 区块链 ,那么要解决的一个问题必然是信息的安全性问题。 区块链 在这方面所能起到的作用是不可替代的。通过将 区块链 应用到各种数据的提取过程中,就可以实现我们对各种研究所需的非结构化数据的集中使用,而不用担心这些数据被肆意传播和滥用。这也就预防了可能出现的数据风险。
当然, 区块链也可能带来另外的问题。
在大数据研究中,有的时候我们需要对某一群体的特征进行精确的分析和描绘。但是大数据要求的这种数据模式,在 区块链 中却很难实现。比如说,我们要确认一组人群——80后或者90后——他们在职场中真正面临的困境是些什么。通过对这个问题的进一步细致和深化,我们就可以把分布式存储在各个领域里的、关于各种各样情境的困惑集中起来,形成我们的结论。
但如果再进一步,想了解某一家企业、一个群体或者某一个具体区域的人群的特点,我们就无法得到有效的数据标签来实现分析了。
换句话说, 区块链 通过牺牲数据的个性化标签来实现我们对某一类问题进行系统研究的可能性,但是同时也让我们在进一步的分析过程中,遭遇数据提取的困难。
总体来说, 区块链 还是为大数据研究提供了一种非常有效的支撑。它可以帮助我们更好地实现大数据的应用,也解决了各种数据之间横向迁移时的壁垒。
而另一方面,大数据也为 区块链 的应用提供了更好的支撑。
从目前的情况来看, 区块链 的应用范围依然比较狭窄。虽然它在很多领域中都有非常好的前景和解决具体问题的能力,但是具体到某个领域的时候, 区块链 却总是很难实现目标。
与之相反,大数据的应用事实上已经被很多人所接受。尤其在商业领域,通过大数据分析实现商业竞争的目标,也成为很多企业的首选做法。在这种环境下,如果 区块链 能够给大数据的研究提供更好的支撑,可能就会带来对 区块链 应用需求的上升,这事实上可以为 区块链 的应用和推广带来非常好的推动作用。
相关媒体认为 区块链 与大数据的整合,在未来将是一个必然的趋势,大数据的研究将越来越深入地触及人类社会的底线。我们的隐私、数据权利和思想权,都将成为讨论的范畴。