早在2009年,《大数据资产:聪明的企业怎样致胜于数据治理》一书的作者Tony Fisher就曾提到,如果基本数据不可靠,大多数企业的大数据计划要么会失败,要么效果会低于预期。造成上述结果的关键原因在于,数据生命周期之中流入了不一致、不准确、不可靠的数据。这些原因可以是多重的:
大数据计划中的数据识别并不完整:对要获取什么数据、怎样使用这些数据、它们要满足哪些业务目标以及谁有权拥有这些数据等方面并未明确界定。.
数据的采集与转换并没有规定适当的标准、架构、元数据定义、数据所有权、政策以及数据转换规则。
数据传输在安全性、业务用户上下文、数据与业务流程的关联等方面并未进行适当的界定。
在数据领域最流行的一个说法是“更好的数据意味着更好的决策”,这句话从来不假,在当今的大数据时代甚至更为真切,但它之所以成立的基本假定也未改变,那就是“基本数据是准确、可靠、值得信赖的,来龙去脉清楚,并且具有一致性。”—试想,如果没有一个可靠的数据治理计划,我们还能这样假定吗?
我们都听过诸如此类的说辞“IT技术融入业务对我们的企业至关重要”、“IT技术促成各种业务功能的实现”。对企业上下进行实际的评估,能实现上述说辞的情况却是屈指可数。对大多数企业而言,IT技术与各种业务目标之间仍存在差距,首席信息官及各高级主管仍在努力设法使IT技术能配合各种业务目标,从而促进企业战略目标的实现。在对成功企业进行分析后,可以得出一个很明确的结论那就是“有效的数据治理计划”是成功企业的法宝。