如何用大数据理念引领污染源普查?笔者认为,应做好以下几方面工作。
一是采集数据要准更要全。由于抽样分析技术的限制,10年前的随机抽样样本有限,收集信息有限,这也意味着细微的错误会被放大,甚至有可能影响整个结果的准确性,因而相应的分析结果也非常有限。现在,大数据分析技术为数据采集分析提供了另一种完全不同的思维理念,即强调数据的“大”和“全”。在大量数据运算的前提下,通常用概率说话,甚至完全可以忽略部分数据的不准确、混乱性问题。通过大量相关或看似不相关的数据交互分析,得出以往想都不敢想的分析结果。
在污染源普查中,对于普查数据字段的采集不仅要注意普查对象的基本信息、污染物种类和来源、污染物产生和排放情况、污染治理设施建设和运行情况等重点信息采集的准确性,更要注重采集污染源相关或周边信息的全面性,比如排污者经营状况的变化、行业的发展历程、周边区域和流域的环境变化等。注重数据采集的全面,才能为大数据高效分析夯实基础。
二是数据分析要重“相关关系”。传统的统计分析方法,往往只得出一个大概的统计数据,这往往会导致同一结果众说纷纭,不能很好地解释产生最后的结果到底与什么相关。
“相关关系”是量化两个数值之间的数理关系。相关关系强是指一个数值变化时,另一个数据值很有可能也会随之规律性变化。在大数据背景下,通过大量的数据“相关关系”交互分析,让我们不但知道结果是什么,而且不必让我们再去说为什么,因为一切已经让数据自己发声。用数据说话更能客观地分析污染防治与哪些因素相关,可以让我们比以前更容易、更快捷、更清晰地分析污染源现状的成因、与经济社会发展密切关系,对未来的环保指导也意义深远。
三是分析结果要注重全方位运用。污染防治是涉及社会经济发展、人民生产生活方方面面的综合治理工程,因此污染源的发展与变迁,也与社会生产生活历程息息相关。作为污染源普查的结果,环保基础数据是一座“金矿”。利用好这座“金矿”,我们就可以站在社会发展变迁的高度,集成经济、人口等全国普查结果,运用大数据交互分析的超强运算能力,进行污染源变化及污染物排放与人口、经济发展的相关性分析,全面分析污染防治的相关因素,确保未来污染防治有的放矢、精准出击,全面打赢污染防治攻坚战,也为相关环保法律法规、政策出台提供强大的决策分析支持。