随着数据泄露事件席卷Facebook、Equifax等公司,越来越多的公司开始谈论道德数据挖掘。虽然大部分讨论仍然在高管层面,但企业应该积极地培训用户并制定最佳实践,以确保在道德数据驱动的业务运营中保持正确的做法。
近年来网络攻击不断升级,企业已大大加强了数据安全工作,以减轻伴随此类攻击事故的财务和声誉风险。然而,与此同时,他们却更少关注围绕这些事件的道德问题,以及大数据的持续使用,包括未经授权的数据共享、转售客户信息以及创建表现出某种偏见的算法等。
美国科学促进会研究员Lucy C. Erickson说:“如果你不花时间和金钱来遵守正确的道德规范,你可能会面临一场可怕的公关噩梦。”
鉴于中央数据和数据分析已经成为公司的核心业务部分,围绕道德数据挖掘最佳做法的审查也更为严格。根据最近的TDWI报告,82%的企业将分析和BI作为其技术预算的一部分。而同时,NewVantage Partners的研究也发现,91.6%的财富1000强企业正在增加对大数据和人工智能的投资,以保持灵活性和竞争力。
可存储几乎无限量数据的能力,再加上企业开始将数据视为资产并实施算法决策,正在引发人们对道德数据挖掘的担忧。 Erickson称:“传统上来看,道德担忧主要是针对医学和法律行业,但随着计算机科学越来越以类似的方式影响人们的生活,人们也越来越重视这一领域的道德规范。人们逐渐认识到,计算机程序员需要考虑他们将如何以新的方式与人类生活交织,特别是在数据隐私和算法决策方面。”
法律精神
提供在线身份验证服务的Evident ID公司首席执行官David Thomas警告说,企业可能会遵循法律条文,但仍然可以跨越道德标准继续数据挖掘工作。在美国,对个人数据没有一致的法律定义,这意味着如何处理数据有很大的自由度;相比之下,欧盟已经通过《通用数据保护条例》设定了标准。然而,Thomas认为,法律只能提供有限的明晰,这反过来又会给企业带来负担。
Thomas称:“企业对其数据的责任要远远超过法律的范围。同时,遵守法律法规的精神和遵守法律条文之间存在着区别。数据被滥用的方式有很多,企业必须开始考虑他们有责任保护的这项资产。”
首先,Thomas表示,企业不应该只关注收集尽可能多的个人信息,而应该制定路线图,明确他们为什么要收集数据以及这是否符合特定的业务计划。此外,企业还应该明确由谁执行数据隐私策略以及对如何利用数据做出决策等数据管理做法,并对整个企业透明化。这种透明度也可以让客户清楚地了解他们的数据如何被使用。
他解释说:“大家都在试图提供无缝的用户体验;他们最不想做的事情就是向用户提供非常详细的审计日志以说明他们的数据如何被使用。企业正在高度总结他们的使用政策,因为这不会向用户提供,用户不知道他们正在注册什么。”
美国目前对个人数据没有一致的法律定义,但欧盟已经通过《通用数据保护条例》设定了标准。
增强道德数据挖掘辩论的一种方法是在职业生涯开始前大学期间就开始这个谈话。马里兰大学信息系统系副教授Vandana Janeja已经开始在她的数据科学课程中这样做。当学生学习数据生命周期的每个阶段的数据管理做法时,Janeja整合了道德相关的教学。她表示:“每当学生提出有关数据或如何操纵数据的问题,我们都会对其进行道德审判,并鼓励道德批判性思维。”
迅猛的技术发展步伐可能最终成为合理道德数据挖掘实践的最大障碍。为实现道德数据挖掘,企业需要在他们的计划开始就考虑数据设计和隐私,包括应该考虑哪些子组、谁可能受到数据使用的影响以及潜在的培训数据是否会使算法反映和放大偏见等。
Erickson称:“所有这些方法都是为了加快速度,并以这种快速度前进。然而,通常道德问题会放慢这个过程。”