当前位置:首页 > 公司动态
从数据的属性看数据资产
  • 发表时间:2022-04-19 点击数:129
  • 来源:未知

 一、引言

 

 

有关网络空间(cyber space)的资产有信息资产(information assets)、数字资产(digital assets)和数据资产(data assets)3个概念。这3个概念名词不同,但内涵类似,主要是由于不同的经济社会发展阶段,形成了不同的名词。这3个概念从名词出现到概念定义,都经历了较长时间,分别如下。

 

1、计算机创造出来后,使用的技术术语是 “信息技术”,信息技术改变了人类生产和生活的方式,“信息资产”一词于1977年由斯图亚特·卡巴克(Stuart Kaback)在介绍一款索引系统时提及,但没有给出具体内涵;1994年,在《霍利报告(The Hawley report)》中首次给出了“信息资产”的定义。

 

2、数字地球等概念的提出使数字化得到了当时广泛的关注,“数字资产”一词于1996年由Helen Meyer在《维护数字资产技巧》一文中提出,但没有给出具体内涵;2006年阿尔伯特·范·尼凯克(Albert Van Niekerk)给出了“数字资产”的定义。

 

3、在大数据时代,人们的关注点是数据,数据被作为一种重要战略资源来看待,“数据资产”一词由理查德·彼得斯(Richard Peters)于1974年提出,是指政府债券、公司债券和实物债券等资产;2009年托尼·费希尔(Tony Fisher)在《数据资产(The data asset)》中指出数据是一种资产。

 

当前,在大数据背景下,数据是数字经济的关键要素,其作为基础性资源、生产资料已经得到广泛认同,世界主要国家已经在实施大数据战略。从1974年最早出现“数据资产”术语到现在已经40多年了,数据资产进入会计报表仍然问题很多。这说明,未来工作重点应该是如何将信息、数字、数据资源进行资产化。因此,有必要理清信息资产、数字资产和数据资产的异同,定义数据资产的内涵和边界。本文综述了信息资产、数字资产、数据资产等概念的发展,分析了3种资产的概念形成的社会背景和存在的问题,给出了笔者对新的数据资产概念的定义,展望了有关数据资产权属、计量计价方法、会计类别等后续工作。

 

二、相关概念发展状况

 

1、信息资产

国际标准ISO/IEC 27000:2018(E)中,信息被定义成一种资产,它与组织中其他重要的资产一样需要得到适当的保护。Gartner IT术语表显示:“信息(知识)资产是指与企业业务功能相关的信息,包括员工、客户或商业伙伴处获取的隐性知识;存储在高度结构化数据库里的数据和信息;以文本形式存储在非结构化数据库中的数据和信息,如电子邮件、工作流程内容和电子表格;存储在数字和纸质文档中的信息;购买的内容以及来自互联网或其他来源的公共内容”。

 

从《霍利报告》给出的信息资产的定义中可以看出,信息资产是一种数据,而且是有价值的数据,包括有记录和没记录的,即任何有价值的数据,不论这个价值体现在当前还是未来。Gartner IT术语表中信息资产也被认为是一种数据或信息(有价值的数据),它可以从不同渠道获取。因此,比较合适的信息资产定义应为:已经或应该被记录的具有价值或潜在价值的数据 。

 

2、数字资产

“数字资产”最早由Helen Meyer于1996年在《维护数字资产技巧》一文中提出。2004年,Elizabeth Yakel指出“档案馆、图书馆和博物馆等已不再把数字图像等视为对象,而更多的是将其视为数字资产来对待”。

 

在已有数字资产的定义中,Albert Van Niekerk认为数字资产是被格式化为二进制(即被数字化)并拥有使用权的特性;Alp Toygar等人指出数字资产具有二进制形式(数字化)和所有权,并提到其产生和存储在电子设备中;Rod Genders和Adam Steena认为数字资产是数字形式和持有性。可见,二进制形式(数字化)、使用权或所有权是数字资产比较显著的特性。

 

特别要关注的是数字资产越来越倾向于数字货币。不论是立法层面,还是当前领域研究,都将数字货币作为数字资产的重要内容来看待,更有进一步发展的趋势。从上述分析来看,比较合适的数字资产的定义应为:拥有二进制形式数据所有权,产生并存储在计算机、智能手机、数字媒体或云端等设备中的数据。

 

3、数据资产

“数据资产”最早由理查德·彼得斯(Richard Peters)于1974年提出,他认为数据资产包括持有的政府债券、公司债券和实物债券等资产。随着时间的推移,人们对数据资产的认识在不断深入,其内涵和范围也在不断扩展。

 

2018年4月,中国信息通信研究院云计算与大数据研究所发布的《数据资产管理实践白皮书(2.0版)》中将数据资产定义为“由企业拥有或者控制的、能够为企业带来未来经济利益的、以物理或电子的方式记录的数据资源,如文件资料、电子数据等”。在数据资产现有的定义中,美军的定义实际上指的是与单个数据相关的系统或产品,这还不够恰当,相对而言,中国信息通信研究院给出的数据资产的定义是目前比较合适的定义。

 

4、概念发展

“数据资产”的概念最早出现,紧接着是“信息资产”的概念,直到20世纪90年代“数字资产”的概念才出现,但这3个术语的定义出现的先后顺序是:信息资产、数字资产、数据资产。

三、概念形成的社会背景及存在的问题

 

资产是经济的核心组成,一种资产类别的出现是有经济社会发展背景的。信息资产、数字资产、数据资产概念的形成与技术发展、经济社会进步相吻合。

 

1、信息资产概念源于信息技术发展和广泛渗透

20世纪40年代,电子计算机诞生,新技术随之出现,人们处理信息的能力得到了极大的提高。1958年 ,Harold J.Leavitt和Thomas L.Whisler在《哈佛商业评论(Harvard Business Review)》杂志发表的文章中,将这个新技术称为“信息技术”,认为其由3个部分组成:信息处理技术、统计和数学方法在决策中的应用以及通过计算机程序模拟的高阶思维。信息技术迅速地改变了人类的生产和生活方式。

 

20世纪60年代,“信息经济”概念被提出并得以发展,基于资源的信息观是其发展的核心,而信息被视为资源的观点是信息资产的基础。20世纪70年代中期成立的美国联邦文书委员会把信息作为一种经济商品,该委员会的信息管理研究主任霍顿认为:信息资源管理可以有效并高效地处理信息资源及由此产生的信息资产(知识)。信息技术与各个领域的深度融合,对各领域生产和生活方式产生了深远影响,使经济社会的形态发生变化。在经济生产活动过程中,信息(即有价值的数据)对于经济主体而言是非常重要的资产。

 

2、数字资产概念源于“数字”被广泛认识和使用

二十世纪八九十年代,互联网得到了广泛普及,互联网技术的快速发 展推动了互联网产业化的发展。相关技术的发展得益于各国实施信息高速公路计划,从而推进了各自的信息化进程。在美国国家信息基础设施(NII)和全球信息基础设施(GII)发展的背景下(1993年9月,美国政府发表《国家信息基础设施:行动计划》,建设“信息高速公路”,实现大量信息共享。

 

1994年3月,美国前副总统艾伯特·戈尔在国际电信联盟(ITU)主持召开的首届世界电信发展会议上,提出并号召各国积极参与建设全球信息基础设施的宏伟构想,并得到各国广泛响应),1998年时任美国副总 统的艾伯特·戈尔在美国加州科学中心发表题为《数字地球——认识21世纪我们这个星球 (The digital earth:understanding our planet in the 21st Century)》的报告,报告中提 出“数字地球”的概念,认为其将是“一种关于地球的可以嵌入海量地理数据的、多分辨率和三维的表示”,并涉及包括计算机科学、海量存储、宽带网络、云数据等在内的系列关键技术,引起了全球各界的高度关注和支持。1995年美国麻省理工学院教授和媒体实验室前主任尼古拉斯·尼葛洛庞帝(Nicholas Negroponte)撰写的《数字化生存(Being digital)》出版,这标志着以“比特”为存在物的数字化时代已经到来。在这样的技术和时代背景下,“数字经 济(Digital economy)”概念被提出并迅速流行,加快发展数字经济已成为各国共识。在数字经济发展过程中,数字资产被日益关注。

 

3、数据资产概念源于大数据的兴起

1997年NASA研究员Michael Cox和David Ellsworth在IEEE第8届国际可视化学术会议上首先提出了“大数据”术语 。2008年9月《自然》杂志出版了一期大数据专刊,使得大数据在科学研究领域得到了高度重视。2012年3月美国政府发布了《大数据研究和发展倡议(Big data research and development initiative)》,大数据引起了很多国家和全社会的重视。大数据时代,人们的关注点是数据。数据作为一种重要的战略资源,其价值被不断挖掘和创造,数据正在成为一种新的资产——数据资产。在大数据时代,数据是人们关注的资源,能让机器读取的数据才有可能读出有价值的信息,成为数据资产。

 

4、存在的问题

经济社会历史发展环境的不同和对“信息、数字、数据”概念认识的不同,形成了不同的名词术语,但3个概念名词的内涵差异不大,在具体使用时也会出现混乱和相互替代的情形。更为严重的是,资产和资源、资本、经济等术语紧密关联,于是就有了信息资产、信息资源、信息资本、信息经济、数据资产、数据资源、数据资本、数据经济、数字资产、数字资源、数字资本和数字经济12个概念。显然,过多的、雷同的概念不利于事情的健康发展。

 

因此,需要将数据资源界定在网络空间中,不考虑网络空间外的数据资源。网络空间是指计算机网络、广电网络、通信网络、物联网、卫星网等所有人造网络和设备构成的空间,这个空间真实存在。电脑、手机、移动硬盘等都是网络空间的组成部分。现在,空调、冰箱、自动窗帘、电子门锁等也已经成为网络空间的组成部分。数据是指网络空间的任何事物,“数据”的含义很广,不仅包括传统意义上的数据(如1011、8084等),还包括符号、字符、日期形式的数据(如dataology、上海市数据科学重点实验室、2013/09/06等),也包括文本、声音、图像、照片和视频等类型的数据,微博、微信、购物记录、住宿记录、乘坐飞机记录、银行消费记录、政府文件等也是数据。2009年,朱扬勇、熊贇提出数据有物理属性、存在属性和信息属性。

 

● 物理属性:是指数据在存储介质中以二进制形式存在。数据的物理存在确实占用了存储介质的物理空间,是数据真实存在的表现,并且可以度量。数据的物理存在可以直接用于制作数据复本和数据传输。

 

● 存在属性:是指数据以人类可感知(通常为可见、可听)的形式存在。在计算机系统中,物理存在的数据需要通过I/O设备以日常的形式展现出来,才可以被人感知、认识。人通过I/O设备感知到的(比如看见的)数据被认为是在数据界中存在的数据。

 

● 信息属性:一个数据是否有含义?含义是什么?这是数据的信息属性。通常数据经过解释就会有含义,数据的含义就是信息;也有一些数据是没有含义的,例如,一个随意打入的字符串“20 x ad7f海7s9f9a-877w2”就没有含义,但它是数据自然界中的一个数据。

 

四、定义数据资产

 

根据上文分析,有必要将信息资产、数字资产和数据资产统一为数据资产,并依照数据属性开展数据的资产化研究工作。

 

1、数据具备资产的基本条件

资产是指会计主体(政府、企事业单位等)由过去的经济业务或者事项形成的、由会计主体控制的、预期能够带来经济利益流入或产生服务潜力的经济资源。资产的分类很多,如流动资产、固定资产、有形资产、无形资产、不动产等。资产具有以下几个方面的特征:

 

● 资产预期会给会计主体带来经济利益或产生服务潜力;

● 资产应是会计主体拥有或者控制的资源;

● 资产是由会计主体过去的交易或者事项形成的。按照中国的企业会计准则,符合上述资产定义的资源还要同时满足以下条件,才能被确认为资产:

● 与该资源有关的经济利益很可能流入企业;

● 该资源的成本或者价值能够可靠地计量。

 

在大数据背景下,数据资源是重要的战略资源已成为共识。数据是当前社会、经济运行过程中不可或缺的部分。那么,数据是否具备了资产的特征和条件呢?

 

首先,数据能够给会计主体带来利益。在经济业务活动中,会计主体可通过生产、采集、加工、购买等方式拥有并控制数据资源,并且可以通过出让数据、加工数据或提供数据服务来获取利益。数据资源是能给会计主体带来预期经济利益或产生服务潜力的资源。当然,并不是所有的数据都能够给会计主体带来利益,垃圾数据是不会带来利益的。

 

其次,数据的成本或者价值能够被可靠地计量。现有的定义问题在于“计量”,由于计量问题,数据资产迟迟难以进入会计报表。由于数据是现实事务的信息化,因此非常复杂,难以用一个统一的计量方法对各类数据进行计量。

 

由此可见,能够带来利益的数据具备了资产的基本特性,如果能够计量,就符合了资产的条件。不能够带来利益的数据显然不是资产,不能够被可靠计量的数据不能被计入会计报表,暂不适合作为资产来看待。

 

2、数据资产的定义

大数据通常指一个大规模(常常是PB级别)的数据集,需要通过开发这个数据集获得价值,而1 PB规模的数据集就相当于30个国家图书馆的数据量。因此,区别于传统的“数据”概念,本文将“数据”界定为网络空间的任何事物(不包括纸质或其他非网络空间的数据),它在网络空间中是唯一存在的。结合数据属性,将数据资产定义为:拥有数据权属(勘探权、使用权、所有权)、有价值、可计量、可读取的网络空间中的数据集。

 

首先,因为纸质资料和电子资料在计量和规模上有着本质的不同,所以本定义将数据界定为网络空间中的数据,以排除图书馆、档案馆的纸质资料数据资产。除了涉及非网络空间的数据之外,在将数据界定为网络空间中数据的前提下,该定义与现有的关于信息资产、数字资产和数据资产的主要定义之间不存在不一致的问题。

 

其次,主要的差别是“可计量”。无论是无形资产还是有形资产,可计量是资产化的必要条件,只有可计量才有可能进入会计报表,资产化才可能实现。数据是现实世界中万事万物的信息化,数据类型、规格、内容也多种多样,有些可以计量、有些目前还没有找到计量方法。先把能够计量的数据资产化是一个可行的做法,因此,把可计量纳入数据资产的定义中。

 

再次,关于数据权属应考虑勘探权、使用权、所有权。不同于矿山、矿藏,它们的所有权属于国家,而数据是非天然的,情理上数据应属于数据的生产者。企业、机构和个人可以持有数据的所有权。

 

最后,根据定义可知,下列数据集不是数据资产:

● 没有价值的数据集、垃圾数据集;

● 没有数据权属的数据集;

● 不能计量的数据集;

● 不可读的数据集。