健全衍生数据治理机制 释放数字经济新动能
文 | 清华大学法学院教授 申卫星
数据已成为数字经济发展的关键生产要素。衍生数据作为经加工处理形成的高附加值数据形态,在产业实践和社会治理中展现出巨大潜力,广泛应用于电商、交通、医疗和金融等领域,为精准决策和公共服务提供有力支撑。国家高度重视衍生数据的开发利用。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)首次提出保护数据衍生产品的经营权。健全衍生数据治理机制,科学识别、合理配置数据产权,将为保障多方权益、激励技术创新、推动数字经济高质量发展提供坚实制度基础。
一、衍生数据:推动数字经济发展的“新引擎”
衍生数据是对原始数据进行加工、建模分析、关键信息提取等处理而形成的,具有高附加值的数据形态。相较于原始数据,衍生数据具有结构更优化、价值更显著、应用更广泛的特征,服务于金融、交通、医疗等诸多领域,为产业升级、公共治理和社会服务提供了全新动力。例如,在金融领域,银行和保险机构在保障数据安全、遵守个人信息保护相关要求等的前提下,对经去标识化、匿名化处理的用户行为数据开展深度建模,形成风险控制和精准营销所需的衍生数据,有效提升了服务水平与防范风险能力。在交通出行领域,交通运输企业通过对车流量数据的整合分析,生成的衍生数据可支撑线路优化、运力调度和智慧交通建设,让群众出行更加便捷高效。可以说,衍生数据不仅极大地提升了数据的“可用性”,也直接决定了数字经济创新的深度与广度。正因如此,如何识别和规范衍生数据,已经不只是技术或产业问题,更关系到数据要素能否顺畅实现产业化和数据价值能否充分释放。
从制度层面看,将衍生数据纳入数据产权制度的调整范围,并对其产权归属作出明确安排,是完善数据产权制度的重要一环。“数据二十条”明确提出,要探索“对经加工、分析形成的数据或数据衍生产品的经营权”,为衍生数据区别于原始数据、获得独立评价提供了明确的政策指引。
当前,衍生数据受到的关注不断增多,争议焦点主要集中在两方面:一是数据加工到何种程度构成衍生数据;二是衍生数据的归属应当如何认定。尤其是通过自动化程序收集公开数据进而形成衍生数据的情形,相关权属争议更为集中、更为复杂。对衍生数据法律地位的界定与权利归属的明确,有助于回应产业界关于衍生数据“是否应当单独确权、如何配置权利”的现实关切,从而为数据的深度开发和价值创造提供制度支撑,真正推动数据“用起来、活起来”。随着数据要素市场建设不断推进、应用场景持续扩展,建立清晰、可操作的衍生数据识别标准与产权配置规则,已成为数据产权制度建设中的重要内容。
二、什么是“衍生数据”:衍生数据的识别标准
衍生数据的准确识别是后续确权、授权和流通的前提。衍生数据的生成过程本质上是一种数据加工行为,需要以原始数据为基础,同时依赖加工者的主动投入形成区别于原始数据的“新数据”。那么,经由何种程度的数据处理,衍生数据才能在规范意义上被评价为已经发生质变,从而脱离原始数据成为一项“新数据”?可以从两个维度理解:一方面,数据在形态上的实质变化,这是衍生数据与原始数据的物理区分;另一方面,数据因加工而发生价值跃升,从而防止将一般性的整理、筛选或复制误认为创造衍生数据。
数据自身形态的实质变化表现为数据本身因加工而发生的实质改变。对于数据是否满足实质改变标准,可通过数据内容、结构或形式等多个维度进行判断。数据内容改变意味着数据承载的信息发生了变化;数据结构改变主要是指数据的逻辑组织方式与存储形式发生变化,具体表现为数据的访问方式、组织结构、存储方法等方面的调整;数据形式改变则体现为数据呈现方式在抽象与直观之间相互转化。例如,语义信息提取技术可以从图片、文本、视频等人类可读取的数据中提取出语义标签等信息,将机器难以直接读取的非结构化数据转换为结构化数据,这一过程即可构成数据形式改变。
数据的价值生成表现为数据加工成果相较于原始数据是否在使用价值和交换价值上显著提升。数据的使用价值主要体现在两个方面:一方面,数据能够提供知识、智慧和洞见,为当下的决策提供实用和及时的支持;另一方面,数据的分析和挖掘能力,即数据经过进一步加工处理后所增加的价值。数据的交换价值则体现在其作为商品或服务在市场上的交易流通能力。相较原始数据,衍生数据往往更结构化、更具可用性,与具体业务场景结合更加紧密。同时,通过数据的合规处理与去标识化,数据上的相关信息权益负担得以消解,买方拿来即可用,因此衍生数据更容易被市场接受,也更容易实现更高的交易价值。
需要指出的是,随着技术发展、行业差异和应用场景的动态发展,衍生数据的识别标准也会更加细化。实践和学界讨论中有观点主张将“不可逆向还原”作为判断衍生数据是否真正脱离原始数据的重要考量因素。“不可逆向还原”是指衍生数据相较于原始数据已发生永久性改变,无法在合理成本和可行技术条件下通过逆向工程恢复原始数据。引入这一判断维度,主要是避免加工者通过衍生数据反向获取原始数据,从而侵害在先权利人的合法权益。
三、如何配置数据产权:衍生者赋权与在先权利保护
赋予衍生数据权利,应以数据处理者对原始数据享有使用权并保障各方合法权益为前提。对非法获取的数据进行加工,不能通过衍生数据的产权制度获得法律保护。为了确保数据要素市场的运行效率和权利秩序,衍生数据的产权配置规则应当在确认加工者的投入和创新价值的同时,合理保护原始数据权利人和信息主体的合法权益,从而实现激励与约束的平衡。
在衍生数据的产权配置上,首先应遵循意思自治原则。倘若双方对于衍生数据的权属已有约定,应当允许其通过合意约定衍生数据的权利归属。对衍生数据的权属约定需符合公平、自愿和诚信原则,避免因垄断或不平等条款损害交易对方利益。其次,在衍生数据权属无约定或约定不明确,且无相关法律规定的情况下,衍生数据的持有权、使用权和经营权原则上归属于衍生数据的处理者,其原因在于,这有助于实现数据要素收益的合理分配,并可在不侵犯原始数据产权人和信息主体合法权益的基础上,激励数据处理者加大对数据深度加工的投入,推动数据资源价值的充分释放。
产业界存在这样一种担心:一旦承认衍生数据的产权由加工者享有,原始数据权利人的利益会不会被“掏空”?其实,衍生数据的权属认定与对在先权利人的利益保护并不存在冲突。即使因实质性投入与创造性劳动,数据加工者对其形成的衍生数据享有财产权益,这一认定本身并不消除或覆盖其上可能承载的他人既有合法权利。衍生数据的开发利用,必须以合法取得、合法使用原始数据为前提,不得侵害原始数据权利人享有的人格权益、商业秘密、知识产权以及其他合法权益。
总体而言,健全的衍生数据产权配置规则能够在多个层面发挥制度效用。对加工者而言,明确的权属安排既有助于保障其合理收益预期,也能够激励持续投入与技术创新;对原始数据权利人而言,对在先权利的有效保护,可以防止其合法权益在数据再利用过程中被侵蚀;从社会整体来看,衍生数据权属的明确,有助于激发各类主体深度挖掘和持续创造数据价值的动力,进而提升数据要素的流通效率与创新创造能力。
所有文章未经授权禁止转载、摘编、复制或建立镜像,违规转载法律必究。
举报邮箱:1002263188@qq.com