一、引言:数据确权的技术路径
随着数据作为生产要素的价值得到普遍认可,数据确权的问题引起学界越来越多的关注。实践中,由于数据技术手段与数据相伴相生,参考数据技术认定数据权利的做法较为常见。借助网络日志、区块链等技术确认权利状态,甚至打造数据流转与交易的可信技术空间,已经成为数据确权的重要探索。
传统财产理论和制度鲜有涉及技术维度的讨论,对数据确权存在解释力不足的问题。产业界最初以古典政治经济学的“流汗理论”界定数据所有权,这一路径激励了劳动要素大量进入数据市场,却客观上为数据垄断提供了合理性。
技术应用的确权意义,最早在通信工程领域获得认可,相关研究成果以提高技术的可信度为前提,探索数据文件、网络日志、区块链存证等算法的改进。
本文将梳理确权技术路径的产生与演进,然后根据技术应用对数据确权的支持方式,把数据确权区分为整体确权和进程确权两种模式。结合两种确权模式的结构功能和实际局限,本文认为两种确权模式并非简单的并列关系,而是呈现整体确权向进程确权嬗变的趋势。在此基础上,本文就确权模式的规范化给出相关建议,以期对当前数据确权的政策演进和实践发展有所助益。
二、技术路径的产生动因与主要模式
数据包含复杂多样的内容与组织形式,但技术却是数据状态的实际承载者。事实表明,即便缺少制度的直接引导,数据处分也能通过特定技术的执行来实现。这种技术应用对数据形态的承载或解释能力,就是数据确权模式产生的直接动因,而技术发展则为确权模式的更新变化提供了现实基础。
(一)产生动因:无体数据的权利探索
数据形态的界定存在难度。根据国际标准化组织(滨厂翱)的定义,数据(诲补迟补)是信息(颈苍蹿辞谤尘补迟颈辞苍)的特定形式转化,以达到适合电子化交流、解释或处理的目的。
由于时效与整合程度的不同,数据归属的判断更加困难。随着介入主体和操作行为的变化,数据的体量、质量会出现新的堆迭与排列,形态的流转和变化性较强。
有鉴于此,立法与司法实践开展了“数据权利”的技术探索。这种探索来自一个基本的认知,即数据是技术操作的产物,数据的来源和归属能够通过技术观察与测量予以描述,作为测量方法的数据机器和算法能够解释特定场景下的数据状态,技术处理的痕迹也成为追溯数据操作行为的重要依据。即便是最为初级、简易的数据,也经历了从物理世界转化为数据的过程,需要以一定的技术处理手段为基础。自然界的事件、人物和行为能够转化为可呈现、可陈述的数据元素,由计算机语言处理、记载和储存。联合国国际贸易法委员会(United Nations Commission on International Trade Law)从技术路径上定义“电子数据”,规定“电子数据”系指以电子技术手段生成、传递、接收或存储的信息,电子数据包括“如何对数据进行分类,以及如何通过自动化手段管理记录这些信息”等重要内容。
面对电子数据的基本特征,司法实务回归“谁拥有数据”的基础财产法问题,同时在数据的创造、控制和处理技术应用中做出“技术性的拟制”。早在1985年,美国印第安纳州法院已经承认数字资产是计算机技术产生的信息,并且“构成盗窃财务的目标财产。”
(二)两种模式:整体确权与进程确权
根据技术应用的不同路径,实践中的数据确权可分为“整体确权”和“进程确权”两种模式。前者是通过数据集中论证完成概括性的权利确认。后者是在数据运作的进程中,以技术手段对进程痕迹进行跟踪、标记或者追溯,从而实现阶段性、局部性的确权。
确权模式中的“整体确权”,是对数据的产生、形态和内容进行概括性的技术认定。目前,整体性确权主要用于数据产物的权属确认,我国大数据交易所“提交权属证明+技术评审+认定”的确权模式,具有整体确权的实际效果。
整体确权在互联网技术发展的初期就已经产生。在飞别产1.0时代,互联网以门户网站为主体,普通用户和互联网的交互仅限于在个人电脑的浏览器输入网站链接,互联网的功能以网站信息的发布和阅读为主,网站信息对用户而言是“只读”的,并不存在大量用户数据的产出、收集和利用问题。因此,这一时期的“数据”,主要意指互联网公司发布的门户信息,此类网站信息的基础则是主体明确的技术创新和研发投入。网站数据与产物设计存在深度的耦合,“数据”基本等同于原创性产物的权利辐射范围。互联网公司对网站信息发布、技术发明、外观设计等拥有整体意义上的权利,数据权属也不具有特殊性,可以转化为软件着作权、专利权、商业秘密等专门的权利进行保护。
进程确权模式将权利的确认置于高速率、大体量的数据生命周期,确权目标并不限于权利内容的概括性认定,还需兼顾数据价值的释放。进程确权模式产生于海量数据流动的飞别产2.0时代,用于确权的技术伴随关键性技术革新手段的兴起。这一时期,用户产生大量数据内容并上传到平台,换取相应的服务和利益。随着数据收集、传播、使用的范围及速度迅速提升,互联网不再局限于单纯的信息发布与阅读,而是以多主体参与的信息交互为主。技术平台成为数据产生以后的实际控制者,平台及其后续数据处理者成为与原初用户并存的多元主体,数据的占有、处理和加工能够产生新的收益,却也造成了权益分配的高难度。整体确权模式下的权利完整性无法实现,普通用户和技术平台都局限于附条件的数据使用权。这一时期,区块链、智能合约、可信时间戳等技术的应用,极大提高了存证溯源、数据控制、计算处理的效率,能够对数据处理进程中的权利关系予以确认和存储,容纳并证明参与数据处理的实际内容。数据权属的界定,从数据物权的技术证立,向数据关系变更、数据利益界定的动态进程转变。
叁、整体确权模式:数据“物权”的证立与局限
整体确权模式是传统“一物一权”财产理论在数据确权领域的延伸。传统财产理论倾向于明确且易于实施的所有权制度,并认为这是组织经济的最有效方式,财产法中的物权、所有权概念正是立基于此。
(一)数据“物权”的技术证立
整体确权的逻辑假设,是数据生产需要投入一定成本,因此需要稳定的所有权激励机制。既然数据来自特定主体的加工投入,那么数据归属于这一特定的主体也具有合理性。如果数据的创造能够使人获利,那么人们会对奖励和报酬做出全力以赴的回应。这一基础的逻辑,决定了整体确权的对象是以思想性和原创性为支撑的概括数据产物。作为确权对象的数据具有法律意义上的完整性,无法做出要素、结构或者进程上的分割。确权只需凭借与数据相关的主体、行为和内容等证据资料,完成数据劳动关联性的技术建构。
整体确权的关键在于数据“物权”的证立。研发主体的劳动与数据之间存在直接的因果关联,这种因果关联的基础在于原创性的投入。为此,主张数据权利的主体应当提供数据产生与创立的证明资料,通常包括使数据从无到有的设计程序、标识数据内容的源代码以及记载完整操作信息的技术日志。这些“利用条件、环境、事件、交易、属性或过程描述为事实的任何数据……描述了信息系统中发生的事件或交易。”
整体确权使数据具有了物权的对世性,数据主体追求实现排他性占有、使用、收益、处分数据的物权权能。尽管事实上占有数据仍旧存在难度,但权利主体对数据存储载体或者介质的占有,至少在形式上实现了数据的占有。借力于制度设计的保护,未经授权的数据剽窃与“盗窃财产”十分相似,它将影响进一步投入研发的积极性。由于延续了传统物权的基本逻辑,整体确权与传统物权的确权方式并无本质差异,尤其可以通过申请、验证、登记、备案等具体形式,完成权利形态的稳定化。在这种概括性的确权路径中,谁是权利的申请者,谁就是数据的所有者,也就是整体确权的保护对象。由此可见,整体确权的模式旨在实现数据创造者“拥有数据”,这种权利的属性是物权,以及与物权相关的一切实质性权能。
(二)整体确权的局限
整体确权更加关注数据产生的最主要贡献者,容易忽略不同数据主体和数据类型的价值阐释。整体确权有利于认定以技术研发为依托的终端数据产物,数据的权利是一个要么全有,要么全无的命题。一旦进入大体量数据分析与挖掘的场景,整体确权很难区分“同一数据、多个主体”的整体性权利,对高频度的数据变迁、流转和交易也无从入手。
整体确权以“限制应用”来鼓励创新,实际与大数据非竞争性、低交易成本属性相背离。经济学的研究成果认为,大数据的价值在于使用和流转,且这种使用和流转不因竞争关系的存在而受到影响。被分享和复制的数据与原使用者不构成竞争关系,使用者增多并不影响数据本身的价值。任何数量的公司、个人或机器算法可以同时使用这些数据,而不会减少其他主体可用的数据量。相反,小规模、单个数据的财富价值创造力极为有限,只有一定规模的数据能够产生持续积累的价值。如同古典音乐的社会价值,实际上在于数百年来人们的传唱和使用,这种重复使用不仅没有消耗音乐作品,反而增强了作品的生命力。从这个意义上讲,如果按照传统物权的规范性来约束数据,实际上是人为制造“数据稀缺”难题,限制数据价值的释放。正因如此,大量享有整体确权成果的数据主体主动放弃成果专有权,目的就在于实现大数据时代的快速普及与行业话语权,将数据以开放或者半开放方式推向市场。可以说,实现数据要素价值最大化的关键,正是促进数据开放共享和重复使用,这与整体确权的排他性占有大相径庭。
整体确权对传统人工操作具有较强依赖性,存在确权证明难保存、易篡改的困境。对整体确权模式而言,代表数据内容和边界的技术日志、程序代码成为产权证立的重要凭证。为此,整体确权依赖确权机构做出信用背书,以登记备案的方式概括数据产物的权利归属。这类登记的实现,离不开数据权利申请者向确权部门提交的文件,例如,申请者通常提交原初数据、权利请求书和相关说明。确权机构进行权利的审核,尤其强调原初数据与权利人技术投入的直接因果关系,即数据由权利人的“劳动”而产生。相关说明文件对数据的构成情况以及处理日志做进一步解释,以利于确权机构和后续主体理解并使用数据。然而,网络日志之类的痕迹数据很难得到即时保存,并且,数据信息的提取可能导致电子信息与原始存储介质的分离,电子数据的证明力会降低。权利明示需要将电子数据打印出来转化为书证,不仅容易破坏电子数据的内容,也提高了权利认定的成本;数据确权以专门机构的审核为基础,还存在权力寻租、篡改数据的风险。最根本的障碍在于,大数据时代的数据生成并非来自单一主体的“劳动”,且数据加工和利用的状态具有实时性,很多时候根本无须对即将迅速过时的数据予以概括性认定。因此,尽管我国当前省级以上的数据交易所达30余家,但受到整体确权逻辑的影响,数据确权更加倾向于明确权利的集中归属,对流通数据的价值释放无法起到积极的作用。多种问题的存在,表明整体确权的模式具有不充分性,亟待新型确权机制的补充。
来源:《清华法学》(本文为文章摘录版,如需引用,参阅原文)