【业务交流】区块链技术在档案管理中应用路径研究
2020-09-28 来源: 中国档案杂志 【字体:   打印

  自我国相关政策将区块链视为核心技术自主创新的重要突破口之后,各领域对区块链研究及应用已全面铺开。

  研究背景

  在国家层面,区块链已被纳入新型基础设施(新基建)建设。区块链技术的应用从金融领域迅速向房地产交易、政务服务、司法存证、版权保护等众多领域扩展。

  2019年,中石化开展了电子文件归档管理区块链应用试点,拉开了实践层面的探索序幕。中科院合肥分院、沈阳市档案馆等多家单位紧随其后,开展了各有特色的应用。从2020年国家档案局科技项目申报情况来看,涉及区块链技术的推荐项目占信息化和现代化项目总数的24.4%。从立项情况看,涉及区块链技术的立项项目共14项,占信息化与现代化项目立项总数的17.5%,占各类科技项目立项总数的11.7%。获得立项的14个具体项目中,除了1个软课题外,其余均聚焦具体的应用场景或系统建设。可以预计,档案界的区块链应用将在未来一段时间内迅速发展。

  尽管档案界对区块链技术在档案管理中的适用性与适用场景已做了不少的理论与实践探索,但站在单个档案部门的角度,在如何应用区块链技术,如何将区块链技术与现有管理体系、管理系统工具相结合等方面仍存在较为普遍的困惑。本文在对近年来国内外相关案例进行归纳和分析的基础上,尝试提出可能的应用路径,为各单位选择适用的区块链应用方案提供一定的参考。

  档案部门应用区块链技术的可能路径

  档案部门并不必然使用区块链技术,但必然要使用一定的技术来证明、提高其维护电子文件、电子档案的能力,这种技术可能是区块链,也可能是电子签名、时间戳、数字摘要等其他技术。在若干技术中作出选择的过程,也是考察技术本身的能力、成熟度、风险及适用性,以及各单位信息系统建设基本条件的过程。因此,档案部门应用区块链技术必须在知己知彼的基础上作出选择,其可能的应用路径包括:明确应用意图、选择应用对象、选择应用策略、审查应用环境、制定风险预案。 

  1.明确应用意图

  档案部门使用区块链技术必须先明确自己为什么要使用区块链技术,要使用区块链技术来解决什么问题。区块链作为一种建立和提供信任的基础设施,最本质的功能就是为应用者及其运用区块链存储和保管的数据(或数据凭证)增信。美国咨询公司Gartner在归纳4类区块链计划时指出,应用区块链技术的驱动因素包括促进共享、增加信任度、提高效率等。国内外多个档案管理部门将区块链应用在文件归档、移交接收、交换共享、保存维护等业务场景中。国家档案局蔡盈芳处长结合电子档案管理应用指出,区块链技术在解决长期保存、降低管理成本、促进协同管理、促进共享利用等方面有应用价值。

  中国信息通信研究院2018年发布白皮书指出,区块链技术适用于“新型数据库、多业务主体、彼此不信任、业务强相关”的场景,其中至少体现3个基本条件,即分布式环境、多主体交互、主体间信任度低。档案部门作为传统可信中心机构,并非工作在封闭系统中,而是需要和其他机构、人员发生频繁的互动,在互动过程中很可能出现不信任、弱信任的情况。如档案部门出具的档案材料将面临税务系统、工商系统、司法系统等外部系统的检阅,这些互动场景也是区块链技术发挥作用的领域。

  区块链技术在档案管理中所发挥的作用,有的是在应用前预设的,有的是在部署和应用过程中发现的。因此,档案部门在应用区块链技术解决其管理上的需求和痛点时,不需要在一开始求全求多,而应当找到最大的痛点,并能够证明区块链解决该痛点的优势,同时在技术实施上具备可行性。

  2.选择应用对象

  档案部门在明确意图的同时,应该选定应用区块链技术管理的对象,即划定需要通过区块链管理的档案范围或类型。划定的策略可能以文件类型为单位,也可能以现有管理系统为单位。

  从文件类型来看,主要可以考量以下3种类型:需要跨机构形成或处理的文件,如与外部客户签订的合同、招投标文件等;需要外部调用的文件,如上市公司财报、政府信息公开目录中的文件,可能要接受外部审计、核查的会计档案等;需要跨机构利用的文件,主要侧重于凭证类文件,如电子发票、电子证照、电子学籍等。

  从文件档案的管理系统来看,实施区块链技术的系统主要包括3种情形:一是档案管理系统单独实施区块链技术,这种应用主要着眼于后端档案管理和共享的需要;二是形成文件的业务系统(如财务系统、合同管理系统)和档案管理系统共同部署区块链解决方案。在这种情况下,业务系统中区块链技术的应用随着文件的形成而触发,即文件一经形成即上链,或者说文件产生于链上,文件管理主体责任在归档交接时能够通过区块链验证其真实性和完整性;三是继承了档案管理功能的业务系统(可以理解为文档一体化管理系统)实施区块链技术,国外多个土地管理系统即为此种应用。后两种情况支持文件档案的全程可信管理,受到较多的关注。

  一般而言,考虑到系统运行速度、承载容量等因素,大部分文件,尤其是非结构化文件,不会对全文进行上链,而部分内容相对单一的半结构化文件,如土地契约等权证类文件,可以以结构化的形式进行全文上链,并且上链后的权证类文件可以与交易行为绑定,进而拥有资产属性。 

  3.选择应用策略

  档案部门根据自身的建设部署能力,在充分考量应用场景、建设运营成本、风险等因素的情况下,选择适合的应用策略,至少包括以下3类:购买区块链平台服务、加入成熟的区块链、自建区块链。

  (1)购买区块链平台服务

  云计算的出现和发展衍生出基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等新型技术服务模式。随着越来越多的软件厂商建立起区块链技术平台,提供一站式的应用平台开发服务也产生了区块链即服务(BaaS)的模式。用户无须单独购买硬件、开发平台,只需选择服务提供商,使用平台中内嵌的共识机制,并配置所需的应用程序,即可实现管理意图。服务提供商通常还提供分布式账本治理的模板,为用户开展链下节点治理提供参考依据。

  直接购买区块链平台服务适合缺乏系统开发部署能力、应用对象或应用场景单一(如只用来管理电子合同或者电子发票)或业务规模有限的中小微企业。市面上已出现了许多服务平台甚至最终产品,如东港瑞云与北京市经开区建立的区块链电子档案平台,利用区块链技术打通电子会计从凭证入账到报销归档过程中的关键环节,实现单套制归档,为中小微企业节省会计档案管理成本。

  (2)加入或部署到成熟的区块链中

  相比直接购买平台服务,加入或部署到成熟的区块链中可以更好地实现定制化、个性化需求,但要求机构自身具备一定的系统开发部署能力。根据部署方案,机构可以选择加入联盟链、部署到公链或部署到区块链网络中。加入或部署到成熟的区块链以机构或联盟为单位,加入或部署的实体通常为机构自建或购买的信息系统,以及已经建立的私有链或联盟链。

  ①加入联盟链(开放许可链)

  从应用现状来看,加入联盟链(开放许可链)是国内采取较多的形式,其路径为机构先取得联盟内各主体的许可,再将系统部署到联盟链中,成为其节点。联盟链的建立通常是为了服务某一特定领域或达成某一特定目的,因此,选择加入联盟链的目的往往需要与联盟链建立的特定目的相契合。如北京互联网法院建立“天平链”的目的主要是为了提升法官采信电子证据的效率,加入该联盟链的各类组织、机构或服务平台接入平台的主要考量也是确保其电子文件作为电子证据的有效性,通过上链存证保障其文件的可信性及作为证据时验证的高效性。为增加对联盟链的了解,在全球范围内,已有许多信息管理学院将实现联盟链解决方案的开源项目HyperLedger Fabric纳入其课程中。HyperLedger是Linux基金会发起的一个区块链跨行业应用开源项目,关注区块链开发开源标准、架构和工具,HyperLedger Fabric是HyperLedger的一个子项目。

  联盟链虽然应用较广,技术与方案较为成熟,但其先建立信任合作,再进行系统建设或节点接入的模式与区块链期望实现多主体间去信任协作的意图或多或少有所出入。

  ②部署到公链中

  在国外,一些项目实施者也将成熟的公链(如比特币、以太坊)作为其选择对象。以巴西土地登记系统为例,根据土地类型和用途,巴西土地的行政管理权分散在不同层级的政府机构中,一块土地可能分别登记在由房地产登记办公室管理的地籍数据库和登记数据库中,土地存在产权负担(指土地所有人以外的人对于该土地所拥有的任何权利或利益,包括留置权、抵押、限制等)也无法查验。这种缺乏整合和系统化的管理状况使得腐败逐渐滋生,大地主有时会通过贿赂土地登记办公室把别人的土地登记在自己名下。2017年,一家位于美国特拉华州的区块链初创公司Ubitquity与巴西佩洛塔斯(Pelotas)和莫罗雷东多市(Morro Redondo)的房地产登记办公室共同发起了一个区块链项目,Ubitquity建立了一个前端网页,可从房地产登记办公室的系统中捕获地产的登记号码、所有者姓名、地产地址以及地产图片、相册和产权证书,前端网页通过网页服务器与后台存储器连接。Ubitquity的后台存储器管理着地产的图像以及与地产有关的契约(PDF格式或其他系统支持的格式)。这些关于巴西公民的信息虽然由巴西当地的土地登记机构生成,但存储在美国,由Ubitquity所有并负责运作。Ubitquity通过彩色币(Colored Coins)协议把地产的详细信息分散嵌入到比特币区块链中,使得土地和房地产登记在了一个透明的、不可更改的账本上。

  公链项目在性能、隐私、安全等方面还不能满足大规模商用要求,激励模型尚不成熟,尚难窥见其未来实现大规模应用的时间表,在国内的应用案例较为少见。

  ③部署到区块链网络中

  随着各类私有链、联盟链、公有链及区块链服务平台的建立与应用,重复建设、跨链交互成为新的问题。2019年,国家信息中心牵头搭建了名为区块链服务网络(Block-chain-based ServiceNetwork,BSN)的跨链基础设施,旨在为中小微企业乃至个人提供一个低成本开发、部署、运维、互通和监管联盟链应用的公共基础设施网络。BSN整合了云资源、底层框架、运行环境、密钥管理、开发SDK和网关API等一站式区块链部署和运行服务,开发者无须自建和维护系统环境,服务网络由统一的运维中心平台负责,从而实现节省区块链部署与运维成本、降低应用开发门槛和提高参与便利程度、提供灵活接入方式及快速组网机制等优势。目前,BSN已经适配或正在适配HyperLedger Fabric、FISCO BCOS等联盟链及以太坊、EOS等公有链,让开发者拥有更多选择。

  (3)自建区块链

  自建区块链是成本最高但又最为灵活的方式,一般包含由单个主体建立的私有链与多个主体建立的联盟链。

  私有链适合于体量巨大、业务庞杂、内部协同频繁的大型机构,如中石化将区块链技术应用到电子文件管理实践中探索,基于Fabric的联盟链解决方案,在石化内部选取5个城市的分支机构作为节点,基于Fabric底层架构在企业内网中搭建了私有链,通过对文件的特征信息和相关元数据的哈希值上链,重点针对有跨机构调阅或者是跨机构形成的档案进行上链存证和验证。

  如上文所述,联盟链的建立通常是为了服务某一特定领域或达成某一特定目的,根据形成联盟的不同场景,联盟链的建设可以在以下几类关联方中发生:具有协同关系的机构或部门,如产业链的上下机构/业务流的上下部门,飞机制造中的电子档案协作即是一例;具有信息共享关系的各个机构或部门,如跨境金融区块链服务平台应用区块链技术管理出口报关单;具有特定出证/验证需求的各个机构或部门,如需要提供民生档案跨馆出证的各个档案馆,需要出具电子学籍、电子成绩单、毕业证书的各大高校,需要出具资格证书、执照的各类资质审批机构等。

  4.审查应用环境

  在选好应用策略及正式实施文件上链或系统建设与部署前,还需做好应用环境的审查工作。

  一是对现有文件档案管理政策及资源状况进行审查,如文件归档范围及保管期限表、文件的保密密级等。由于区块链上的信息具有不可删除的特性,在保管期限到期后必须删除或最好删除的文件(如可能会引起法律风险和审计风险的文件)档案不宜上链,尽管实践中可使用密码学手段对信息进行永久性擦除,但随着密码学的发展,能否真正实现永久性擦除还有待验证;又如信息上链意味着要将该信息对所有节点乃至外部世界公开,因而涉密信息不宜上链。此外,还需对机构外部的文件档案政策进行审查,如果区块链节点分散在其他国家和地区,还需遵从外部法规。

  二是对上链的系统及管理措施进行审查。如加入联盟链前,需取得加入联盟链的实体资格并满足文件上链或系统接入的技术标准。接入联盟链的对象可能是电子文件管理系统(ERMS),也可能是数字档案长期保存系统(TDR),还有可能是一条私链。无论接入实体是什么,都需要满足系统安全性、电子数据合规性、区块链安全性等方面的要求,即证明原系统具备维护文件上链前的真实性、安全性、可靠性等能力。北京互联网法院为解决上链前数据的质量,出台了《天平链应用接入管理规范》和《天平链应用接入技术规范》,前者规定了申请节点接入管理流程的具体内容,后者则规定了申请节点接入天平链的技术测评要求。 

  5.制定风险预案

  鉴于区块链技术目前仍处于发展态势,部分使用问题可能尚未暴露,档案部门在应用过程中应制定相应的风险预案,如联盟链内各主体发生分歧造成区块链分叉的风险、联盟链运行不稳定遭遇解散的风险、区块链技术本身存在的风险、应用区块链的系统发生重要变更等。此外,在去中心化环境里,档案保管权、所有权、利用权重新分配带来的风险也需进入我们的视野。

  在中心化的系统中,档案的保管权、所有权、利用权都是高度集中的,而在完全去中心化的环境中,档案的保管权、所有权和利用权可以被认为是分别控制在个体手中的。以电子病历为例,传统管理模式下,电子病例的保管权与事实上的利用权都掌握在医院方。虽然国家卫健委公开表示电子病历的所有权归患者所有,即便隐去个人信息后形成海量大数据使用,也需要官方授权,但本质上个人仍缺乏对其个人健康数据的掌控力。在理想的区块链环境下,通过去中心化的网络加密层,患者能够通过密钥实现对电子病历的控制权,这意味着个体能够成为电子病历的潜在保管人,可以将个人健康数据保存在私人加密钱包中;个体能够有选择性地对利用电子病历的行为进行授权,并可控制其颗粒度,如招聘时雇主要求提供身高、体重、血压等数据,可以在不泄露其他健康数据的前提下,提供经院方体检中心认证的个别健康数据;同时,还意味着个人可以通过交换个人健康数据获得奖励,即可以通过向研究机构出售电子病历或其中部分信息获利。但事实上,现有区块链应用并不能达到上述理想化的去中心化程度,保管权、所有权、利用权呈现的是更为复杂的状态。现有的区块链解决方案往往没有内置分布式身份管理层将个人数字签名与现实世界中的身份联系起来,患者可以通过密钥授权别人访问其个人健康数据,却没有手段证明这份电子病历确实是自己的。又如,医院不愿让渡电子病历的控制权或不愿意接受其他医院认证的电子病历信息(如体检结果)往往并非技术原因,这将对电子病历的跨机构利用造成阻碍。

  对于上述风险,应用方需要采取额外的管理手段和技术手段来加以应对。

  小结

  区块链技术在档案管理领域中的应用会越来越多,本文总结的应用路径可能存在不全面、不准确的情况,相信日益夯实的创新实践会不断对之加以修正和完善。面对这样的应用趋势,区块链技术在档案管理中规范化应用也应提到议事日程上来。

  备注:

  参考文献略

  作者单位:中国人民大学信息资源管理学院、数据工程与知识工程教育部重点实验室、中国人民大学电子文件管理研究中心

  文章来源:《中国档案》2020年第9期




您访问的链接即将离开“海口市档案馆”门户网站,进入非政府网站
是否继续?