首页 >> 解读回应 >> 最新解读 >> 正文
【法规解读】《政府网站网页归档指南》解读
2020-06-24 来源: 中国档案杂志 【字体:   打印

  近年来,在政务服务深化改革的背景下,政府网站职能大幅度提升。《进一步深化“互联网+政务服务”推进政务服务“一网、一门、一次”改革实施方案》加强了政府网站在政务服务深化改革中的作用。清华大学国家治理研究院《2019年中国政府网站绩效评估报告》指出,80%的政府网站积极公开机构职能和政策文件、动态要闻等基础信息;86%的政府网站积极开通政策解读专栏,对政策进行解读。因此,政府网站网页成为网上政务服务原始记录、政府部门履职证明、政务服务信息的集中载体和政府执政能力与服务意识不断提高的见证。

  制定背景

  《政府网站发展指引》指出,“政府网站遇整合迁移、改版等情况,要对有价值的原网页进行归档处理。归档后的页面要能正常访问,并在显著位置清晰注明‘已归档’和‘归档时间’”;《全国档案事业发展“十三五”规划纲要》要求,“要研究制定重要网页资源的采集和社交媒体文件的归档管理办法”。这些政策的出台对于网页归档工作的开展起到了引导和促进作用。制定网页归档行业标准,可以有力推进政府网站的网页归档工作,为政务服务深化改革提供支持。

  制定目的

  制定政府网站网页归档行业标准,确定网页归档范围,梳理网页归档流程,研究和选择合适的网页归档技术手段,为各级政府部门开展政府网站网页归档工作提供指导,保障政府网站网页信息的长久凭证和查考价值,为政务服务深化改革提供档案支持,从而进一步提升政务服务水平。

  标准结构

  《政府网站网页归档指南》(DA/T 80—2019)(以下简称《指南》)从总则、归档范围和保管期限、收集、整理、移交接收、网页归档功能模块要求等方面,为政府网站网页归档工作提供了规范和参考。

  1.总则

  规定了网页归档应遵循及时性、完整性、可用性和安全性的原则以及网页归档的责任主体和责任划分。网站主办单位作为网页归档的责任主体,应对网页信息的生成、发布和归档实行全过程管理,确保归档网页信息的真实性和完整性。网站主办单位的档案部门负责制定网页归档的规章制度,指导监督网页归档工作,接收和保管网页档案,提出网页归档功能模块需求;网站管理部门负责网页信息的收集、整理和移交等工作;信息化部门负责建设网页归档功能模块,为网页归档工作提供信息化支持。

  2.归档范围和保管期限

  主要规范了网页信息的归档范围和保管期限的设置。网站主办单位应综合分析本单位网站上各类网页信息的重要程度和保存价值,制定本单位网页信息的归档范围和保管期限。网页归档范围应包括反映网站整体面貌的网站首页及栏目首页,反映本单位职能和网站功能的信息发布类页面、解读回应类页面、办事服务类页面、互动交流类页面以及其他具有保存价值的页面。同时,根据目前档案保管期限的划分方式,将网页档案的保管期限划分为永久、定期30年和定期10年3种情况。为便于实施,《指南》在资料性附录A中提供了政府网站网页信息的《归档范围与保管期限参考表》。

  3.收集

  规定了网页信息收集时间、收集内容和归档时应使用的文件格式。在收集时间上,应重点关注及时性,针对网页内容不断发布、更新的特点,各单位应根据页面更新频率确定合理的收集周期,当页面内容及风格发生较大变化时也应注意及时收集。在收集内容上,应重点关注完整性。考虑到客观条件上可能存在的限制,应注重完整收集页面中的可视静态内容,在条件允许的情况下也可进一步收集页面中的动态内容。《指南》对网页信息收集元数据项进行了规定,对单个内容分页显示、网页包含附件、网页存在外部链接等情况下的网页信息收集也进行了明确要求。

  在归档文件格式上,《指南》明确要求应符合国家标准《电子文件存储与交换格式版式文件》(GB/T 33190—2016)或档案行业标准《版式电子文件长期保存格式需求》(DA/T 47—2009)要求的版式文件格式保存网页页面,页面的附件如果不能保存为版式文件,应保存为符合国家标准《电子文件归档与电子档案管理规范》(GB/T 18894—2016)要求的归档文件格式。

  4.整理

  规定了网页档案的整理方式,包括分类、编号和数据组织等。要求网站主办单位应根据本单位的实际情况制定网页档案分类方案,并保持分类方案的一致性和稳定性,对单位内不同网站的网页档案分别分类。给出了同一网站内的网页归档的参考分类方式,如“年度—保管期限—类别”或“年度—类别—保管期限”,同一类目下的网页档案一般按形成时间顺序排列。

  档号可采用如“全宗号—档案门类代码—网站代码—年度—保管期限代码—类别代码—顺序号”或“全宗号—档案门类代码—网站代码—年度—类别代码—保管期限代码—顺序号”,对于档号各部分也提出了具体编制要求。对于档号中“类别代码”的编制,网站主办单位可采用网站栏目或根据本单位网页类别的实际情况设置网页档案的类别,设置相应的类别代码并以汉字标注类别名称。数据存储组织可采用层级文件夹的形式,依次按不同的网站、“年度—保管期限—类别”或者“年度—类别—保管期限”建立层级文件夹,对归档网页信息进行有序存储。

  5.移交与接收

  规定了归档网页信息的移交时间与方式、移交要求和接收要求。整理完毕的归档网页信息应实时或定期以电子形式向档案部门移交,定期移交时间一般不晚于次年6月底。移交时,网站管理部门应清点、鉴定归档网页信息的内容及元数据的真实性和完整性,然后向档案部门移交。接收时,档案部门应对网站管理部门移交的归档网页信息的内容及元数据进行清点和检测,检测合格后登记接收,并记录移交接收行为,完成网页归档过程。

  6.网页归档功能模块要求

  网页归档工作需要计算机应用系统的支撑,本章对相关计算机应用系统的网页归档模块功能提出了基本要求。网页归档功能模块应能实现网页信息的收集、整理、移交、接收等功能,具体功能可参考《电子档案管理系统基本功能规定》中的相关要求。《指南》还特别对网页归档功能模块的文件格式转换、网页信息及网页信息归档过程的元数据的捕获和记录以及归档网页信息的安全保障等功能提出了具体要求。

  一些关键点

  1.政府网站网页归档范围

  前文提到,并非所有的政府网站网页文件都具有相同的重要程度和保存价值,因此,有必要按照网页内容的价值来判定是否对其进行归档。实践表明,网页内容全部归档将耗费较大的存储资源,既不利于长久保存,又不利于查询利用。

  在网页归档工作中,应重点关注通过网站形成和处理的记录政务服务信息和反映政府部门履职状况的网页信息,这类网页信息所体现的内容往往是仅在政府网站上形成的,无法通过其他途径进行归档保存,因而在网页归档工作中具有独特的价值。如信息发布类页面中,时效性较强的信息发布和公示页面;办事服务类页面中,与服务对象的交互内容;服务信息的发布、服务的网上预约、服务申请的提交、服务进度的显示和服务结果的反馈等,这些内容都需要重点考虑归档。

  2.网页归档流程分析

  网页档案作为政务服务原始记录和政府机构履职证明材料,应遵循“谁形成办理,谁归档”的原则,应注重归档过程的严谨性和归档材料的凭证价值。相比于其他部门,档案部门主导的网页归档工作,可以有效地发挥网页档案凭证作用,但不宜单纯采取自行抓取网页保存的形式,应采用“网站管理部门收集整理归档—档案室保存和管理—档案馆保存和管理”的严谨模式开展。通过不同部门之间的分工和协作,划分清楚各自的权力和责任,网站管理部门为归档网页的可靠性负责,档案部门为归档网页的真实性负责,这样可以更好地保障归档网页的凭证价值,为政府部门履职提供支持。

  3.网页归档技术手段分析

  网页归档工作技术性较强,需要选择合适的技术手段来保障归档网页的真实性、完整性、可用性和安全性。网页档案的真实性保障技术可以参考归档电子文件的真实性保障,选用数字摘要、数字签名或可信时间戳等技术来保障其真实性。完整性保障则要深入分析在网页本身之外还有哪些网页相关的信息需要收集和归档保存,如为了反映信息发布这一职能,需要收集网页发布时的网络地址和网页发布的时间段;对于带有附件的网页,附件的内容应如何收集和归档保存等。网页归档的可用性保障问题相对复杂,采用的文件格式是其核心问题之一。通常各类网页格式,如静态的html、shtml或动态的cgi、asp、aspx、php、jsp等在不同时期或不同版本的浏览器上会出现明显的显示差异,因此,不能确实保障网页信息在长期保存过程中的可用性。一方面,由于WARC格式内核基于html,因此,在长期保存过程中,需要对其可用性问题进行研究和探讨。另一方面,WARC格式相对复杂,需要搭建服务环境。因此,《指南》在选择网页归档格式时选择了更符合档案工作习惯的版式文件格式,因为,版式文件格式在如实保存网页视觉效果、使用的便捷性和长期保存过程中的可用性上更具优势。需要说明的是,《指南》并不排斥在政府网站网页归档工作中对WARC格式的使用,以版式文件格式保存归档网页的同时,以WARC格式对网站的整体内容进行打包保存,可以提升网页档案的整体应用效果。

  作者单位:国家档案局

  文章来源:《中国档案》2020年第6期