【业务交流】电子政务背景下河南省数字档案馆建设与实践
2020-09-10 来源: 中国档案杂志 【字体:   打印

  河南省数字档案馆经过需求调研、立项、设计、建设、应用,完成了建设任务,实现了数字档案馆的基本功能,满足了电子政务背景下政府对信息系统及信息资源互联互通、共建共享、安全高效的要求。

  建设思路与任务

  1.河南省数字档案馆建设的整体思路

  河南省档案馆依据国家档案局《数字档案馆建设指南》及《数字档案馆系统测试办法》,充分借鉴先进省市数字档案馆建设的经验,明确了河南省数字档案馆建设的思路。一是坚持统一规划、顶层设计。河南省数字档案馆立足于满足省馆本身的需要,又考虑到省直立档单位数字档案室建设和市、县级数字档案馆建设的需要,特别是考虑到全省数字档案资源的共建共享需要,从网络、系统、规范、资源、培训等方面加强顶层规划和设计。二是一体两翼,整体推进。以省数字档案馆建设为主体,以省直单位电子档案管理应用及市、县级数字档案馆应用为两翼,统筹兼顾,整体推进,逐步实现数字档案馆、室建设一体化,省、市数字档案馆建设一体化。三是“借船出海”,互联互通。在电子政务背景下,业务系统和信息资源通过政府网络实现了深度整合与共享,河南省电子政务网(包括省电子政务外网和省电子政务内网)成为各层级、各单位业务互联互通、资源共享的主要通道。河南省数字档案馆依托省电子政务外网部署数字档案室系统、电子档案移交接收系统和资源共享系统,实现省直单位电子档案的在线移交接收,各级档案馆异地查阅、跨馆出证和资源共享。四是夯实基础,循序渐进。河南省立足于数字档案馆基本功能,融入智慧理念,在系统设计、平台建设、技术应用方面具有先进性、兼容性和扩展性;在资源建设上,按照“存量数字化、增量电子化”原则,在规范化、多元化、特色化上下功夫。

  2.河南省数字档案馆建设的主要任务

  河南省数字档案馆建设任务主要包括标准规范建设、档案应用平台建设、基础支撑体系建设、标准机房建设、信息安全保障体系建设、数字资源建设以及人员培训等,概括起来就是“一库”“两中心”“三个服务平台”“四个保障体系”。

  “一库”指河南省数字档案馆资源总库,通过硬件设施、软件系统、数字资源建设,把数字档案馆建成长期保存的数字档案资源总库。

  “两中心”指通过新馆、老馆两个机房进行同城备份,建成数字档案备份中心和数字档案查询利用中心。

  “三个服务平台”指基于局域网的馆藏数字档案资源服务平台、基于省电子政务外网的全省数字档案资源共享服务平台、基于互联网的公开档案数字资源服务平台。三个服务平台能够满足档案馆、立档单位、社会各类用户对数字档案资源的利用需求,实现全省各综合档案馆开放数字档案资源在互联网上的共享利用、民生档案在省电子政务外网上的跨馆查阅以及各单位对本单位数字档案资源在省电子政务外网上的自助利用服务。

  “四个保障体系”指通过对基础设施、标准规范、安全体系、人才队伍建设,为数字档案馆建设提供全面的保障。

  建设成效

  1.建立了一套适用的标准规范

  依据国家档案局关于数字档案馆及电子文件、电子档案管理的标准规范,结合河南省数字档案馆建设的实际,河南省档案馆建立和完善了一套数字档案馆建设和应用的标准规范体系。如:制定了河南省标准《政务服务网电子文件归档数据规范》(DB41/T 1700.5—2019);以省“两办”名义印发了《河南省电子文件归档与电子档案管理暂行办法》;制定了《河南省档案馆纸质档案数字化成果接收暂行办法》《河南省档案馆数字档案资源共享管理暂行办法》《河南省数字档案馆应急预案及灾难恢复方案》《河南省档案馆文书、照片、音视频档案目录数据库结构规范》《河南省档案馆纸质、照片、音视频档案数字化技术规范》《河南省数字档案馆数据交换接口技术规范》《河南省档案馆光盘、硬盘管理规范》等一套标准规范,使数字档案馆建设和应用有规可依,有规能依。

  2.实现了数字档案馆的基本功能

  河南省数字档案馆逻辑架构图

  河南省档案馆在对网络、用户、信息流、业务流充分调研的基础上,明确了网络应用、业务流程、信息类型与数量、并发用户与响应速度、安全等级与策略等功能需求,确定了可行的技术路线和技术架构,做到需求明确、逻辑清晰、功能齐全、技术先进、安全可靠,实现了对馆藏档案的数字化管理、电子档案的在线接收和长期保存及区域数字档案资源的共建共享。

  (1)逻辑架构

  局域网的数据中心采用虚拟架构,由基础设施层、数据资源层、支撑平台层、应用系统层、用户接入层共五大层次,以及标准规范体系、实施保障体系、安全保障体系三大体系组成。河南省数字档案馆逻辑架构如图所示。

  基础设施层:①网络服务层次:提供局域网、省电子政务外网和互联网3种系统访问途径,其中,省电子政务外网与局域网物理隔离,互联网与局域网物理隔离,省电子政务外网和互联网逻辑隔离。②平台基础设备层次:包括虚拟化服务器、存储、光纤交换机、防火墙、路由器。③虚拟化服务平台:采用虚拟化软件虚拟出各档案应用服务器、备份服务器、数据库服务器、数据交换服务器,用于部署上层平台系统。

  数据资源层:数字资源是数字档案馆建设的重点,根据档案信息资源体系的规划,建立目录数据库、电子档案库、数字化成果库、多媒体数据库、标准规范库和系统维护库6个资源库。根据档案“收、管、存、用”的业务要求,对接收库、管理库、保存库和利用库进行逻辑划分和数据同步。

  支撑平台层:按照SOA服务的理念,构建应用基础平台与工具软件。支撑平台包括:基础组件平台、系统管理平台、系统配置平台、工作流平台、信息发布平台、报表平台。工具软件包括:Web文档控件、格式转换工具、四性检测工具、全文检索工具、OCR识别工具、通用浏览工具、流媒体服务等,为应用系统的建设提供支撑。

  应用系统层:根据档案业务管理、资源管理、用户管理的需求,开发部署馆藏档案综合管理系统等15个业务系统。

  用户接入层:面向省、市、县三级档案馆,省直立档单位和社会公众等系统终端用户,提供服务。

  (2)应用系统功能及部署

  应用系统建设是数字档案馆功能实现的核心。河南省数字档案馆应用系统建设在满足数字档案的“收、管、存、用”等基本功能的基础上,充分体现了前端控制、全流程管理、面向服务、安全高效的理念,建成了基于局域网、省电子政务外网、互联网3个网络平台的15套业务系统,并按照业务、用户、数据的特性,对各业务系统进行归类管理,提供3个入口地址,其中:局域网平台以馆藏档案综合管理系统为入口,省电子政务外网平台以河南档案业务网站为入口,互联网平台以共享系统前台部分为入口。

  基于3个网络平台的15套业务系统包括:

  依托局域网的应用系统共有7个:①馆藏档案综合管理系统,面向档案馆内部工作人员提供应用,实现数字资源的采集、接收、整理、保管、鉴定、编研、统计等全过程规范化管理。②多媒体档案管理系统,以多媒体档案为管理对象,满足照片、音频、视频等档案的收集、管理、保存、利用。③档案数字化加工系统,实现对纸质档案的前处理、著录、扫描、挂接、质检、验收等全过程管理。④智能库房管理系统,通过RFID技术的应用,实现辅助人工对库房和实体档案的智能化管理。⑤电子阅览室系统,面向来馆用户,实现自助查询、接待服务、阅览服务和调卷服务等功能。⑥海量数字档案安全保存系统,通过四性检测、元数据设计、数据封装、电子文件长期保存、安全保护等多种功能,实现对数字化加工成果、电子档案数据等的长期安全保存。⑦智能检索系统,通过OCR、NLP数据管理技术的应用,实现对数字资源的智能挖掘、智能归类、智能检索、智能学习。

  依托省电子政务外网部署的应用系统共有6个:①数字档案室系统,通过“数据物理集中、权限逻辑分离”的方式,为各立档单位提供对电子文件与数字化成果的“收、管、存、用”平台。②电子档案移交接收系统,为各立档单位提供数据封装、四性检测、系统接口、数据格式转换等工具,实现电子档案的在线检查、在线指导、在线移交接收。③全省数字档案信息资源共享系统,以统一平台、分级管理为原则,面向各立档单位以及省、市、县级档案馆,提供档案数字资源的共建共享服务。④办公自动化系统,作为档案馆协同办公平台,提供了公文流转、人事管理、会议管理、日程安排等功能。⑤家谱档案管理系统,以河南省各级档案馆中的家谱档案为管理对象,通过家谱档案元数据著录、内容管理、动态呈现,搭建起全省的家谱档案共建共享平台。⑥河南档案业务网站作为河南省数字档案馆在省电子政务外网的业务门户提供以上5个系统的访问入口并集中展示相关内容。

  依托互联网部署的应用系统共有2个:①公共查询系统,面向互联网公众用户,提供馆藏开放档案的目录检索和全文检索,以及编研成果展示、网上展厅等。②移动档案服务系统,面向移动互联网用户,提供开放档案的统一发布和查询。

  3.搭建基于省电子政务外网的资源共享系统

  资源共建共享是数字档案馆建设的目标导向。基于省电子政务外网建立的资源共享系统,界面简洁、功能清晰、资源丰富,用户经过身份认证后登录系统,根据授权实现共建共享需求。一是通过数字档案室及移交接收系统为各立档单位提供了统一的数字档案管理平台,为各单位之间档案资源共享创造了条件。二是通过全省档案资源共享平台共享政务公开信息、开放档案、编研成果等。三是通过河南政务服务网站前端接收社会公众的利用请求,在后台处理完毕后将数据再推送给前端提出申请的用户。四是利用全省档案资源共享平台实现省内馆际之间的异地查档、跨馆出证。

  4.开发基于NLP技术的智能检索系统

  智能检索系统选型HanLP技术,通过拼音检索、首字母检索、同义词检索、模型检索、人名库提取、地名库提取、热词排行、知识图谱、统计分析等功能,对智能挖掘、智能归类、智能检索、智能学习的智慧利用模式进行了初步探索。系统目前共收集目录数据3242805条,全文数据1652107条,并全部完成了TXT抽取、中文分词、关键词提取、拼音标注及缩写,建立了包含4174045个词组或短语的基础词库,包含62003个词语的同义词库,以及河南基础地名库、人名库、关键词库等。同时,按照档案分类法对馆藏系统中所有档案进行分类标记,共设置20个大类。通过以上手段,实现了对资源总库中档案数据的智能检索和知识管理,取得了较好的利用体验和利用效果。

  5.完善基于海量数字档案安全保存策略

  信息安全是数字档案馆建设的保障。在设计与建设中,确立了网络、系统、资源、管理等安全策略。一是确定网络、系统的安全等级保护级别。省电子政务外网、局域网及部署其上的应用系统都按照等保三级要求规划设计与建设。二是部署海量数字档案长期保存系统,保障数字档案长久保存过程中的真实性、完整性、可用性和安全性。三是建立全方位的安全防护。根据局域网业务系统安全要求,在对档案安全风险分析的基础上建立安全防护模型,从应用层、系统层、网络层、物理层和管理层5个层面对数字档案馆进行分层防护,从而全面保障数字档案馆的安全。其中:应用层安全,通过采用身份认证、权限控制、数字签名、应用审计及数据加密等技术手段,重点保护各业务平台账号、密钥、操作等安全;系统层安全,通过进行操作系统加固、漏洞扫描、防病毒查杀、备份恢复等,重点保护操作系统、数据库的安全;网络层安全,通过使用防火墙筛查、链路加密、违规外联监控、VLAN划分、安全隔离、入侵检测、安全审计等手段,重点保护网络安全;物理层安全,通过采取电力保障、设备安全、防电磁泄漏、防物理破坏、环境安全、介质安全等有效方式,重点保护机房环境、核心设备、重要介质等安全;管理层安全,通过成立管理机构,加强人员培训,制定管理制度和应急预案等,建立起安全机制,为信息系统和档案数据的安全提供制度保障。

  6.以共享为主要目标的资源建设

  根据不同网络用户,对资源进行分类部署。局域网部署的是覆盖全部馆藏各门类档案、图书、资料的目录数据、全文数据(涉密档案除外)及政务公开信息;省电子政务外网部署全省各级档案馆的开放档案目录、民生档案目录、特色档案资源以及省直各立档单位的已进馆档案数据;互联网部署省馆开放档案目录及开放档案全文数据、政务公开信息及公开的档案编研成果。依托资源共享系统,制定资源共建计划和资源共享办法,指导市级档案馆上传档案馆指南、专题介绍、开放档案目录数据、专题目录数据、原文数据,有计划地组织具有河南特色的专题资源库。家谱档案资源库架构已经搭建,依据家谱档案元数据著录规范,上传家谱数据,并对数据进行解析加工,从家族谱影、家族名人、家风家训、姓氏字辈、家谱遗迹等方面挖掘数据,探索数字人文与资源管理的结合。

  努力方向

  面对加快档案信息化战略转型的机遇和挑战,数字档案馆建设应朝着以下几个方向努力:一是要着力应用,以用促建。要加快数字档案馆系统在省馆内部、省直单位和市、县级档案馆的推广应用,培育电子文件单套归档的试点,推进原生电子档案的接收,加大资源共享力度,使数字档案馆成为档案管理、业务协同、对外服务、提升功能的有效平台,同时通过应用反馈,促进数字档案馆建设不断完善。二是要推进融合,以融促用。随着“放管服”改革的深化,截至2020年2月1日,河南省共发布省、市、县三级政务服务网上办理事项197417项,这些事项的办理将产生大量电子文件。档案部门要进一步加强与大数据管理部门的融合,做好政务服务网电子文件规范化管理、归档与共享。三是要深化研究,以研促转。新的政策环境、技术背景、多元化需求导向下,数字档案馆建设正在向着业务协同、资源共享、安全可信、长期保存、智慧智能的方向发展,因此需要从物联网、云计算、数据挖掘、移动互联网应用等方面继续深化对数字档案馆的研究,推动数字档案馆的智慧转型。

  作者单位:河南省档案馆

  文章来源:《中国档案》2020年第8期

  图表来源:作者提供

  




您访问的链接即将离开“海口市档案馆”门户网站,进入非政府网站
是否继续?