Top Banner
国国国 国国国国国国国国国国国
61

国家图书馆 信息基础设施建设与服务

Feb 04, 2016

Download

Documents

nariko

国家图书馆 信息基础设施建设与服务. 一、国家图书馆信息基础硬件设施 建设与服务. 一、国家图书馆信息基础硬件设施建设与服务. 机房建设. 网络建设. 存储建设. 国家图书馆计算机机房总面积 2430 平米 ; 供电实现 双路供电不间断 ,保障了数字图书馆系统的安全稳定运行; 服务器从 2008 年的 200 余台增至 约 900 台 。. 建立万兆光纤骨干网络,实现主干万兆、桌面千兆的高速网络连接,拓展互联网带宽至 1.2G ,并实现多路冗余、流量自动分配; 数据传输能力提高了 上百倍 ; 总馆南区、总馆北区和文津街馆区 无线网全面覆盖 。. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 国家图书馆 信息基础设施建设与服务

国家图书馆信息基础设施建设与服务

Page 2: 国家图书馆 信息基础设施建设与服务

一、国家图书馆信息基础硬件设施建设与服务

Page 3: 国家图书馆 信息基础设施建设与服务

一、国家图书馆信息基础硬件设施建设与服务

机房建设

国家图书馆计算机机房总面积 2430 平米;

供电实现双路供电不间断,保障了数字图书馆系统的安全稳定运行;

服务器从 2008年的200余台增至约 900

台。

建立万兆光纤骨干网络,实现主干万兆、桌面千兆的高速网络连接,拓展互联网带宽至1.2G,并实现多路冗余、流量自动分配;

数据传输能力提高了上百倍;

总馆南区、总馆北区和文津街馆区无线网全面覆盖。

网络建设

国家图书馆建有磁带库、磁盘阵列、光纤导向器组成的整体存储系统,总的存储量达到 2270TB。

采用在线、近线、离线三级存储机制,解决了面向海量数字资源的调度、备份、服务、存储、保存等问题。

存储建设

Page 4: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

Page 5: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

1 、基础业务相关 —— Aleph 系统应用情况

2002

2008.3

2009.11

至今

作为极其重要的核心业务系统引进并启用

14版升级到 16版

16版升级到 20版成为国内首家启用 AIX版 Aleph20版的用户

目前,国图馆藏近 700万册中文文献, 386万册外文文献,拥有 70多个阅览室和外借库、 160万读者和 2500万本单册,每年的外借量都高达几百万次。

500

Page 6: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

1 、基础业务相关 —— Aleph 系统应用情况

Aleph系统承担着国家图书馆馆藏资源采编检流的业务流程,是我馆基础业务和读者服务的关键平台。

系统中存储的信息包括:书目数据、用户数据等相关数据,与定制系统连接的接口数据,互联网及系统管理数据等。

为工作人员提供采访、管理、规范、编目、流通、馆际互借等基础服务。为互联网读者提供信息检索服务、内外数据资源访问、书目流通等服务。

服务范围除面向内部员工外,更是为全世界范围的读者用户服务。

Aleph500系统在我馆的应用极其全面、广泛:启用中文和外文的名称、主题规范控制,多方式、多渠道地研究不同类型外部的数据,统一通过自动化集成系统进行发布,可以通过多种方式进行批量数据处理、提取;开通十多个Z39.50服务,启用联合编目功能。

通过 X-service 接口有近 26个系统与 Aleph500系统进行连接:

如门禁系统、预约到达通知系统、馆际互借和文献传递系统、智能架位导航系统、自助办证充值和自助借还系统等,提供更加自动化、人性化、多样化的服务。

Page 7: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

1 、基础业务相关 —— Aleph 系统应用情况

办证辅助功能、化办证流程的定制程序

多项方便业务部门使用的统计功能

国图风格的 OPAC ,进行 OPAC2.0 的改版和少儿 OPAC 的建设

update-bor-nlc (修改读者信息)、 update-item-nlc (修改单册信息)、

hold-req-nlc (根据国家图书馆实际需求开发的预约请求服务)、

item-data-nlc (增加了单册是否被预约请求的判断)、

loan-history (查看借阅历史)、 update-cash (增加金融功能)、 bor-info-nlc (显示更全面的读者信息)、

ssonlc-auth-item(单点登录接口 )

采访拟订购系统

X-server 接口定制开发

定制开发

Page 8: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

1 、基础业务相关 —— Aleph 系统应用情况

主库

Standby NetworkService Network 馆网

馆网Service Network

心跳线tty

HDS SAN

二期机房

一期机房

1 号机 2 号机 3 号机

Service IP

Service IP

实 IP

实 IP

4 号机 5 号机

ORACLE PC-SERVERNCIP

WWW

DATA GUARD物理备库

WWW备机 测试机

服务器架构

Page 9: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

1 、基础业务相关 —— 联合编目系统 1997年国家图书馆成立了全国图书馆联合编目中心,在全国范围内组织和管理图书馆联机联合编目工作,共享书目资源。

联合编目系统 UCS(Union Cataloging System)

系统根据全国图书馆联合编目中心的需求,在 ALEPH500系统的基础上定制开发而成。与我馆 ALEPH500的编目模块紧密结合,形成一个全国性的图书联合目录,从而实现全国范围内图书馆间、跨系统甚至跨行业的书目数据资源的共建共享。

目前,共有成员馆1224 家,共有书目信息9643217 条,馆藏信息26868138条。

主要功能

提供一个系统平台,编目中心的各成员馆能上传各自的书目记录和馆藏,并下载所需的书目信息。

系统构成

客户端 WebOPAC UCSWeb

Page 10: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

2 、读者服务相关 ——预约到达通知条屏系统

预约显示通知系统于 2011年 11 月 7 日在我馆七个闭架阅览室正式运行,此系统不仅能通过电视屏幕为读者显示预约文献的到书信息,还能及时提醒工作人员超时未被处理的预约请求。

Page 11: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

2 、读者服务相关 —— 自助借还系统

自助借还系统

读者自助借还(自动分拣)

24小时自助还书机

自助借还机

标签转换

手持点检(架位管

理)

安全门禁

馆员工作站

Page 12: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

2 、读者服务相关 ——自助办证充值系统

2009年 9 月 9 日百年馆庆时正式推出,年满 16 周岁读者可凭二代身份证在自助办证充值机上完成普通读者卡办理增加外借功能、修改借阅密码、验证和充值等操作。

Page 13: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

2 、读者服务相关 —— 智能架位导航系统 智能架位导航系统嵌入联机公共目录查询系统( OPAC )中,读者查询到自己感兴趣的文献资料,点击“架位导航”超级链接,即可得到目标图书架位三维分布图,明确提示目标架位所在位置,并给出最佳路线导引,以方便读者获取目标文献。

Page 14: 国家图书馆 信息基础设施建设与服务

二、国家图书馆信息基础业务系统建设与服务

2 、读者服务相关 —— RFID 扩展项目

RFID 扩展系统融合了最新的 RFID 技术,不仅为读者带来更优质的阅读体验,也为员工的工作带来极大的便利,对于细化服务,促进传统业务与数图业务的融合起到积极的促进作用。

针对使用部门根据业务和服务对系统提出的需求,承建商为国家图书馆设计定制了新设备

RFID 扩展项目不仅仅在设备上有创新,在 RFID 系统上也增加了很多新的功能

手持采集器智能归书桌

新书架位分配、下架流程优化、WEB 端统计系统等

Page 15: 国家图书馆 信息基础设施建设与服务

三、近两年以 ALEPH 系统为基础的创新应用

Page 16: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

外文文献是我馆馆藏资源重要组成部分,数量在国内首屈一指。图书的目次信息能够全面详实地反映文献的核心内容,对于满足读者的深层次信息获取需求具有重要的意义。为了加强外文文献的揭示力度,进一步发掘外文文献的利用价值,更好为国内外读者提供高质量的西文文献检索、报道和传递服务,我馆启动外文文献目次库建设。

系统采用分开式建库的模式单独管理对目次信息。降低对目次信息处理时对书目信息造成影响的风险;另外,分开式的信息容量更大,能更全面更深入揭示目次信息。

项目背景和意义

Page 17: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

外文文献是我馆馆藏资源重要组成部分,数量在国内首屈一指。图书的目次信息能够全面详实地反映文献的核心内容,对于满足读者的深层次信息获取需求具有重要的意义。为了加强外文文献的揭示力度,进一步发掘外文文献的利用价值,更好为国内外读者提供高质量的西文文献检索、报道和传递服务,我馆启动外文文献目次库建设。

具体实现时,利用 ALEPH系统已有的功能将目次信息保存为独立的文件并上传到服务器指定位置,通过一系列的设置即可在 OPAC系统中展示目次信息。 这种方式不需要对书目数据做任何修改,避免误操作对书目库造成不良影响;并且我馆中文文献已经按照这种方式实现了目次信息的揭示,有成功的案例可以借鉴,确保了此方案的可行性;

此外,该方案可以实现书目与目次信息通过页签双向切换的展示效果,更加方便直观。但这种方式需要一定的程序开发量。

项目背景和意义

Page 18: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

功能实现 ——目次数据处理

外文目次

外文目次数据( ISO2709 )

外文目次数据处理 ALEPH500 系统

目次文件

数据库表数据库表

浏览器数据处理

互联网

上传 / 复制

导入 / 更新

Page 19: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

功能实现 —— 在 OPAC 上显示目次数据

可以在 OPAC系统中显示目次信息。当用户检索到一条创建了目次信息的外文文献时,在书目详细信息显示页面,会增加一个“网摘目次”页签,点击这个页签会展示该文献的摘要、目次信息、作者简介等内容。

Page 20: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

功能实现 —— 目次数据的修改和更新

数据库 目次文件

国家图书馆外文目次数据管理系统

JSP/JavaBean

登录 登录

系统管理员

普通工作人员

Page 21: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

功能实现 ——目次数据处理相关数据库表

新建数据库表 系统中已存在的表

目次数据批次表 简明书目信息表 书目和目次信息关联表

该表是用于记录目次数据批量导入 ALEPH系统的批次信息,包含的字段有目次数据批量导入的批次号、 ISBN 号、书目信息存在标识、目次文件存放位置。

该表中保存的是ALEPH系统中书目数据的简明信息,包含的字段有书目系统号、出版年、责任者、题名、出版者、 ISBN 号等。通过与该表中 ISBN字段的匹配实现了目次数据对应的书目信息的提取。

该表中保存的是相关联的书目和目次信息,包含的字段有书目系统号、目次文件存放位置、责任者、题名、出版者、ISBN 号等。正是通过这个表,才把书目数据和对应的目次数据关联了起来。

本项目涉及到 ALEPH系统中 3个数据库表:

Page 22: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 1 )目次数据按记录切分

Page 23: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 2 )目次数据按字段切分形成 ALEPH 顺序文件格式

Page 24: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 3 )目次数据中 ISBN的提取

Page 25: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 4 )目次数据的元数据信息的导入

Page 26: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 5 )提取目次数据中的目录 / 摘要等信息

Page 27: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 6 )上传目次数据中的目录 / 摘要等信息

Page 28: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

1、外文文献目次项目

目次数据处理——外文目次管理系统 7 )上传和下载文件

Page 29: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

背景介绍

规范控制

书目规范控制

主题规范控制

规 范 控 制 ( authority

control ):采用规范文档对每条书目记录中的检索点(标目)进行规范化校验的工作。其目的是完善目录的汇集功能和查询功能,保证目录体系中标目一致性和唯一性。同时引导使用者根据文献上出现的标目检索到书目记录所使用的规范化标目,进而完整地检索到所需要的文献。

规范控制

书目规范控制

主题规范控制

书目规范控制:包括名称规范、

主 题 规 范 。名称规 范又包 括个人 / 家族名称、机关团体 /会议名称、具有行政管辖权的地理名称以及统一题名。主题规范记录是指为主题标目所做的规范记录,为检索系统提供的检索点。

规范控制

书目规范控制

主题规范控制

主题规范控制:主要指书目主题概括描述的规范化,也就是书目主题揭示的完整性、一致性和相关性的控制。

Page 30: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

背景介绍

“国家图书馆中文书目主题规范数据库”是中文采编部根据国家书目主题范围,从《中国分类主题词表》的“中文主题规范数据库”中抽取的。主题规范也包括个人名称、机构名称、会议名称、地理名称、题名主题、学科主题等。

国图的规范控制采用相互独立的方式,也就是指在系统内,书目数据库与规范数据库各自独立,彼此在计算机程序管理上没有依附与控制关系。在编目过程中,编目员可以象查阅电子版参考工具书一样去查阅规范库,并根据检索显示的结果自主决定书目记录中的标目形式。

Page 31: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

项目目标

该项目主要完成 ALEPH系统书目的主题标引词和规范库的主题词实时同步更新等功能的定制开发,主题词批转换、重复数据删除等相关数据处理工作。

从规范控制功能上,实现同一主题各资源数据的聚合浏览及检索、相关联主题的推荐。

从规范控制手段上,使书目库的主题标引词和规范库的主题词保持同步更新。

Page 32: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

要解决的问题

国家图书馆的主题标引模式是采用先组式标引模式,即选用规范库中的单个主题词形成主题词串的标目形式。而国家图书馆目前使用的 ALEPH系统的规范控制模式是对整个主题标目 ( 含 $a子字段 )进行控制,而不能对标目中的单个词进行控制。为了达到规范控制的目的,目前采用的方法是将先组主题词串中有检索意义的单个词再由人工重复进行著录( $a ),而没有单独著录的词并不能实现规范控制。

这样,随着规范库主题词数据的修改,就会造成书目库中同一个概念因为著录在不同位置上( $a、 $x、 $y、 $z、 $j )而出现了不同的词形,不仅没有达到书目主题数据与主题规范数据的同步修改,而且会造成规范控制混乱。所以必须解决国家图书馆长期以来使用主题词规范控制与书目主题标目控制的不匹配控制模式,真正实现对主题数据的规范控制,进而实现书目主题数据和规范库数据的自动动态同步更新。

Page 33: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路 —— 实现功能

实现主题词与书目主题同步实时规范控制功能

具体是指 ALEPH系统主题规范库 NLC11库 2XX字段( 200、 210、220、 240、 230、 250、 215 )分别与中文书目库 NLC01库 6XX字段( 600、 601、 602、 604、 605、 606、 607 )所涉及到的相同主题词,应随着 11库增删改而相应变化,无论主题词处在 $a、 $x、 $y、$z、 $j 任何子字段位置,在不重复单独著录子字段 $a的条件下,也能随之修改,即实现书目主题数据与主题规范数据的同步修改。

书目主题标引仍然采用组配标引模式,即主题词串的形式, Aleph系统需再开发增加单个词规范控制功能,实现对词串中各子字段( $a、 $x、$y、 $z、 $j )主题词的规范控制和自动更新。系统通过自动抽取词串中每个独立子字段的主题词建立索引,再通过和规范库主题词标目形式( 2XX字段或 COR字段)的匹配,进而实现对每个子字段主题词的同步控制和更新。

Page 34: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

系统根据编目员著录的 6XX字段的主题标引词串,自动抽取每个独立子字段(即 $a、 $x、 $y、 $z、 $j )对应的主题词建立索引,例如自定义 609字段,用来存放每个主题词索引, 609字段可不在书目数据中存储。

定义 609字段的前两位指示符分别为多主题分组和每组主题词组配位置排序的标记;定义子字段 $a为规范库主题词;定义子字段 $A为主题词类型(人名 p、团体 o、题名 t、学科 s、地名 g等);定义子字段 $2

为主题规范库代码(统一定义为 $2cct )。

解决思路

( 1 )根据书目库主题标引词串自动生成单个主题词索引

Page 35: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

书目库 [1列 ]

规范库 [2列 ] 主题词类型 [3列 ]

609$A (生成类型代码) [4列 ]

600$a 200 人名主题词 p (person)

601$a 210 团体主题词 o (organization)

605$a 230 题名主题词 t (title)

606$a 250 学科主题词 s (subject)

607$a 215 地名主题词 g (geography)

6XX$x

6XX$j

6XX$z

200 人名主题词 p (person)

210 团体主题词 o (organization)

230 题名主题词 t (title)

250 学科主题词 s (subject)

215 地名主题词 g (geography)

6XX$y 215 地名主题词 g (geography)

表 1 主题词类型 $A 对应表

Page 36: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路 例如,以下主题词字段通过以上方案生成 609索引:

600#0$a 苏轼 $f(1036-1101)$x 古典诗歌 $x文学研究 $y中国 $j文集600#0$a 苏轼 $f(1036-1101)6060#$a 古典诗歌……生成 609索引字段:60900$Ap$2cct$a 苏轼 $f(1036-1101)60901$As$2cct$a 古典诗歌60902$As$2cct$a文学研究60903$Ag$2cct$a中国60904$As$2cct$a文集60910$Ap$2cct$a 苏轼 $f(1036-1101)60920$As$2cct$a 古典诗歌……

Page 37: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路 ( 1 )根据书目库主题标引词串自动生成单个主题词索引

规范库 11 库

书目库 O1 库

抽取单独主题词

匹配主题词目标形式 规范控制

更新模式调整系统

确定索引各子字段

内容 确定该词是否是 11

库中正式主题词

添加到$a 对应位置

确认无误

确认不是或有误

人工修改至无误后再添加

Page 38: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路 对已有规范数据的批修改、批处理工作。

1 2 3

受控字段非控主题词及主题词串批转换:分人工修改和编程批

修改两部分。

主题规范控制模式调整引起的数据处理工

作:将 NLC01库主题词字段中出现的重复或轮排问题的主题词进行删除操作。

主题规范库更新替换工作:完成 NLC11库的数据替换。

Page 39: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路

( 2 )随着规范库主题词修改而自动修改索引并更新书目库主题标引词串。

随着规范库主题词记录的修改,通过和主题词标目形式( 2XX字段,4XX字段或 COR字段)匹配,修改主题词索引 609字段,反馈到书目库主题标引词串中特定位置相同的主题词及其“前字段”或“前子字段”的同步更新。(备注:“前字段”或“前子字段”指该主题词前面的 1个字段号或子字段代码)

对主题词的更新包括对主题词的词形、字段类型等修改,将主题词改为代项词,单纯新增或删除主题词等操作。

Page 40: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

2、规范控制更新模式调整项目

解决思路 以修改主题词为例,具体处理步骤如下:

1 2 3 4

通过和主题词标目形式( 2XX字段,4XX字段或 COR字段)匹配,反馈到书目库 609索引字段处。对要删除主题词先做停用处理,即在记录头标区将记录状态(第5位,从 0开始)改为 d (删除的记录),并将该词改为其他主题词的代项词。

系统针对修改过的主题词,首先根据头标区记录状态确定是否是删除停用的主题词,如果不是,则只需修改 609索引字段,重新确定主题词类型、词形即可(见“表 1” 中 2 、 4列对应生成类型代码)。如果是删除停用的主题词,系统自动删除原609字段内容,再在规范库 4XX字段找到该词,重新生成对应2XX字段主题词的609 索引,主题词类型按新主题词确定。

根据 609索引字段的修改,一对一更新主题标引词串中的主题词及其字段、子字段类型,见表1 (根据“表 1”中1、 4 对应列判断词串中的词及其字段是否类型匹配)

书目主题标引词串更新后,做停用的主题词就可以删除。

Page 41: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

民国时期文献是记录 1911年至 1949年期间各种知识和信息的载体(包括图书、期刊、报纸、手稿等,以及非正式出版的日记、传单乃至商业契约和票据等)。民国时期文献数量众多、内容丰富,具有较高的历史价值、学术价值和重要的现实意义。 2011年,国家图书馆联合全国各省公共图书馆,策划了“民国时期文献保护计划”项目。 2012年作为项目启动年,在各地图书馆积极参与下,在专家全力配合下,文献普查、海外文献征集、整理出版等方面都取得了阶段性成果。

项目背景及目标

Page 42: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

目前,民国时期文献数据很多来自地方馆,书目、馆藏数据格式不统一,而且很多信息已经遗失或不全;这部分数据必须按照统一格式进行处理,才能满足展示平台特定的数据要求。目前联合编目系统对民国数据处理功能有限,诸如批量上传书目馆藏数据的功能、联合编目系统中民国数据到展示平台的更新功能、联合编目系统对民国数据的统计功能等,已无法满足民国数据处理的要求。民国时期文献数据处理项目的建设,就是要解决这些问题。

项目背景及目标

Page 43: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目建设中,首先解决民国文献标识问题。文献数据在编目中没有特殊标识,项目中选定 399字段作为民国书目和馆藏的筛选条件。下载书目中 399字段的 a 子字段为“民国时期文献”。

项目功能介绍 民国时期文献展示平台

联合编目系统

数据处理更新系统

国家图书馆 地方成员馆

离线装载

上传

装载

上传

(查重、统计)

系统流程图

Page 44: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

系统功能模块:

民国时期文献保护计划数据处理更新系统

统计报表

上传、查重、装载

离线装载

装库前预处理

装载书目、馆藏

书目统计

馆藏统计

预查重

装载

提交数据

全匹配查重

Page 45: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

民国时期文献保护计划数据处理更新

系统

上传、查重、装载模块

离线装载模块

统计报表模块

Page 46: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 1 )上传、查重、装载模块 —— 提交数据

Page 47: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 1 )上传、查重、装载模块 —— 预查重

Page 48: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 1 )上传、查重、装载模块 —— 全匹配查重

Page 49: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 1 )上传、查重、装载模块 —— 装载

Page 50: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 2 )离线装载模块 —— 装库前预处理

Page 51: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 2 )离线装载模块 —— 装载书目、馆藏

新书目记录装库

Page 52: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 2 )离线装载模块 —— 装载书目、馆藏

新增馆藏装库

Page 53: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 3 )统计报表模块 —— 书目统计

Page 54: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

( 3 )统计报表模块 —— 馆藏统计

Page 55: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

3 、民国时期文献数据处理项目

项目功能介绍

系统查重采用多线程机制,提高了数据查重的速度与精准度;原先专业化、繁冗低效费时手工民国数据处理操作,现在任何人鼠标点几下,几分钟就能查看操作结果,而且无论是数据处理精度、准确度、自动化程度都是以前不可比拟的。

除此之外,系统本身具有相当高的通用性,查重功能的处理是通过参数配置表的方式来实现的。所以,以后无论是民国时期数据、缩微数据还是其他数据,只要通过调整参数表,就可以实现对联合编目系统数据处理功能的延伸扩展,具有很高的重用性。提高了工作效率,也提升了服务质量。

Page 56: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

4、 OPAC与国家图书馆统一用户认证系统的单点登录整合

在文津搜索系统点击馆藏目录中“国家图书馆”

sso1.nlc.gov.cn/nlclogin/ssologin-url-find?

调用 X-SERVER的ssonlc_auth_item接

OPAC 详细页(已登录)

OPAC 详细页(未登录状

态)

判断当前是否已登录统一用户系统

目的:实现统一用户认证系统与 Aleph系统的双方向登录认证功能。

(1)、统一用户系统到 OPAC

从文津搜索系统访问国图馆藏书目数据的例子:http://sso1.nlc.gov.cn:9080/

nlclogin/ssologin-url-find.jsp?

url=http%3A%2F

%2Fopac.nlc.gov.cn%2FF%3Ffunc

%3Ditem-global%26doc_library

%3DNLC01%26doc_number

%3D001645787

Page 57: 国家图书馆 信息基础设施建设与服务

sso1.nlc.gov.cn/nlclogin

三、近两年以 A L E P H 系统为基础的创 新应用

4、 OPAC与国家图书馆统一用户认证系统的单点登录整合

在文津搜索系统点击馆藏目录中“国家图书馆”

调用 X-SERVER的ssonlc_auth_item接

OPAC 详细页(已登录)

OPAC 详细页(未登录状

态)

判断当前是否已登录统一用户系统

Page 58: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

4、 OPAC与国家图书馆统一用户认证系统的单点登录整合

在文津搜索系统点击馆藏目录中“国家图书馆”

sso1.nlc.gov.cn/nlclogin/ssologin-url-find?

调用 X-SERVER的ssonlc_auth_item接

OPAC 详细页(已登录)

OPAC 详细页(未登录状

态)

判断当前是否已登录统一用户系统

OPAC 详细页(已登录)

Page 59: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

4、 OPAC与国家图书馆统一用户认证系统的单点登录整合

读者检索 OPAC书目信息,访问对象数据的链接地址

sso1.nlc.gov.cn/nlclogin/ssologin-opac?

后台调用统一用户认证系统接口完成自动登录

跳转到电子图书的详细页

跳转到统一用户认证系统登录

否判断 opac 登录状

(2)、 OPAC到统一用户 目的:登录 OPAC后,访问电子资源对象数据,无需二次登录。

nlclogin系统通过调用 get_bor_idp 这个 X-service接口对当前 opac 登录状态进行判断。如果已登录,则获取已登录用户的帐号、会话 id等信息。

Page 60: 国家图书馆 信息基础设施建设与服务

三、近两年以 A L E P H 系统为基础的创 新应用

4、 OPAC与国家图书馆统一用户认证系统的单点登录整合

读者检索 OPAC书目信息,访问对象数据的链接地址

sso1.nlc.gov.cn/nlclogin

后台调用统一用户认证系统接口完成自动登录

跳转到电子图书的详细页

跳转到统一用户认证系统登录

否判断 opac 登录状

Page 61: 国家图书馆 信息基础设施建设与服务

谢谢!