随着互联网技术的普及和发展,用户对于图书馆资源的使用需求也发生了巨大变化,图书馆方面也需要具有高度的综合性、网络性以及高效性等以满足用户的信息需求。从用户角度出发,不难发现用户所需的资源信息很难集中在一个资源平台,因此需要跨越多个平台才能找齐所需信息,这造成了网络资源的过度浪费。现阶段,图书馆尚未形成统一的框架体系,很多应用软件虽然能够正常运行,但是其交互效果较差,并不能真正地实现跨数据库和跨平台运行,也间接制约了图书馆的整体发展。构建图书馆资源集成化和开放化管理模式是解决上述问题的有效措施。笔者首先针对构建图书馆资源集成化和开放化管理模式所涉及的关键技术进行分析和讨论,并在国内外相关研究的基础上进行总结,最后构建图书馆资源平台的相关措施,从而更好地完善图书馆的信息化和数字化,使图书馆的信息服务更具人性化和针对性。
1 网络环境下图书馆信息服务的发展趋势
1.1 资源共享是最终目标
1996年,第六十二届国际图联大会在北京召开,其大会的主旨就是“数字图书馆—人类信息资源共享的美梦成真”,标志着数字图书馆正式受到国际的关注。当时大会还专门提到“实现人类信息资源共享”是全世界图书信息类工作人员工作的主要目标,而利用数字图书馆技术就可以实现这一宏伟目标。从中不难看出,数字信息是需要共享才能体现出最大价值的。数字图书馆作为社会科研建设的重要工程不可能孤立存在,需要与其它图书馆建立相互合作关系,为广大用户提供良好的信息资源服务。图书馆资源集成化和开放化管理模式正是在数字图书馆的基础上构建的,以此保证了该平台的交互性和可靠性。
1.2 资源集成和开放管理是重要手段
美国权威国家图书馆专门针对数字图书馆提出了21世纪数字图书馆建设面临的十大挑战,其中大部分挑战并不是技术层面的挑战而是思想创新层面上的挑战,并以此促进图书馆方面的建设。具体来说,数字图书馆面对的挑战主要分为操作方面的挑战、技术方面的挑战、信息资源建设方面的挑战以及信息资源维护方面挑战等,其具体包括:(l)需要改进信息资源的数字化技术;(2)设计并完善搜索技术;(3)积极根据用户体验意见改进信息处理工具;(4)制定相关的规定和标准,加大数字图书馆的集成程度;(5)积极利用信息资源传播的法律法规约束信息处理行为;(6)加强数字资源与纸质资源的交互性和集成性。(7)探索异构信息资源的融合;(8)为用户指定专门的个性化信息服务;(9)设计更为灵活的信息转化服务,提高用户的使用体验效果;(10)构建有效的图书馆可持续发展模式。数字图书馆所面临的大部分的挑战是可以通过图书馆资源集成化和开放化管理模式来帮助解除的,从而提高图书馆服务效果。
2 图书馆数字资源集成技术
2.1 多数据源集成新技术
现阶段,由于计算机信息系统的异构性,各个子系统之间比较独立,因此信息之间普遍存在着孤立的情况,信息的交互效果较差。解决信息孤立问题的有效方法就是加强信息的集成程度,也就是积极完善和利用信息集成技术来建立子系统之间的信息交流。信息集成技术的主要目的就是将异构的、孤立的数字信息之间建立联系。较为有效的集成技术就是构建基于多数据库的集成体系,其系统规定了统一的数据存储类型和操作方式,允许应用程序可以同时访问多个数据库。此技术可以将系统内的数据进行统一的类型转换并集成在专属数据库中,还能为用户搭建专有的数据接口。
2.2 图书馆信息互通技术
需要注意的是,若要真正地在网络平台之间进行数字信息互通需要解决以下几个方面的问题:首先保留和完善现有的系统设备,而且针对这些设备要进行技术方面的更新和扩展。比如在原有设备上安装专门的开放式的网络设备,从而保证信息互动的效果;其次对于新建的通信系统要实行有效管理。其中较为有效的建设方式还是将现有的基于行业标准的TCP/IP协议与完整的OSI协议进行有机结合,从而更好地支持通信系统;最后构建的通信系统必须要兼容TCP/IP协议和OSI协议,并在此基础上加人高新技术(如:信息安全技术、多媒体高速传输技术以及无线网络技术等)。图书馆通信技术不仅需要同时满足TCP/IP和OSI通信协议,而且还需要动态地适应新的通信协议。
2.3 面向因特网的数据挖掘技术
数据挖掘技术即在大量无序的且有很多噪声的数据中挖掘出有价值的数字信息的技术。数据挖掘技术从人工智能领域发展而来,可以在给定的数据范围内,利用人工智能学习的方式从中获取所需的信息资源,其信息资源可以应用在智能学习和决策、智能控制以及信息资源的搜索和查询等方面。具体来说,互联网的每一个站点都可以被看作是独立的数据集合,而且每个数据集合的计算和存储方式各不相同,此方式和传统的关系数据库的处理方式有很大的不同。可以说整个互联网就是一种异构的数据集合体,数据类型繁多,相互的关联性较为复杂,因此数据具有非结构化的特点。根据上述互联网的数据特点,研究设计旨在将数据挖掘技术应用到图书馆的平台建设中,并针对其数据进行预处理。
3 图书馆资源集成和开放管理平台设计
3.1 平台的物理组织架构设计
根据构建的图书馆资源集成化和开放化平台的设计需求,该平台可以分为主馆系统和分馆系统两部分,并且兼容多个分馆。当整个系统运行正常时,如果用户正在借书或还书,平台能够将操作信息实时地保存在主馆的数据库中;如果图书馆的管理人员要统计资源的数量或者查询资源的存储位置,平台能够时刻保证操作的可靠性和准确性。因此,如果主馆系统发生故障,即分馆无法联系到主馆的数据库时,平台就会为其提供缓存服务,将操作信息暂存到其它分馆的数据库中,直至主馆的数据库恢复后再传人其中。图书馆资源集成和开放管理平台的物理设备包括主馆资源服务器、各分馆资源服务器、路由器、交换机以及专门的网络连接设备等日。上述这些设备共同组成了图书馆服务平台所需的硬件设备,其具体的构建方式如下图1所示。
3.2 平台的逻辑组织结构设计
平台的逻辑结构如图2所示,图书馆的数据开放平台系统功能主要由大数据存储管理模块、大数据安全保护模块、云计算服务模块、数据检索模块、系统服务模块以及数据共享模块组成,可以为用户提供信息数据类型的转换服务、大数据的收集和存储服务、资源条目的推荐服务等,并在提供服务的同时保证信息资源能够准确、快速、可靠地传送至用户。
具体来说,图书馆数据开放平台主要包括开放数据安全管理和防御平台、数据类型转换和标准统一平台、开放数据服务平台、数据开放核心服务平台、数据开放管理与应用技术平台以及图书馆数据中心平台等。开放数据安全管理和防御平台的主要职责就是保障系统平台的数据安全,并为其它平台提供安全可靠的应用环境;数据类型转换和标准统一平台提供了数据的类型转换服务,以此加强对数据的识别和控制;开放数据服务平台是整个系统的最高应用层次,为系统和用户提供最高级别的应用接口,可以利用下层提供的服务实现与用户的信息交互及智慧对话,还能针对系统所需的服务进行功能拓展;数据开放核心服务平台会根据用户具体的信息需求提供有针对性的数据开放服务;数据开放管理与应用技术平台是一个关键的连接平台,可以利用底层平台提供数据的检索、存储以及智能应用等用户服务;图书馆数据中心平台是整个系统数据库的综合,可以将各种类型的数据进行描述、定义以及存储操作。
3.3 数据库访问模块设计
该平台的数据库访问模块设计可分为核心数据库访问模块和缓存数据库访问模块。其中核心数据库位于主馆系统中,是整个系统的主要存储设备;而缓存数据库位于各个分馆中,主要为用户提供暂时性的存储信息服务。在系统正常运行时,用户和分馆系统可以随时访问核心数据库;反之,当网络出现连接故障,分馆系统无法连接到主馆系统数据库时,分馆系统的缓存数据库会临时存储信息数据,待到网络正常后再将用户的操作信息传送到主馆的核心数据库中。
在具体实施上述临时存储操作时,为了更好地保障核心数据库正常运转,该平台会对分馆系统访问的次数设置为全局变量masterDB,且masterDB的取值默认为True(即允许访问)。当分馆系统准备访问主馆系统的数据库时,如果连接正常,则将masterDB取值为True,也就是可以访问主馆系统数据库;如果连接出现故障,则将masterDB取值为False,即禁止访问主馆系统数据库,并开启缓存数据库为其提供服务;如果有其它分馆系统准备访问主馆数据库,masterDB值已经为False时,系统会直接将用户分配给缓存数据库。
4 平台的服务模式
4.1 实现图书馆数据统一、全方位的开放
构建的图书馆资源集成化和开放化管理模式应该以公共信息资源、应用程序资源、服务数据集合以及开发的程序代码为主要内容,以实现数据统一和全方位的开放化、提供个性化信息需求为目的。当然在数据开放化的基础上还应该针对海量数据进行二次挖掘和整合,积极探究信息之间的关联性。图书馆资源集成平台应该根据用户的具体需求、个人查阅习惯以及系统收集的用户数据提供更具特色的信息服务。图书馆管理人员还应根据平台的负荷情况和信息需求的趋势来分析和定位未来用户的数量和需求方向,合理分配和调控图书馆平台资源,并在提供优质信息服务的同时,保证其平台可持续发展。在数据进行统一化和开放化的过程中,图书馆平台还应该分析和过滤信息数据,更直观地展现出数据之间的联系,并科学地判断和分析,以提高平台的核心竞争力。总而言之,图书馆平台应该在重视数据的统一性和开放性基础上,根据自身发展特点以及用户的具体需求来动态地调整、优化和完善信息资源的管理模式。
4.2 数据开放过程应加强读者隐私保护
随着云计算技术、物联网技术以及相关通信技术的迅猛发展,用户的信息需求服务同样也具有了高速性、可移动性、高时效性以及低成本等特点。如手机、平板等移动终端在为用户提供方便又快捷的信息服务的同时,提供商也会实时地收集到用户的阅读习惯、地理位置及相关信息。与此同时,图书馆平台服务监控以及用户信息收集系统都会收集用户的个性化信息,这也已经成为图书馆平台数据库中不可或缺的数据来源。不难看出,大数据时代下用户数据泄露情况比较严重,医院图书馆更应该提高用户隐私数据的安全性,确保用户(特别是需要保护隐私的病人用户)在使用平台服务中没有后顾之忧。首先,图书馆必须保证病人用户对其自身数据的收集、整理和存储具有知情权和决定权;其次,在数据收集过程中,图书馆应采取匿名的方式,从而更好地保护病人的隐私信息,尽可能地消除或者隐藏病人用户的特征信息;然后,图书馆应该分层次、分级别地保护用户数据,将用户信息分为原始数据层、过滤数据层以及统计数据层进行存储;最后,图书馆应该根据用户不同的隐私保护要求进行数据的收集、整理以及存储等操作。
4.3 逐步实现数据资源的透明开放
(1)图书馆平台应该广泛收集用户的使用体验以及第三方机构的建议,以数据的透明化和公开化为原则,合理选择数据开放化的内容及使用策略.
(2)数据的开放化需要始终坚持数据透明的准则,降低甚至消除用户使用信息服务的权限。涉及社会安定和用户隐私的数据时,图书馆应该实时监控相关敏感数据的搜索、查阅以及下载情况,必要时执行数据隐藏处理。
(3)数据资源的集成化和开放化管理模式应该坚持数据的标准化和多样化原则,针对各种类型的数据(比如XML类型数据、RDF类型数据等)实行统一的类型转换并进行存储,从而减少不必要的资源浪费;另外,图书馆资源集成化和开放化管理模式还应该坚持用户平等、数据开放、数据透明以及功能可扩展等,积极探索和其它管理平台或者数据库的兼容情况,为用户提供一站式信息服务,从而减少图书馆资源平台的使用和管理成本,有效地保护数据的安全。
5 结语
笔者以如何构建和加强图书馆资源的集成化和开放化为主要内容,着重研究信息检索技术和图书馆服务职能之间的关联性,设计将信息检索技术的优势应用到图书馆信息管理模式中,深人探讨了多种通信和检索技术的优劣,以此探究出更符合网络环境下图书馆用户需求的管理模式,有一定的研究价值。