家谱管理系统的工作内容是通过对现有的家谱信息进行有效的收集、分析,在现有的技术基础上,描述家谱知识,建立宗族人物关系网络,并采用可视化的方式展示家族动态变化的过程,以方便人们了解其家族的繁衍过程以及姓氏来源,开发家谱的文化价值,发挥家谱凝聚社会群体、增强民族凝聚力的作用。建立家谱知识管理模型有利于保存、传播、研究、开发中华特色文化,推动我国地方志家谱数字资源建设。
1 家谱
家谱主要包括姓氏源流、堂号、世系表、家训、家传、艺文著述、家谱图像等内容。姓氏源流是指同一族得姓的来源与变迁;堂号是一个姓氏的特殊标识,它能显示姓氏发源的地缘关系;世系表则用来说明同一家族成员的相关关系;家训是为了维持必要的法制制度而拟定的约束族人的行为规范;家传是世系表中族人的历史功绩;艺文著述是指家族中名人的著作;家谱图像是族人的照片·图片仁2:12。
2 本体分子
本体分子是指在本体基本元素(本体实例、三元组)基础上,用唯一标识符标注的、根据语义或者语用划分的、无缺失的、最小冗余的本体知识单元}3}z。本体分子是本体基本元素和本体库之间的一个平衡点,它使相对粗粒度知识管理成为可能。
(1)本体分子并未脱离现有主流的RDF/()WI本体框架,它由本体实例、三元组等本体元素组成,并在RDF/OWI基础之上进行粗粒度扩展描述。将本体分子与传统细粒度本体描述相结合,能够提供多粒度多层次的知识管理机制。
(2)本体分子划分的依据是语义或者语用。
(3)本体分子知识划分的目标是既保证语义无缺失,又使得知识冗余最小化。
钧为本体分子建立唯一标识符号,目的是为了让本体分子在本体推理和本体整合等本体处理中有操作的句柄或标识。
本体分子的形式描述
本体分子m=func(id,g),idE U,gE U。其中id为本体分子m的唯一标识符,g表示本体分子的范围,funs是按照语义或者语用运算的映射函数。
其中,U定义为本体库中所有的URI本体结点(URI references)的集合,B定义为本体库中所有匿名本体结点(RDF blank nodes)的集合,I定义为本体库中所有RI}F文本(RDF literals)的集合。
三者两两不相交。
定义V为U}B}I的并集:V=U日Y日I。
定义三元组集合T为U}V的笛卡儿乘积:T=VXUXV。
定义RI}F图集合G为T的幂集合。
根据本体分子的定义:getId (m) = id,get-Graph(m) -g分别表示本体分子标识符与本体分子范围的映射函数。
定义I为本体分子集合M的解释,任何一个本体分子mEM,getId(m)都应该在解释I的词表中,而且满足I(getId(m))=mo
本体分子与本体演化的关系:
本体分子是多粒度知识组织的一种模式,而本体演化是本体分子知识动态组织结果的表现形式。本体演化追踪在本体分子这个粒度上知识的变化过程和变化结果,根据本体分子的变化控制本体演化过程。
本体分子具有具名图(Named Graph)的结构,相当于一个有名字的RI}F Graph,其中包括一系列三元组。若具名图A有三元组a}b}c}d;具名图B有三元组c}d}e}f;那么e,d就是静态信息,就是“核子”,c}d}e}f则可看作动态信息,也就是“离子”。据此,具名图可以很好地描述本体分子。本体分子是基于Java的一个扩展,提供了可操作具名图的API}3}z o